Azure データ基盤(DWH / Data Lake)構築手順

一般的な構成

業務システム
(PAS、Oracle、SAP、CSV、API等)
        ↓
Azure Data Factory
        ↓
Azure Data Lake Storage Gen2
        ↓
Databricks(PySpark)
        ↓
Azure Synapse Analytics
        ↓
Power BI

① 要件定義

  • データソースは何か
    • Oracle
    • SQL Server
    • SAP
    • API
    • CSV
  • データ量
    • 日次100万件
    • 月間1TB
  • 更新頻度
    • リアルタイム
    • 日次バッチ
  • 保持期間
    • 1年
    • 7年

成果物

  • 要件定義書
  • データ連携一覧