DP-203J 試験問題 71

Azure Event Hubからのストリーミングデータを処理し、そのデータをAzure Data LakeStorageに出力するソリューションを設計する必要があります。このソリューションでは、アナリストがストリーミングデータをインタラクティブにクエリできるようにする必要があります。
何を使うべきですか?
  • DP-203J 試験問題 72

    Azure Data Lake StorageGen2の何千ものCSVファイルにデータが保存されています。各ファイルにはヘッダー行があり、その後に適切にフォーマットされたキャリッジリターン(/ r)とラインフィード(/ n)が続きます。
    PolyBaseを使用して、Azure SynapseAnalyticsのエンタープライズデータウェアハウスにファイルを毎日バッチロードするパターンを実装しています。
    ファイルをデータウェアハウスにインポートするときは、ヘッダー行をスキップする必要があります。読み込みパターンを作成する前に、Azure SynapseAnalyticsで必要なデータベースオブジェクトを準備する必要があります。
    順番に実行する必要がある3つのアクションはどれですか?回答するには、適切なアクションをアクションのリストから回答領域に移動し、正しい順序に並べます。
    注:正しい選択はそれぞれ1ポイントの価値があります

    DP-203J 試験問題 73

    Azure Data Factory を使用して、Azure Synapse Analytics サーバーレス SQL プールによってクエリされるデータを準備します。
    ファイルは最初、10 個の小さな JSON ファイルとして Azure Data Lake Storage Gen2 アカウントに取り込まれます。各ファイルには、会社の子会社からの同じデータ属性とデータが含まれています。
    ファイルを別のフォルダーに移動し、次の要件を満たすようにデータを変換する必要があります。
    可能な限り最速のクエリ時間を提供します。
    基になるファイルからスキーマを自動的に推測します。
    Data Factory のコピー アクティビティをどのように構成する必要がありますか?答えるには、答えで適切なオプションを選択します。
    注: 正しい選択ごとに 1 ポイントの価値があります。

    DP-203J 試験問題 74

    Pipeline1 という名前の Azure Data Factory パイプラインがあり、これには Copy1 という名前のコピー アクティビティが含まれています。Copy1 には次の構成があります。
    * Copy1 のソースは、セルフホステッド統合ランタイムを介して接続されたリンクされたサービスを使用してアクセスされる、オンプレミスの Microsoft SQL Server インスタンス内のテーブルです。
    * Copy1 のシンクは、Azure 統合ランタイムを介して接続されたリンクされたサービスを使用してアクセスされる Azure SQL データベース内のテーブルを使用します。
    Copy1 で使用できるコンピューティング リソースの量を最大化する必要があります。ソリューションでは、管理労力を最小限に抑える必要があります。
    あなたは何をするべきか?
  • DP-203J 試験問題 75

    Pool1 という名前の Azure Synapse Analytics 専用 SQL プールがあります。Pool1 には、Tablet という名前のファクト テーブルが含まれています。Table1 には売上データが含まれています。Table1 には毎月 6,500 万行のデータが追加されます。
    毎月末に、36 か月より古いデータを削除する必要があります。ソリューションでは、データの削除にかかる時間を最小限に抑える必要があります。
    Table1 をどのように分割し、古いデータをどのように削除する必要がありますか? 回答するには、回答エリアで適切なオプションを選択します。
    注: それぞれの正しい選択は 1 ポイントの価値があります。