DP-203 試験問題 86

大きなファクトテーブルを含むAzureSynapseAnalytics専用のSQLプールがあります。テーブルには次のものが含まれます
50列と50億行で、ヒープです。
テーブルに対するほとんどのクエリは、約1億行の値を集約し、2つの列のみを返します。
ファクトテーブルに対するクエリが非常に遅いことがわかります。
クエリ時間を最速にするために、どのタイプのインデックスを追加する必要がありますか?
  • DP-203 試験問題 87

    小売環境のセンサーからの着信イベントを処理するAzureStreamAnalyticsジョブを設計しています。
    イベントを処理して、5分間隔で計算された過去15分間の買い物客数の移動平均を生成する必要があります。
    どのタイプのウィンドウを使用する必要がありますか?
  • DP-203 試験問題 88

    注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、述べられた目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
    このシナリオで質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
    100GBのファイルを含むAzureStorageアカウントがあります。ファイルにはテキストと数値が含まれています。行の75%には、平均長が1.1MBの記述データが含まれています。
    ストレージアカウントからAzureSynapseAnalyticsのエンタープライズデータウェアハウスにデータをコピーすることを計画しています。
    データがすばやくコピーされるように、ファイルを準備する必要があります。
    解決策:ファイルを圧縮された区切りテキストファイルに変換します。
    これは目標を達成していますか?
  • DP-203 試験問題 89

    Azure Data LakeStorageGen2コンテナがあります。
    データはコンテナに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることはできますが、ファイルを変更することはできません。
    次の要件を満たすデータアーカイブソリューションを設計する必要があります。
    新しいデータは頻繁にアクセスされるため、できるだけ早く利用できるようにする必要があります。
    5年以上前のデータへのアクセスはまれですが、要求された場合は1秒以内に利用可能である必要があります。
    7年以上前のデータにはアクセスしません。7年後、データは可能な限り低いコストで永続化する必要があります。
    必要な可用性を維持しながら、コストを最小限に抑える必要があります。
    データをどのように管理する必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
    注:正しい選択はそれぞれ1ポイントの価値があります

    DP-203 試験問題 90

    CSVファイルからデータを取り込み、指定されたタイプのデータに列をキャストし、AzureSynapseAnalytic専用SQLプールのテーブルにデータを挿入するAzureDataFactoryデータフローを作成しています。CSVファイルには、username、comment、dateという名前の3つの列が含まれています。
    データフローには、すでに次のものが含まれています。
    *ソース変換。
    *適切なタイプのデータを設定するための派生列変換。
    *データをプールに配置するためのシンク変換。
    データフローが次の要件を満たしていることを確認する必要があります。
    *すべての有効な行を宛先テーブルに書き込む必要があります。
    *コメント列の切り捨てエラーは事前に回避する必要があります。
    *挿入時に切り捨てエラーを引き起こすコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
    実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。
    注:正しい選択はそれぞれ1ポイントの価値があります。