DP-203 試験問題 156

Azure Databricks 上の Delta Lake のテーブルを使用する 2 つのソリューションを設計しています。
以下の実行にかかる時間を最小限に抑える必要があります。
*パーティション化されていないテーブルに対するクエリ
* パーティション化されていない列での結合
ソリューションに含めるべき 2 つのオプションはどれですか? それぞれの正解は、解決策の一部を示しています。
(正解を選択し、Microsoft Azure 上のデータ エンジニアリングに基づいて答えを裏付ける説明と参照を提供します)
  • DP-203 試験問題 157

    Azure Synapse Analytics でエンタープライズ データ ウェアハウスを管理します。
    ユーザーは、よく使用されるクエリを実行するとパフォーマンスが遅いと報告します。ユーザーは、使用頻度が低いクエリのパフォーマンスの変化を報告しません。
    パフォーマンスの問題の原因を特定するには、リソースの使用率を監視する必要があります。
    どの指標を監視する必要がありますか?
  • DP-203 試験問題 158

    Azure databricks を使用して Purchases という名前のデータセットを開発する予定です。 Purchases には次の列が含まれます。
    * 製品番号
    * 商品価格
    * line合計
    * 量
    * ストアID
    * 分
    * 月
    * 時間
    * 年
    * 日
    StoreID ごとに異なる時間ごとの増分ロード パイプラインをサポートするには、データを保存する必要があります。ソリューションではストレージ コストを最小限に抑える必要があります。どのようにライドを完了する必要がありますか? 回答するには、回答領域で適切なオプションを選択します。
    注: 正しく選択するたびに 1 ポイントの価値があります。

    DP-203 試験問題 159

    ADFdev と ADFprod という名前の 2 つの Azure Data Factory インスタンスがあります。ADFdev は Azure DevOps Git リポジトリに接続します。
    変更を Git リポジトリのメイン ブランチから ADFdev に公開します。
    アーティファクトをADFdevからADFprodにデプロイする必要があります。
    まず何をすべきでしょうか?
  • DP-203 試験問題 160

    ADF1 という名前の Azure Data Factory インスタンスと、WS1 および WS2 という名前の 2 つの Azure Synapse Analytics ワークスペースがあります。
    ADF1 には次のパイプラインが含まれています。
    * P1: コピー アクティビティを使用して、WS1 の専用 SQL プール内のパーティション分割されていないテーブルから Azure Data Lake Storage Gen2 アカウントにデータをコピーします。
    * P2: コピー アクティビティを使用して、Azure Data Lake Storage Gen2 アカウント内のテキスト区切りファイルから WS2 の専用 SQL プール内のパーティション分割されていないテーブルにデータをコピーします。並列処理とパフォーマンスを最大化するには、P1 と P2 を構成する必要があります。
    各パイプラインの場合、コピー アクティビティに対してどのデータセット設定を構成する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
    注: 正しく選択するたびに 1 ポイントの価値があります。