DP-203 試験問題 61

Azure Active Directory (Azure AD) 統合を使用して Azure Data Lake Storage Gen2 に自動的に接続する Azure Databricks クラスターを実装する必要があります。
新しいクラスターをどのように構成すればよいですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

DP-203 試験問題 62

注: この質問は、同じシナリオを提示する一連の質問の一部です。一連の質問にはそれぞれ、定められた目標を満たす独自の解決策が含まれています。質問セットによっては、正しい解決策が複数ある場合もあれば、正しい解決策がない場合もあります。
このセクションで質問に答えた後は、そのセクションに戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
階層構造を持つ Azure Databricks ワークスペースを作成する予定です。ワークスペースには、次の 3 つのワークロードが含まれます。
Python と SQL を使用するデータ エンジニア向けのワークロード。
Python、Scala、SOL を使用するノートブックを実行するジョブのワークロード。
データ サイエンティストが Scala と R でアドホック分析を実行するために使用するワークロード。
会社のエンタープライズ アーキテクチャ チームは、Databricks 環境に対して次の標準を特定します。
データ エンジニアはクラスターを共有する必要があります。
ジョブ クラスターは、データ サイエンティストとデータ エンジニアがクラスターにデプロイするためのパッケージ化されたノートブックを提供するリクエスト プロセスを使用して管理されます。
すべてのデータ サイエンティストには、120 分間操作がないと自動的に終了する独自のクラスターを割り当てる必要があります。現在、データ サイエンティストは 3 人います。
ワークロード用の Databricks クラスターを作成する必要があります。
解決策: 各データ サイエンティスト用に標準クラスター、データ エンジニア用に高同時実行クラスター、ジョブ用に高同時実行クラスターを作成します。
これは目標を満たしていますか?
  • DP-203 試験問題 63

    Azure Synapse Analytics 専用の SQL プールがあります。
    PDW_SHOWSPACEUSED(dbo,FactInternetSales'); を実行すると、次の表に示す結果が得られます。

    dbo,FactInternetSales テーブルを正確に説明している記述はどれですか?
  • DP-203 試験問題 64

    フォルダーを含む Azure Blob ストレージ アカウントがあります。フォルダーには 120,000 個のファイルが含まれています。各ファイルには 62 列が含まれています。
    毎日、1,500 個の新しいファイルがフォルダーに追加されます。
    各新しいファイルから 5 つのデータ列を Azure Synapse Analytics ワークスペースに段階的に読み込む予定です。
    増分ロードの実行にかかる時間を最小限に抑える必要があります。
    ファイルの保存とフォー​​マットには何を使用すればよいですか?

    DP-203 試験問題 65

    Azure Synapse Analytics サーバーレス SQL プールにデータベースを構築しています。
    Azure Data Lake Storege Gen2 コンテナー内の Parquet ファイルにデータが保存されています。
    レコードは次のサンプルに示すように構造化されます。
    {
    "id": 123,
    "住所_家番号": "19c",
    "address_line": "思い出の小道",
    "applicant1_name": "ジェーン",
    "applicant2_name": "開発者"
    }
    記録には最大 2 人の応募者が含まれます。
    住所フィールドのみを含むテーブルを構築する必要があります。
    Transact-SQL ステートメントをどのように完了する必要がありますか? 回答するには、回答領域で適切なオプションを選択します。
    注意: 正しい選択ごとに 1 ポイントが付与されます。