DP-203 試験問題 61
Azure Active Directory (Azure AD) 統合を使用して Azure Data Lake Storage Gen2 に自動的に接続する Azure Databricks クラスターを実装する必要があります。
新しいクラスターをどのように構成すればよいですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

新しいクラスターをどのように構成すればよいですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。

DP-203 試験問題 62
注: この質問は、同じシナリオを提示する一連の質問の一部です。一連の質問にはそれぞれ、定められた目標を満たす独自の解決策が含まれています。質問セットによっては、正しい解決策が複数ある場合もあれば、正しい解決策がない場合もあります。
このセクションで質問に答えた後は、そのセクションに戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
階層構造を持つ Azure Databricks ワークスペースを作成する予定です。ワークスペースには、次の 3 つのワークロードが含まれます。
Python と SQL を使用するデータ エンジニア向けのワークロード。
Python、Scala、SOL を使用するノートブックを実行するジョブのワークロード。
データ サイエンティストが Scala と R でアドホック分析を実行するために使用するワークロード。
会社のエンタープライズ アーキテクチャ チームは、Databricks 環境に対して次の標準を特定します。
データ エンジニアはクラスターを共有する必要があります。
ジョブ クラスターは、データ サイエンティストとデータ エンジニアがクラスターにデプロイするためのパッケージ化されたノートブックを提供するリクエスト プロセスを使用して管理されます。
すべてのデータ サイエンティストには、120 分間操作がないと自動的に終了する独自のクラスターを割り当てる必要があります。現在、データ サイエンティストは 3 人います。
ワークロード用の Databricks クラスターを作成する必要があります。
解決策: 各データ サイエンティスト用に標準クラスター、データ エンジニア用に高同時実行クラスター、ジョブ用に高同時実行クラスターを作成します。
これは目標を満たしていますか?
このセクションで質問に答えた後は、そのセクションに戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
階層構造を持つ Azure Databricks ワークスペースを作成する予定です。ワークスペースには、次の 3 つのワークロードが含まれます。
Python と SQL を使用するデータ エンジニア向けのワークロード。
Python、Scala、SOL を使用するノートブックを実行するジョブのワークロード。
データ サイエンティストが Scala と R でアドホック分析を実行するために使用するワークロード。
会社のエンタープライズ アーキテクチャ チームは、Databricks 環境に対して次の標準を特定します。
データ エンジニアはクラスターを共有する必要があります。
ジョブ クラスターは、データ サイエンティストとデータ エンジニアがクラスターにデプロイするためのパッケージ化されたノートブックを提供するリクエスト プロセスを使用して管理されます。
すべてのデータ サイエンティストには、120 分間操作がないと自動的に終了する独自のクラスターを割り当てる必要があります。現在、データ サイエンティストは 3 人います。
ワークロード用の Databricks クラスターを作成する必要があります。
解決策: 各データ サイエンティスト用に標準クラスター、データ エンジニア用に高同時実行クラスター、ジョブ用に高同時実行クラスターを作成します。
これは目標を満たしていますか?
DP-203 試験問題 63
Azure Synapse Analytics 専用の SQL プールがあります。
PDW_SHOWSPACEUSED(dbo,FactInternetSales'); を実行すると、次の表に示す結果が得られます。

dbo,FactInternetSales テーブルを正確に説明している記述はどれですか?
PDW_SHOWSPACEUSED(dbo,FactInternetSales'); を実行すると、次の表に示す結果が得られます。

dbo,FactInternetSales テーブルを正確に説明している記述はどれですか?
DP-203 試験問題 64
フォルダーを含む Azure Blob ストレージ アカウントがあります。フォルダーには 120,000 個のファイルが含まれています。各ファイルには 62 列が含まれています。
毎日、1,500 個の新しいファイルがフォルダーに追加されます。
各新しいファイルから 5 つのデータ列を Azure Synapse Analytics ワークスペースに段階的に読み込む予定です。
増分ロードの実行にかかる時間を最小限に抑える必要があります。
ファイルの保存とフォーマットには何を使用すればよいですか?

毎日、1,500 個の新しいファイルがフォルダーに追加されます。
各新しいファイルから 5 つのデータ列を Azure Synapse Analytics ワークスペースに段階的に読み込む予定です。
増分ロードの実行にかかる時間を最小限に抑える必要があります。
ファイルの保存とフォーマットには何を使用すればよいですか?

DP-203 試験問題 65
Azure Synapse Analytics サーバーレス SQL プールにデータベースを構築しています。
Azure Data Lake Storege Gen2 コンテナー内の Parquet ファイルにデータが保存されています。
レコードは次のサンプルに示すように構造化されます。
{
"id": 123,
"住所_家番号": "19c",
"address_line": "思い出の小道",
"applicant1_name": "ジェーン",
"applicant2_name": "開発者"
}
記録には最大 2 人の応募者が含まれます。
住所フィールドのみを含むテーブルを構築する必要があります。
Transact-SQL ステートメントをどのように完了する必要がありますか? 回答するには、回答領域で適切なオプションを選択します。
注意: 正しい選択ごとに 1 ポイントが付与されます。

Azure Data Lake Storege Gen2 コンテナー内の Parquet ファイルにデータが保存されています。
レコードは次のサンプルに示すように構造化されます。
{
"id": 123,
"住所_家番号": "19c",
"address_line": "思い出の小道",
"applicant1_name": "ジェーン",
"applicant2_name": "開発者"
}
記録には最大 2 人の応募者が含まれます。
住所フィールドのみを含むテーブルを構築する必要があります。
Transact-SQL ステートメントをどのように完了する必要がありますか? 回答するには、回答領域で適切なオプションを選択します。
注意: 正しい選択ごとに 1 ポイントが付与されます。





