[2026-05-26更新,73問] 無料Databricks Associate-Developer-Apache-Spark-3.5試験問題集、Associate-Developer-Apache-Spark-3.5資格認証攻略(ページ 13)

Associate-Developer-Apache-Spark-3.5 試験問題 56

Spark エンジニアは、Spark ジョブに適切なデプロイメントモードを選択する必要があります。
Apache Spark™ でクラスターモードを使用する利点は何ですか?

A. クラスタモードでは、クラスタ上のリソースマネージャからリソースが割り当てられ、大規模なジョブのパフォーマンスとスケーラビリティが向上します。

B. クラスターモードでは、ドライバーはすべてのタスクをワーカーノード全体に分散せずにローカルで実行します。

C. クラスターモードでは、ドライバーはクライアントマシン上で実行されるため、大規模なデータセットを効率的に処理するアプリケーションの能力が制限される可能性があります。

D. クラスターモードでは、ドライバープログラムはワーカーノードの 1 つで実行され、アプリケーションはクラスターの分散リソースを最大限に活用できます。

Associate-Developer-Apache-Spark-3.5 試験問題 57

データエンジニアは、上流チームから毎晩配信されるParquetファイル群の取り込みパイプラインを構築するよう依頼されています。データは「/path/events/data」をベースパスとするディレクトリ構造に保存されています。上流チームは、年/月/日の規則に従って、日次データを下位のサブディレクトリにドロップします。
ディレクトリ構造の例をいくつか挙げます。

次のコードスニペットのうち、ディレクトリ構造内のすべてのデータを読み取るものはどれですか。

A. df = spark.read.option("inferSchema", "true").parquet("/path/events/data/")

B. df = spark.read.option("recursiveFileLookup", "true").parquet("/path/events/data/")

C. df = spark.read.parquet("/path/events/data/*")

D. df = spark.read.parquet("/path/events/data/")

Associate-Developer-Apache-Spark-3.5 試験問題 58

開発者は、次のような小さな Parquet テーブルに保存されたデータを使用して Python 辞書を作成する必要があります。

結果の Python 辞書には、最小の 3 つの region_id 値を含む region -> region id のマッピングが含まれている必要があります。
どのコードフラグメントが要件を満たしていますか?
A)

ダ）

結果の Python 辞書には、最小の 3 つの region_id 値に対する region -> region_id のマッピングが含まれている必要があります。
どのコードフラグメントが要件を満たしていますか?

A. 地域 = 辞書(
地域_df
.select('地域', '地域ID')
.sort('地域ID')
.take(3)
）

B. 地域 = 辞書(
地域_df
.select('region_id', 'region')
.sort('地域ID')
.take(3)
）

C. 領域 = dict(
地域_df
.select('region_id', 'region')
.limit(3)
。集める（）
）

D. 地域 = 辞書(
地域_df
.select('地域', '地域ID')
.sort(desc('region_id'))
.take(3)
）

Associate-Developer-Apache-Spark-3.5 試験問題 59

55 件中 27 件目。
データエンジニアは、1 つのテーブルのすべての行を別のテーブルのすべての行に追加する必要がありますが、最初のテーブルのすべての列が 2 番目のテーブルに存在するわけではありません。
エラーメッセージは次のとおりです:
AnalysisException: UNION は同じ数の列を持つテーブルでのみ実行できます。
既存のコードは次のとおりです。
au_df.union(nz_df)
DataFrame au_df には、DataFrame nz_df には存在しない 1 つの列がありますが、それ以外は両方の DataFrame の列名とデータ型は同じです。
結合された DataFrame が期待どおりに生成されるようにするには、データエンジニアはコードのどこを修正する必要がありますか?

A. df = au_df.unionByName(nz_df, allowMissingColumns=True)

B. df = au_df.unionAll(nz_df)

C. df = au_df.unionByName(nz_df, allowMissingColumns=False)

D. df = au_df.union(nz_df, allowMissingColumns=True)

Associate-Developer-Apache-Spark-3.5 試験問題 60

55 件中 11 件目。
どの Spark 構成が、エグゼキュータ上で並列実行できるタスクの数を制御しますか?

A. spark.executor.cores

B. spark.task.maxFailures

C. spark.executor.memory

D. spark.sql.shuffle.partitions

他のバージョン: 550Databricks.Associate-Developer-Apache-Spark-3.5.v2025-07-25.q30

最新アップロード: 143Salesforce.Mule-Arch-201.v2026-06-13.q56; 131Fortinet.NSE7_SOC_AR-7.6.v2026-06-13.q26; 132HP.HPE0-G04.v2026-06-13.q33; 148CrowdStrike.CCFA-200b.v2026-06-13.q88; 162Salesforce.Mule-Dev-201.v2026-06-12.q88; 172WGU.Information-Technology-Management.v2026-06-12.q113; 273CuramSoftware.CS0-003.v2026-06-12.q520; 185Salesforce.NP-Con-101.v2026-06-11.q92; 190RealEstate.Maryland-Real-Estate-Salesperson.v2026-06-11.q107; 241Microsoft.AZ-204.v2026-06-11.q260

Associate-Developer-Apache-Spark-3.5 試験問題 56

Associate-Developer-Apache-Spark-3.5 試験問題 57

Associate-Developer-Apache-Spark-3.5 試験問題 58

Associate-Developer-Apache-Spark-3.5 試験問題 59

Associate-Developer-Apache-Spark-3.5 試験問題 60

PDFファイルをダウンロード