[2022-10-31更新,63問] 無料Databricks Associate-Developer-Apache-Spark試験問題集、Associate-Developer-Apache-Spark日本語対策(ページ 8)

Associate-Developer-Apache-Spark 試験問題 31

以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、パスパスにあるDataFrametransactionsDfを寄木細工のファイルとして保存し、既存の寄木細工のファイルに追加する必要があります。エラーを見つけます。
コードブロック：

A. transactionsDf.format（ "parquet"）。option（ "mode"、 "append"）。save（path）

B. コードブロックにDataFrameWriterへの参照がありません。

C. save（）は遅延評価され、アクションが続く必要があります。

D. コマンドがデフォルトのモードを使用するように、modeオプションは省略してください。

E. コードブロックに、パーティションを処理するbucketByコマンドがありません。

F. DataFrameを寄木細工のファイルとして保存する必要があるため、パスが間違ったメソッドに渡されています。

Associate-Developer-Apache-Spark 試験問題 32

以下に示すコードブロックを実行して、列storeIdおよびproductIdごとのDataFrametransactionsDfの列predErrorの平均を示すDataFrameを作成する必要があります。ここで、productIdは2または3のいずれかであり、返されたDataFrameは昇順で並べ替えられます。列storeIdで並べ替え、その列にnullを除外しますか？
DataFrametransactionsDf：
1。+-------------+ --------- + ----- + ------- + --------- + ---- +
2. | transactionId | predError | value | storeId | productId | f |
3. + ------------- + --------- + ----- + ------- + --------- + ---- +
4. | 1 | 3 | 4 | 25 | 1 | null |
5. | 2 | 6 | 7 | 2 | 2 | null |
6. | 3 | 3 | null | 25 | 3 | null |
7. | 4 | null | null | 3 | 2 | null |
8. | 5 | null | null | null | 2 | null |
9. | 6 | 3 | 2 | 25 | 2 | null |
10. + ------------- + --------- + ----- + ------- + --------- + ---- +
1. .mean（ "predError"）
2. .groupBy（ "storeId"）
3. .orderBy（ "storeId"）
4.transactionsDf.filter（transactionsDf.storeId.isNotNull（））
5. .pivot（ "productId"、[2、3]）

A. 4、5、2、3、1

B. 4、2、1

C. 4、1、5、2、3

D. 4、2、5、1、3

E. 4、3、2、5、1

正解: D

説明
正しいコードブロック：
transactionDf.filter（transactionsDf.storeId.isNotNull（））。groupBy（ "storeId"）。pivot（ "productId"、[2、
3]）。mean（ "predError"）。orderBy（ "storeId"）
正しいコードブロックの出力：
+ ------- + ---- + ---- +
| storeId | 2 | 3 |
+ ------- + ---- + ---- +
| 2 | 6.0 | null |
| 3 | null | null |
| 25 | 3.0 | 3.0 |
+ ------- + ---- + ---- +
この質問は非常に複雑であり、操作の正しい順序について真剣に考える必要があります。
ピボットメソッドも登場します-（まだ）あまり知らないかもしれないメソッドです。
すべての回答の最初の位置はコードブロック4であるため、質問は基本的に残りの4つのコードブロックの順序に関するものです。
質問には、返されたDataFrameを列storeIdで並べ替える必要があると記載されています。したがって、コードブロックの最後にorderBy演算子を含むコードブロック3を含めることは理にかなっています。これにより、2つの回答オプションしか残されません。
ここで、PySparkのピボットのコンテキストについて詳しく知ることが役立ちます。一般的なパターンは、groupBy、pivot、そしてmeanのような別の集計関数です。以下にリンクされているドキュメントでは、ピボットがpyspark.sql.GroupedDataのメソッドであることがわかります。つまり、ピボットする前にgroupByを使用する必要があります。この要件に一致する唯一の回答オプションは、コードブロック5（ピボットを含む）の前にコードブロック2（groupByを含む）が記述されているオプションです。
詳細：pyspark.sql.GroupedData.pivot-PySpark3.1.2ドキュメント
静的ノートブック| ダイナミックノートブック：テスト3を参照

Associate-Developer-Apache-Spark 試験問題 33

以下に示すコードブロックは、DataFrameトランザクションDfを2つの異なるエグゼキュータに格納し、エグゼキュータのメモリを可能な限り利用しますが、ディスクには何も書き込みません。これを実現するには、コードブロックの空白を正しく埋める答えを選択してください。
1.pysparkからインポートStorageLevel
2.transactionsDf .__ 1 __（StorageLevel .__ 2 __）.__ 3__

A. 1.キャッシュ
2. MEMORY_ONLY_2
3. count（）

B. 1.持続する
2. DISK_ONLY_2
3. count（）

C. 1.持続する
2. MEMORY_ONLY_2
3. select（）

D. 1.キャッシュ
2. DISK_ONLY_2
3. count（）

E. 1.持続する
2. MEMORY_ONLY_2
3. count（）

Associate-Developer-Apache-Spark 試験問題 34

次のコードブロックのうち、列名とタイプの両方を含むツリーのような方法でDataFrameの構造を示しているのはどれですか？

A. 1.print（itemsDf.columns）
2.print（itemsDf.types）

B. itemsDf.printSchema（）

C. spark.schema（itemsDf）

D. itemsDf.rdd.printSchema（）

E. itemsDf.print.schema（）

Associate-Developer-Apache-Spark 試験問題 35

以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、DataFrameitemsDfを列itemIdのより大きなDataFrametransactionsDfと結合することを目的としています。エラーを見つけます。
コードブロック：
transactionDf.join（itemsDf、 "itemId"、how = "broadcast"）

A. 構文が間違っています。how=をコードブロックから削除する必要があります。

B. 結合方式はブロードキャスト方式に置き換える必要があります。

C. Sparkは、この動作がSparkクラスターで有効になっている場合にのみブロードキャスト操作を実行します。

D. 小さいDataFrame itemsDfではなく、大きいDataFrametransactionsDfがブロードキャストされています。

E. ブロードキャストは有効な結合タイプではありません。

他のバージョン: 576Databricks.Associate-Developer-Apache-Spark.v2023-12-11.q63; 676Databricks.Associate-Developer-Apache-Spark.v2023-04-17.q60

最新アップロード: 122Workday.Workday-Pro-Talent-and-Performance.v2026-06-20.q18; 155Fortinet.NSE4_FGT_AD-7.6.v2026-06-20.q64; 143EMC.D-ISM-FN-01.v2026-06-20.q22; 150F5.F5CAB5.v2026-06-19.q20; 151SAP.C_P2W52_2410.v2026-06-19.q29; 147Scrum.PSM-III.v2026-06-18.q13; 172Oracle.1z0-1033-25.v2026-06-18.q45; 157Salesforce.Mule-101.v2026-06-17.q19; 166Citrix.1Y0-204.v2026-06-17.q142; 315CrowdStrike.CCCS-203b.v2026-06-16.q114

Associate-Developer-Apache-Spark 試験問題 31

Associate-Developer-Apache-Spark 試験問題 32

Associate-Developer-Apache-Spark 試験問題 33

Associate-Developer-Apache-Spark 試験問題 34

Associate-Developer-Apache-Spark 試験問題 35

PDFファイルをダウンロード