[2023-04-17更新,60問] 無料Databricks Associate-Developer-Apache-Spark試験問題集、Associate-Developer-Apache-Spark模擬体験(ページ 6)

Associate-Developer-Apache-Spark 試験問題 21

次のコードブロックのうち、1 列の DataFrame の DataFrame transactionsDf の列 value と productId のすべての値ですべての一意の値を返すのはどれですか?

A. tranactionsDf.select('value').join(transactionsDf.select('productId'), col('value')==col('productId'),
「外側」)

B. transactionsDf.select(col('value'), col('productId')).agg({'*': 'count'})

C. transactionsDf.select('value', 'productId').distinct()

D. transactionsDf.select('value').union(transactionsDf.select('productId')).distinct()

E. transactionsDf.agg({'value': 'collect_set', 'productId': 'collect_set'})

Associate-Developer-Apache-Spark 試験問題 22

次のうち、Adaptive Query Execution の機能でないものはどれですか?

A. 必要に応じて、ソートマージ結合をブロードキャスト結合に置き換えます。

B. パーティションを結合してデータ処理を高速化します。

C. 偏ったパーティションを小さなパーティションに分割して、パーティションの処理時間の違いを回避します。

D. エグゼキュータに障害が発生した場合にクエリを再ルーティングします。

E. クエリの実行中にランタイム統計を収集します。

Associate-Developer-Apache-Spark 試験問題 23

次のコードブロックのうち、列 productId が 0 以下または 3 以下の DataFrame transactionsDf からすべての行を選択するのはどれですか?

A. transactionsDf.filter(productId==3 または productId<1)

B. transactionsDf.filter((col("productId")==3) または (col("productId")<1))

C. transactionsDf.filter(col("productId")==3 | col("productId")<1)

D. transactionsDf.where("productId"=3).or("productId"<1))

E. transactionsDf.filter((col("productId")==3) | (col("productId")<1))

Associate-Developer-Apache-Spark 試験問題 24

次のコードブロックのうち、season 列と wind_speed_ms 列の 2 つの列を持つ新しい DataFrame を作成するコードブロックはどれですか?

A. spark.DataFrame({"季節": ["冬","夏"], "風速_ms": [4.5, 7.5]})

B. spark.createDataFrame([("夏", 4.5), ("冬", 7.5)], ["季節", "wind_speed_ms"])

C. 1. pyspark.sql から T として型をインポートします。
2. spark.createDataFrame((("夏", 4.5), ("冬", 7.5)), T.StructType([T.StructField("季節",

D. CharType()), T.StructField("季節", T.DoubleType())]))

E. spark.newDataFrame([("夏", 4.5), ("冬", 7.5)], ["季節", "wind_speed_ms"])

F. spark.createDataFrame({"季節": ["冬","夏"], "風速_ms": [4.5, 7.5]})

正解: B

説明
spark.createDataFrame([("summer", 4.5), ("winter", 7.5)], ["season", "wind_speed_ms"]) 正解。このコマンドは、Spark セッションの createDataFrame メソッドを使用して、新しい DataFrame を作成します。ここで行、列、および列名がどのように渡されるかに注意してください。行は Python リストとして指定されます。リスト内のすべてのエントリが新しい行です。列は Python タプルとして指定されます (例: ("summer", 4.5))。すべての列は、タプルの 1 つのエントリです。
列名は、createDataFrame() の 2 番目の引数として指定されます。ドキュメント（以下のリンク）は、「スキーマが列名のリストである場合、各列の型はデータから推測される」（最初の引数）ことを示しています。値 4.5 と 7.5 は両方とも float 変数であるため、Spark は列 wind_speed_ms の double 型を正しく推測します。列のすべての値が
「シーズン」には文字列のみが含まれ、Spark は列を文字列として適切にキャストします。
以下のリンクから SparkSession.createDataFrame() の詳細をご覧ください。
spark.newDataFrame([("summer", 4.5), ("winter", 7.5)], ["season", "wind_speed_ms"]) いいえ、SparkSession には newDataFrame メソッドがありません。
T として pyspark.sql インポートタイプから
spark.createDataFrame((("夏", 4.5), ("冬", 7.5)), T.StructType([T.StructField("シーズン",
T.CharType()), T.StructField("季節", T.DoubleType())]))
いいえ。pyspark.sql.types には CharType 型がありません。Spark で利用可能なデータ型については、以下のリンクを参照してください。
spark.createDataFrame({"season": ["winter","summer"], "wind_speed_ms": [4.5, 7.5]}) いいえ、これは正しい Spark 構文ではありません。このオプションが正しいと考えた場合、これが正しい構文である Python の pandas パッケージを使用した経験があるかもしれません。Pandas DataFrame から Spark DataFrame を作成するには、pandasDf が Pandas DataFrame である spark.createDataFrame(pandasDf) を使用するだけです。
以下にリンクされている SparkSession.createDataFrame のドキュメントの例を使用して、Spark 構文オプションの詳細を確認してください。
spark.DataFrame({"season": ["winter","summer"], "wind_speed_ms": [4.5, 7.5]}) いいえ、Spark セッション (上記のコードでは spark で示されています) には DataFrame メソッドがありません.
詳細: pyspark.sql.SparkSession.createDataFrame - PySpark 3.1.1 ドキュメントとデータ型 - Spark 3.1.2 ドキュメント静的ノートブック | 動的ノートブック: テスト 1 を参照

Associate-Developer-Apache-Spark 試験問題 25

以下に表示されているコードブロックにはエラーが含まれています。コードブロックは、一意の storeId でグループ化された列値の行の平均を返す必要があります。エラーを見つけます。
コードブロック:
transactionsDf.agg("storeId").avg("value")

A. avg("value") の代わりに、avg(col("value")) を使用する必要があります。

B. avg("value") は、agg() に追加するのではなく、2 番目の引数として指定する必要があります。

C. すべての列名を col() 演算子で囲む必要があります。

D. agg は groupBy に置き換える必要があります。

E. 「storeId」と「value」を入れ替える必要があります。

Associate-Developer-Apache-Spark プレミアム問題集

365日無料更新
専門家プレゼンツ
179 問題と解答
Windows / Mac / Android / iOS　などをサポート

最新 Databricks Associate-Developer-Apache-Spark 試験問題集は GoShiken.com のサポートで Associate-Developer-Apache-Spark 試験を合格させます！

(40%OFF 特別割引: JPNPDF)

今すぐダウンロード

他のバージョン: 387Databricks.Associate-Developer-Apache-Spark.v2023-12-11.q63; 642Databricks.Associate-Developer-Apache-Spark.v2022-10-31.q63

最新アップロード: 126SAP.C-TS412-2021.v2025-09-06.q90; 148Microsoft.MB-700.v2025-09-06.q281; 142Docker.DCA.v2025-09-06.q175; 113SAP.C-BCFIN-2502.v2025-09-05.q12; 123Avaya.77201X.v2025-09-05.q58; 109Oracle.1Z0-1079-24.v2025-09-05.q19; 112NBMTM.BCMTMS.v2025-09-05.q33; 109Huawei.H19-423_V1.0.v2025-09-04.q138; 115Nokia.4A0-113.v2025-09-04.q69; 137Microsoft.PL-200.v2025-09-04.q112