Associate-Developer-Apache-Spark-3.5 試験問題 1

データ アナリストは、次の 2 つの列を含む DataFramesensor_df で作業しています。
どのコードフラグメントが、レコード列を個別の列に分割し、行ごとに 1 つの配列項目を持つ DataFrame を返しますか?
A)

B)

C)

ダ)
  • Associate-Developer-Apache-Spark-3.5 試験問題 2

    あなたが持っている:
    データフレームA: 128 GBのトランザクション
    データフレーム B: 1 GB のユーザー検索テーブル
    放送にはどの戦略が正しいでしょうか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 3

    開発者は SparkSession を初期化します。

    spark = SparkSession.builder \
    .appName("アナリティクスアプリケーション") \
    .getOrCreate()
    sparkSparkSession を説明する記述はどれですか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 4

    データ エンジニアは、次の構成で Spark クラスター上でバッチ処理ジョブを実行しています。
    10 個のワーカーノード
    ワーカーノードあたり16個のCPUコア
    ノードあたり64GBのRAM
    データ エンジニアは、ノードごとに 4 つのエグゼキュータを割り当て、各エグゼキュータが 4 つのコアを使用するようにしたいと考えています。
    アプリケーションで使用される CPU コアの合計数はいくつですか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 5

    次のコード フラグメントではエラーが発生します。
    @F.udf(T.IntegerType())
    定義 simple_udf(t: str) -> str:
    答えを返す * 3.14159
    代わりにどのコードフラグメントを使用する必要がありますか?