Associate-Developer-Apache-Spark-3.5 試験問題 46

開発者は、次のような小さな Parquet テーブルに保存されたデータを使用して Python 辞書を作成する必要があります。

結果の Python 辞書には、最小の 3 つの region_id 値を含む region -> region id のマッピングが含まれている必要があります。
どのコードフラグメントが要件を満たしていますか?
A)

B)

C)

ダ)

結果のPython辞書には、最小のregion -> region_idのマッピングが含まれている必要があります。
3つのregion_id値。
どのコードフラグメントが要件を満たしていますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 47

    エンジニアは、/file/test_data.orc にある大きな ORC ファイルを持っており、メモリ使用量を削減するために特定の列のみを読み取りたいと考えています。
    読み取りプロセス中に列 (col1、col2) を選択するコード フラグメントはどれですか。
  • Associate-Developer-Apache-Spark-3.5 試験問題 48

    データ エンジニアは、ストリーミング データフレームを Parquet ファイルとして書き込む必要があります。
    次のコードが与えられます:

    要件を満たすにはどのコードフラグメントを挿入する必要がありますか?
    A)

    B)

    C)

    ダ)

    要件を満たすにはどのコードフラグメントを挿入する必要がありますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 49

    Spark アプリケーション開発者は、どの操作がシャッフルを引き起こし、Spark 実行プランの新しいステージにつながるのかを特定したいと考えています。
    どの操作によりシャッフルが行われ、新しいステージが作成されますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 50

    データ エンジニアは構造化ストリーミング パイプラインを構築しており、パイプラインが中断したところから続行することで、パイプラインが障害または意図的なシャットダウンから回復することを望んでいます。
    これを実現するにはどうすればよいでしょうか?