Associate-Developer-Apache-Spark-3.5 試験問題 51

55 件中 35 件目。
データ エンジニアは構造化ストリーミング パイプラインを構築しており、中断したところから続行することで障害または意図的なシャットダウンから回復したいと考えています。
これを実現するにはどうすればよいでしょうか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 52

    DataFrame を書き込むときに既存の JSON ファイルを上書きするコマンドはどれですか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 53

    エンジニアは2つのDataFrame(df1(小)とdf2(大))を持っています。ブロードキャスト結合を使用します。
    パイソン
    コピー編集
    pyspark.sql.functionsimportbroadcastから
    結果 = df2.join(broadcast(df1), on='id', how='inner')
    このシナリオでbroadcast() を使用する目的は何ですか?
    オプション:
  • Associate-Developer-Apache-Spark-3.5 試験問題 54

    Spark Connect の機能は何ですか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 55

    55 件中 23 件目。
    あるデータサイエンティストは、単一マシンのメモリ容量を超える大規模なデータセットを扱っています。データサイエンティストは、標準的なPythonスクリプトなどの従来の単一マシン言語の代わりに、Apache Spark™の使用を検討しています。
    このシナリオでは、Apache Spark™ は通常のシングルマシン言語に比べてどのような 2 つの利点がありますか? (回答を 2 つ選択してください)