Associate-Developer-Apache-Spark-3.5 試験問題 16
データ エンジニアは、指定されたストリーミング データを使用して、ストリーミング データフレーム streaming_df を操作しています。

streaming_df でサポートされている操作はどれですか?

streaming_df でサポートされている操作はどれですか?
Associate-Developer-Apache-Spark-3.5 試験問題 17
データ変換に Spark 上の Pandas を使用する利点は何ですか?
オプション:
オプション:
Associate-Developer-Apache-Spark-3.5 試験問題 18
データエンジニアは、JSONイベントのストリームをリアルタイムで処理するApache Spark™ Structured Streamingアプリケーションを構築しています。エンジニアは、アプリケーションにフォールトトレラント性を持たせ、障害発生時に最後に正常に処理されたレコードから処理を再開したいと考えています。これを実現するために、データエンジニアはチェックポイントを実装することにしました。
データ エンジニアはどのコード スニペットを使用すべきでしょうか?
データ エンジニアはどのコード スニペットを使用すべきでしょうか?
Associate-Developer-Apache-Spark-3.5 試験問題 19
次のコードがあるとします:

.withWatermark("event_time", "10分")
.groupBy(window("イベント時間", "15分"))
。カウント()
ウォーターマークしきい値後に到着したデータはどうなるのでしょうか?
オプション:

.withWatermark("event_time", "10分")
.groupBy(window("イベント時間", "15分"))
。カウント()
ウォーターマークしきい値後に到着したデータはどうなるのでしょうか?
オプション:
Associate-Developer-Apache-Spark-3.5 試験問題 20
開発者は SparkSession を初期化します。

spark = SparkSession.builder \
.appName("アナリティクスアプリケーション") \
.getOrCreate()
Spark の SparkSession について説明している記述はどれですか?

spark = SparkSession.builder \
.appName("アナリティクスアプリケーション") \
.getOrCreate()
Spark の SparkSession について説明している記述はどれですか?

