Associate-Developer-Apache-Spark-3.5 試験問題 61

Sparkエンジニアは、実行中にメモリ不足エラーが発生しているSparkアプリケーションのトラブルシューティングを行っています。Sparkドライバーのログを確認すると、「GCオーバーヘッド制限を超えました」というメッセージが複数回表示されていることに気付きました。
この問題を解決するためにエンジニアはどのようなアクションを取る必要がありますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 62

    あるデータサイエンティストは、大量の構造化データの処理、SQLクエリの実行、機械学習アルゴリズムの適用を必要とするプロジェクトに取り組んでいます。このタスクにApache Sparkの使用を検討しています。
    このシナリオでは、データ サイエンティストはどの Apache Spark モジュールの組み合わせを使用する必要がありますか?
    オプション:
  • Associate-Developer-Apache-Spark-3.5 試験問題 63

    データサイエンティストが大規模なデータセットを分析しており、DataFrame に対する複数の変換とアクションを含む PySpark スクリプトを作成しました。スクリプトは、結果を取得するための collect() アクションで終了します。
    データ サイエンティストがこのスクリプトを実行すると、Apache Spark™ の実行階層は操作をどのように処理しますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 64

    どの UDF 実装が Spark DataFrame 内の文字列の長さを計算しますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 65

    データサイエンティストは、ユーザープロファイルテーブル内の一部のレコードに、いずれかのフィールドにnull値が含まれていることを発見しました。これらのレコードは、処理前にデータセットから削除する必要があります。スキーマには、user_id、username、date_of_birth、created_tsなどのフィールドが含まれています。
    ユーザー プロファイル テーブルのスキーマは次のようになります。

    この要件を満たすために使用できる Spark コード ブロックはどれですか?
    オプション: