Associate-Developer-Apache-Spark-3.5 試験問題 21

55 件中 7 件目。
開発者はSparkアプリケーションの問題をデバッグするよう依頼されました。開発者は、CSVファイルからロードされたデータがDataFrameに正しく読み込まれていないことを発見しました。
CSV ファイルは、次の Spark SQL ステートメントを使用して読み取られています。
CREATE TABLEの場所
csvの使用
オプション (パス '/data/locations.csv')
コマンド SELECT * FROM locations の最初の行は次のようになります。
| 都市 | 緯度 | 経度 |
|アルティ シドニー | -33... | ... |
CSV データを再度正しく読み取るために、開発者は CREATE TABLE ステートメントの OPTIONS 句にどのパラメータを追加できますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 22

    MLOpsエンジニアが、英語の文字列をスペイン語に翻訳する言語モデルを適用するPandas UDFを構築しています。初期コードでは、UDFを呼び出すたびにモデルをロードするため、データパイプラインのパフォーマンスが低下しています。
    初期コードは次のとおりです。

    定義 in_spanish_inner(df: pd.Series) -> pd.Series:
    モデル = get_translation_model(ターゲット言語 = 'es')
    df.apply(model) を返す
    in_spanish = sf.pandas_udf(in_spanish_inner, 文字列型())
    MLOps エンジニアは、このコードをどのように変更すれば、言語モデルの読み込み回数を減らすことができますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 23

    開発者は、データセット内のすべてのシャッフル後のパーティションが spark.sql.adaptive.maxShuffledHashJoinLocalMapThreshold に設定された値よりも小さいことに気付きました。
    この場合、Adaptive Query Execution (AQE) はどのタイプの結合を選択しますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 24

    与えられた条件:
    パイソン
    コピー編集
    スパーク.sparkContext.setLogLevel("<LOG_LEVEL>")
    どのセットに Spark ドライバー LOG_LEVEL に適した構成設定が含まれていますか?
  • Associate-Developer-Apache-Spark-3.5 試験問題 25

    アダプティブ クエリ実行 (AQE) の利点は何ですか?