Associate-Developer-Apache-Spark-3.5 試験問題 21
55 件中 7 件目。
開発者はSparkアプリケーションの問題をデバッグするよう依頼されました。開発者は、CSVファイルからロードされたデータがDataFrameに正しく読み込まれていないことを発見しました。
CSV ファイルは、次の Spark SQL ステートメントを使用して読み取られています。
CREATE TABLEの場所
csvの使用
オプション (パス '/data/locations.csv')
コマンド SELECT * FROM locations の最初の行は次のようになります。
| 都市 | 緯度 | 経度 |
|アルティ シドニー | -33... | ... |
CSV データを再度正しく読み取るために、開発者は CREATE TABLE ステートメントの OPTIONS 句にどのパラメータを追加できますか?
開発者はSparkアプリケーションの問題をデバッグするよう依頼されました。開発者は、CSVファイルからロードされたデータがDataFrameに正しく読み込まれていないことを発見しました。
CSV ファイルは、次の Spark SQL ステートメントを使用して読み取られています。
CREATE TABLEの場所
csvの使用
オプション (パス '/data/locations.csv')
コマンド SELECT * FROM locations の最初の行は次のようになります。
| 都市 | 緯度 | 経度 |
|アルティ シドニー | -33... | ... |
CSV データを再度正しく読み取るために、開発者は CREATE TABLE ステートメントの OPTIONS 句にどのパラメータを追加できますか?
Associate-Developer-Apache-Spark-3.5 試験問題 22
MLOpsエンジニアが、英語の文字列をスペイン語に翻訳する言語モデルを適用するPandas UDFを構築しています。初期コードでは、UDFを呼び出すたびにモデルをロードするため、データパイプラインのパフォーマンスが低下しています。
初期コードは次のとおりです。

定義 in_spanish_inner(df: pd.Series) -> pd.Series:
モデル = get_translation_model(ターゲット言語 = 'es')
df.apply(model) を返す
in_spanish = sf.pandas_udf(in_spanish_inner, 文字列型())
MLOps エンジニアは、このコードをどのように変更すれば、言語モデルの読み込み回数を減らすことができますか?
初期コードは次のとおりです。

定義 in_spanish_inner(df: pd.Series) -> pd.Series:
モデル = get_translation_model(ターゲット言語 = 'es')
df.apply(model) を返す
in_spanish = sf.pandas_udf(in_spanish_inner, 文字列型())
MLOps エンジニアは、このコードをどのように変更すれば、言語モデルの読み込み回数を減らすことができますか?
Associate-Developer-Apache-Spark-3.5 試験問題 23
開発者は、データセット内のすべてのシャッフル後のパーティションが spark.sql.adaptive.maxShuffledHashJoinLocalMapThreshold に設定された値よりも小さいことに気付きました。
この場合、Adaptive Query Execution (AQE) はどのタイプの結合を選択しますか?
この場合、Adaptive Query Execution (AQE) はどのタイプの結合を選択しますか?
Associate-Developer-Apache-Spark-3.5 試験問題 24
与えられた条件:
パイソン
コピー編集
スパーク.sparkContext.setLogLevel("<LOG_LEVEL>")
どのセットに Spark ドライバー LOG_LEVEL に適した構成設定が含まれていますか?
パイソン
コピー編集
スパーク.sparkContext.setLogLevel("<LOG_LEVEL>")
どのセットに Spark ドライバー LOG_LEVEL に適した構成設定が含まれていますか?
Associate-Developer-Apache-Spark-3.5 試験問題 25
アダプティブ クエリ実行 (AQE) の利点は何ですか?
