Associate-Developer-Apache-Spark 試験問題 16
以下に表示されているコード ブロックにはエラーが含まれています。コード ブロックは、DataFrame transactionsDf の数値および null 許容列 predError に適用された Python 関数 add_2_if_geq_3 の結果が列 predErrorAdded に含まれる DataFrame を返す必要があります。エラーを見つけます。
コードブロック:
1.def add_2_if_geq_3(x):
2. x が None の場合:
3. x を返す
4. elif x >= 3:
5. x+2 を返す
6. x を返す
7。
8.add_2_if_geq_3_udf = udf(add_2_if_geq_3)
9.
10.transactionsDf.withColumnRenamed("predErrorAdded", add_2_if_geq_3_udf(col("predError")))
コードブロック:
1.def add_2_if_geq_3(x):
2. x が None の場合:
3. x を返す
4. elif x >= 3:
5. x+2 を返す
6. x を返す
7。
8.add_2_if_geq_3_udf = udf(add_2_if_geq_3)
9.
10.transactionsDf.withColumnRenamed("predErrorAdded", add_2_if_geq_3_udf(col("predError")))
Associate-Developer-Apache-Spark 試験問題 17
クライアントとクラスターの実行モードの違いを説明しているのは次のうちどれですか?
Associate-Developer-Apache-Spark 試験問題 18
以下に表示されているコード ブロックには、複数のエラーが含まれています。コード ブロックは、DataFrame transactionsDf から列 transactionDate を削除し、DataFrame transactionsDf の列 transactionDate で文字列として表される日付が UNIX タイムスタンプに変換される列 transactionTimestamp を追加する必要があります。エラーを見つけます。
DataFrame トランザクションのサンプルDf:
1.+-------------+---------+-----+-------+--------- +----+----------------+
2.|transactionId|predError|value|storeId|productId| ふ| 取引日|
3.+-------------+---------+-----+-------+--------- +----+----------------+
4.| 1| 3| 4| 25| 1|ヌル|2020-04-26 15:35|
5.| 2| 6| 7| 2| 2|null|2020-04-13 22:01|
6.| 3| 3| ヌル| 25| 3|null|2020-04-02 10:53|
7.+-------------+---------+-----+-------+--------- +----+----------------+ コードブロック:
1.transactionsDf = transactionsDf.drop("transactionDate")
2.transactionsDf["transactionTimestamp"] = unix_timestamp("transactionDate", "yyyy-MM-dd")
DataFrame トランザクションのサンプルDf:
1.+-------------+---------+-----+-------+--------- +----+----------------+
2.|transactionId|predError|value|storeId|productId| ふ| 取引日|
3.+-------------+---------+-----+-------+--------- +----+----------------+
4.| 1| 3| 4| 25| 1|ヌル|2020-04-26 15:35|
5.| 2| 6| 7| 2| 2|null|2020-04-13 22:01|
6.| 3| 3| ヌル| 25| 3|null|2020-04-02 10:53|
7.+-------------+---------+-----+-------+--------- +----+----------------+ コードブロック:
1.transactionsDf = transactionsDf.drop("transactionDate")
2.transactionsDf["transactionTimestamp"] = unix_timestamp("transactionDate", "yyyy-MM-dd")
Associate-Developer-Apache-Spark 試験問題 19
以下に示すコード ブロックは、DataFrame トランザクション Df の行の約 15% のランダム サブセットの平均予測エラー (列 predError) のみを置換せずに返す必要があります。これを行うには、コード ブロックの空白を正しく埋める答えを選択してください。
トランザクションDf.__1__(__2__, __3__).__4__(avg('predError'))
トランザクションDf.__1__(__2__, __3__).__4__(avg('predError'))
Associate-Developer-Apache-Spark 試験問題 20
次のコード ブロックのうち、1000 行の DataFrame トランザクション Df からランダムに選択された約 150 行を返すものはどれですか?