Associate-Developer-Apache-Spark 試験問題 51
Spark の DataFrame に関する次の記述のうち、間違っているものはどれですか?
Associate-Developer-Apache-Spark 試験問題 52
以下に表示されているコード ブロックにはエラーが含まれています。このコード ブロックは、列 predError、productId、および value を除く、DataFrame transactionsDf のすべての列を返すことを目的としています。エラーを見つけます。
DataFrame トランザクションの抜粋Df:
transactionsDf.select(~col("predError"), ~col("productId"), ~col("value"))
DataFrame トランザクションの抜粋Df:
transactionsDf.select(~col("predError"), ~col("productId"), ~col("value"))
Associate-Developer-Apache-Spark 試験問題 53
以下に表示されているコード ブロックには、1 つ以上のエラーが含まれています。コード ブロックは、filePath の場所にある寄木細工のファイルを DataFrame にロードし、以前に変更されたファイルのみをロードする必要があります。
2029-03-20 05:44:46。Spark は、以下に示すスキーマに従ってスキーマを適用する必要があります。エラーを見つけます。
スキーマ:
1.ルート
2. |-- itemId: 整数 (nullable = true)
3. |-- 属性: 配列 (nullable = true)
4. | |-- 要素: 文字列 (containsNull = true)
5. |-- サプライヤー: 文字列 (nullable = true)
コードブロック:
1.schema = StructType([
2. StructType("itemId", IntegerType(), True),
3. StructType("attributes", ArrayType(StringType(), True), True),
4. StructType("サプライヤー", StringType(), True)
5.])
6.
7.spark.read.options("modifiedBefore", "2029-03-20T05:44:46").schema(スキーマ).load(ファイルパス)
2029-03-20 05:44:46。Spark は、以下に示すスキーマに従ってスキーマを適用する必要があります。エラーを見つけます。
スキーマ:
1.ルート
2. |-- itemId: 整数 (nullable = true)
3. |-- 属性: 配列 (nullable = true)
4. | |-- 要素: 文字列 (containsNull = true)
5. |-- サプライヤー: 文字列 (nullable = true)
コードブロック:
1.schema = StructType([
2. StructType("itemId", IntegerType(), True),
3. StructType("attributes", ArrayType(StringType(), True), True),
4. StructType("サプライヤー", StringType(), True)
5.])
6.
7.spark.read.options("modifiedBefore", "2029-03-20T05:44:46").schema(スキーマ).load(ファイルパス)
Associate-Developer-Apache-Spark 試験問題 54
次のコード ブロックのうち、8 つのパーティションを持つ DataFrame transactionsDf をシャッフルするのはどれですか?
10分割?
10分割?
Associate-Developer-Apache-Spark 試験問題 55
以下に表示されているコード ブロックにはエラーが含まれています。以下のコード ブロックが実行されると、列 storeId および transactionDate (この順序で) に基づいて、DataFrame transactionsDf が 14 の部分に分割されているはずです。エラーを見つけます。
コードブロック:
transactionsDf.coalesce(14, ("storeId", "transactionDate"))
コードブロック:
transactionsDf.coalesce(14, ("storeId", "transactionDate"))