Associate-Developer-Apache-Spark 試験問題 51

Spark の DataFrame に関する次の記述のうち、間違っているものはどれですか?
  • Associate-Developer-Apache-Spark 試験問題 52

    以下に表示されているコード ブロックにはエラーが含まれています。このコード ブロックは、列 predError、productId、および value を除く、DataFrame transactionsDf のすべての列を返すことを目的としています。エラーを見つけます。
    DataFrame トランザクションの抜粋Df:
    transactionsDf.select(~col("predError"), ~col("productId"), ~col("value"))
  • Associate-Developer-Apache-Spark 試験問題 53

    以下に表示されているコード ブロックには、1 つ以上のエラーが含まれています。コード ブロックは、filePath の場所にある寄木細工のファイルを DataFrame にロードし、以前に変更されたファイルのみをロードする必要があります。
    2029-03-20 05:44:46。Spark は、以下に示すスキーマに従ってスキーマを適用する必要があります。エラーを見つけます。
    スキーマ:
    1.ルート
    2. |-- itemId: 整数 (nullable = true)
    3. |-- 属性: 配列 (nullable = true)
    4. | |-- 要素: 文字列 (containsNull = true)
    5. |-- サプライヤー: 文字列 (nullable = true)
    コードブロック:
    1.schema = StructType([
    2. StructType("itemId", IntegerType(), True),
    3. StructType("attributes", ArrayType(StringType(), True), True),
    4. StructType("サプライヤー", StringType(), True)
    5.])
    6.
    7.spark.read.options("modifiedBefore", "2029-03-20T05:44:46").schema(スキーマ).load(ファイルパス)
  • Associate-Developer-Apache-Spark 試験問題 54

    次のコード ブロックのうち、8 つのパーティションを持つ DataFrame transactionsDf をシャッフルするのはどれですか?
    10分割?
  • Associate-Developer-Apache-Spark 試験問題 55

    以下に表示されているコード ブロックにはエラーが含まれています。以下のコード ブロックが実行されると、列 storeId および transactionDate (この順序で) に基づいて、DataFrame transactionsDf が 14 の部分に分割されているはずです。エラーを見つけます。
    コードブロック:
    transactionsDf.coalesce(14, ("storeId", "transactionDate"))