Associate-Developer-Apache-Spark 試験問題 31

以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、パスパスにあるDataFrametransactionsDfを寄木細工のファイルとして保存し、既存の寄木細工のファイルに追加する必要があります。エラーを見つけます。
コードブロック:
  • Associate-Developer-Apache-Spark 試験問題 32

    以下に示すコードブロックを実行して、列storeIdおよびproductIdごとのDataFrametransactionsDfの列predErrorの平均を示すDataFrameを作成する必要があります。ここで、productIdは2または3のいずれかであり、返されたDataFrameは昇順で並べ替えられます。列storeIdで並べ替え、その列にnullを除外しますか?
    DataFrametransactionsDf:
    1。+-------------+ --------- + ----- + ------- + --------- + ---- +
    2. | transactionId | predError | value | storeId | productId | f |
    3. + ------------- + --------- + ----- + ------- + --------- + ---- +
    4. | 1 | 3 | 4 | 25 | 1 | null |
    5. | 2 | 6 | 7 | 2 | 2 | null |
    6. | 3 | 3 | null | 25 | 3 | null |
    7. | 4 | null | null | 3 | 2 | null |
    8. | 5 | null | null | null | 2 | null |
    9. | 6 | 3 | 2 | 25 | 2 | null |
    10. + ------------- + --------- + ----- + ------- + --------- + ---- +
    1. .mean( "predError")
    2. .groupBy( "storeId")
    3. .orderBy( "storeId")
    4.transactionsDf.filter(transactionsDf.storeId.isNotNull())
    5. .pivot( "productId"、[2、3])
  • Associate-Developer-Apache-Spark 試験問題 33

    以下に示すコードブロックは、DataFrameトランザクションDfを2つの異なるエグゼキュータに格納し、エグゼキュータのメモリを可能な限り利用しますが、ディスクには何も書き込みません。これを実現するには、コードブロックの空白を正しく埋める答えを選択してください。
    1.pysparkからインポートStorageLevel
    2.transactionsDf .__ 1 __(StorageLevel .__ 2 __).__ 3__
  • Associate-Developer-Apache-Spark 試験問題 34

    次のコードブロックのうち、列名とタイプの両方を含むツリーのような方法でDataFrameの構造を示しているのはどれですか?
  • Associate-Developer-Apache-Spark 試験問題 35

    以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、DataFrameitemsDfを列itemIdのより大きなDataFrametransactionsDfと結合することを目的としています。エラーを見つけます。
    コードブロック:
    transactionDf.join(itemsDf、 "itemId"、how = "broadcast")