Associate-Developer-Apache-Spark 試験問題 31
以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、パスパスにあるDataFrametransactionsDfを寄木細工のファイルとして保存し、既存の寄木細工のファイルに追加する必要があります。エラーを見つけます。
コードブロック:
コードブロック:
Associate-Developer-Apache-Spark 試験問題 32
以下に示すコードブロックを実行して、列storeIdおよびproductIdごとのDataFrametransactionsDfの列predErrorの平均を示すDataFrameを作成する必要があります。ここで、productIdは2または3のいずれかであり、返されたDataFrameは昇順で並べ替えられます。列storeIdで並べ替え、その列にnullを除外しますか?
DataFrametransactionsDf:
1。+-------------+ --------- + ----- + ------- + --------- + ---- +
2. | transactionId | predError | value | storeId | productId | f |
3. + ------------- + --------- + ----- + ------- + --------- + ---- +
4. | 1 | 3 | 4 | 25 | 1 | null |
5. | 2 | 6 | 7 | 2 | 2 | null |
6. | 3 | 3 | null | 25 | 3 | null |
7. | 4 | null | null | 3 | 2 | null |
8. | 5 | null | null | null | 2 | null |
9. | 6 | 3 | 2 | 25 | 2 | null |
10. + ------------- + --------- + ----- + ------- + --------- + ---- +
1. .mean( "predError")
2. .groupBy( "storeId")
3. .orderBy( "storeId")
4.transactionsDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot( "productId"、[2、3])
DataFrametransactionsDf:
1。+-------------+ --------- + ----- + ------- + --------- + ---- +
2. | transactionId | predError | value | storeId | productId | f |
3. + ------------- + --------- + ----- + ------- + --------- + ---- +
4. | 1 | 3 | 4 | 25 | 1 | null |
5. | 2 | 6 | 7 | 2 | 2 | null |
6. | 3 | 3 | null | 25 | 3 | null |
7. | 4 | null | null | 3 | 2 | null |
8. | 5 | null | null | null | 2 | null |
9. | 6 | 3 | 2 | 25 | 2 | null |
10. + ------------- + --------- + ----- + ------- + --------- + ---- +
1. .mean( "predError")
2. .groupBy( "storeId")
3. .orderBy( "storeId")
4.transactionsDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot( "productId"、[2、3])
Associate-Developer-Apache-Spark 試験問題 33
以下に示すコードブロックは、DataFrameトランザクションDfを2つの異なるエグゼキュータに格納し、エグゼキュータのメモリを可能な限り利用しますが、ディスクには何も書き込みません。これを実現するには、コードブロックの空白を正しく埋める答えを選択してください。
1.pysparkからインポートStorageLevel
2.transactionsDf .__ 1 __(StorageLevel .__ 2 __).__ 3__
1.pysparkからインポートStorageLevel
2.transactionsDf .__ 1 __(StorageLevel .__ 2 __).__ 3__
Associate-Developer-Apache-Spark 試験問題 34
次のコードブロックのうち、列名とタイプの両方を含むツリーのような方法でDataFrameの構造を示しているのはどれですか?
Associate-Developer-Apache-Spark 試験問題 35
以下に表示されるコードブロックにはエラーが含まれています。コードブロックは、DataFrameitemsDfを列itemIdのより大きなDataFrametransactionsDfと結合することを目的としています。エラーを見つけます。
コードブロック:
transactionDf.join(itemsDf、 "itemId"、how = "broadcast")
コードブロック:
transactionDf.join(itemsDf、 "itemId"、how = "broadcast")