Associate-Developer-Apache-Spark 試験問題 26

次のコードブロックのどれが、列productIdの値が一意であるDataFrametransactionsDfからの行のみを返しますか?
  • Associate-Developer-Apache-Spark 試験問題 27

    それぞれ列productIdとitemIdのDataFrametransactionsDfとitemsDfの内部結合の結果として、DataFrameの列値で空ではないレコードの数を返すために、以下に示すコードブロックをどの順序で実行する必要がありますか?
    1. .filter(〜isnull(col('value')))
    2. .count()
    3.transactionsDf.join(itemsDf、col( "transactionsDf.productId")== col( "itemsDf.itemId"))
    4.transactionsDf.join(itemsDf、transactionsDf.productId == itemsDf.itemId、how ='inner')
    5. .filter(col('value')。isnotnull())
    6. .sum(col('value'))
  • Associate-Developer-Apache-Spark 試験問題 28

    以下に表示されるコードブロックには、1つ以上のエラーが含まれています。コードブロックは、filePathの場所にある寄木細工のファイルをDataFrameにロードし、以前に変更されたファイルのみをロードする必要があります。
    2029-03-2005:44:46。Sparkは、以下に示すスキーマに従ってスキーマを適用する必要があります。エラーを見つけます。
    スキーマ:
    1.root
    2. |-itemId:整数(null許容= true)
    3. |-属性:配列(nullable = true)
    4. | |-要素:文字列(containsNull = true)
    5. |-サプライヤ:文字列(null許容= true)
    コードブロック:
    1.schema = StructType([
    2. StructType( "itemId"、IntegerType()、True)、
    3. StructType( "attributes"、ArrayType(StringType()、True)、True)、
    4. StructType( "supplier"、StringType()、True)
    5.])
    6.6。
    7.spark.read.options( "modifiedBefore"、 "2029-03-20T05:44:46")。schema(schema).load(filePath)
  • Associate-Developer-Apache-Spark 試験問題 29

    次のうち、狭い変換について説明しているのはどれですか?
  • Associate-Developer-Apache-Spark 試験問題 30

    以下に示すコードブロックは、filePathの場所に保存されているCSVファイルの列数を返す必要があります。
    CSVファイルからは、#文字で始まらない行のみを読み取る必要があります。これを実現するには、コードブロックの空白を正しく埋める答えを選択してください。
    コードブロック:
    __1 __(__ 2 __.__ 3 __。csv(filePath、__4 __).__ 5__)