Databricks-Certified-Professional-Data-Engineer 試験問題 71
データセットはデルタ ライブ テーブルを使用して定義されており、期待句が含まれています。
1. CONSTRAINT valid_timestamp EXPECT (タイムスタンプ > '2020-01-01')
これらの制約に違反するデータを含むデータのバッチが次のような場合に予想される動作は何ですか?
加工された?
1. CONSTRAINT valid_timestamp EXPECT (タイムスタンプ > '2020-01-01')
これらの制約に違反するデータを含むデータのバッチが次のような場合に予想される動作は何ですか?
加工された?
Databricks-Certified-Professional-Data-Engineer 試験問題 72
現在の ELT パイプラインは運用チームから 1 日に 1 回データを受信しているため、トリガー (Once = True) を使用して 1 日に 1 回実行するように AUTO LOADER プロセスを設定し、1 日に 1 回実行するジョブをスケジュールしました。運用チームは最近、 1 分ごとにデータを送信できる新機能ですが、1 分ごとにデータを処理するには AUTO LOADER にどのような変更を加える必要がありますか。
Databricks-Certified-Professional-Data-Engineer 試験問題 73
Databricks で管理されるクラスターのドライバー ノードとワーカー ノードをホストする場所は次のどれですか?
Databricks-Certified-Professional-Data-Engineer 試験問題 74
CREATE DATABASEsample_db ステートメントを使用してデータベース sample_db を作成する場合、DBFS 内のデータベースのデフォルトの場所はどこになりますか?
Databricks-Certified-Professional-Data-Engineer 試験問題 75
以下のsparkコマンドは、customerIdとcustomerIdがevent_logデルタテーブルに存在する回数に基づいてサマリーテーブルを作成し、サマリーテーブルに1回限りのマイクロバッチを書き込み、空白を埋めてクエリを完了します。
1.スパーク_________
2. .format("デルタ")
3. .table("イベントログ")
4. .groupBy("顧客ID")
5. .count()
6. ._______
7. .format("デルタ")
8. .outputMode("完全")
9. .option("checkpointLocation", "/tmp/delta/eventsByCustomer/_checkpoints/")
10. .トリガー(______)
11. .table("ターゲットテーブル")
1.スパーク_________
2. .format("デルタ")
3. .table("イベントログ")
4. .groupBy("顧客ID")
5. .count()
6. ._______
7. .format("デルタ")
8. .outputMode("完全")
9. .option("checkpointLocation", "/tmp/delta/eventsByCustomer/_checkpoints/")
10. .トリガー(______)
11. .table("ターゲットテーブル")





