Databricks-Certified-Data-Engineer-Associate 試験問題 126

データエンジニアがデータパイプラインの保守管理を行っています。データを取り込んだ際、データエンジニアはソースデータの品質が低下し始めていることに気づきました。そこで、データエンジニアは品質レベルの監視プロセスを自動化したいと考えています。
データエンジニアは、この問題を解決するために、以下のどのツールを使用できますか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 127

    データエンジニアは、構成可能なテーブルからデータを読み取るためのバッチ取り込みパイプラインの一部として、次のコードブロックを使用しています。

    トランザクションテーブルがストリームソースである場合にこのコードブロックが正しく動作するようにするには、次のうちどの変更を行う必要がありますか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 128

    データエンジニアは、Databricks Notebooksに組み込まれているバージョン管理機能を使用するか、Databricks Reposを使用してプロジェクトのバージョン管理を行うかを決定する必要があります。
    Databricks Reposを使用する利点として、Databricks Notebooksのバージョン管理と比較した場合、次のうちどれが挙げられますか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 129

    データエンジニアが、テーブルからデータを読み込み、データを操作し、新しいテーブルにストリーミング書き込みを行うように、構造化ストリーミングジョブを設定しました。
    データエンジニアが使用するcadeブロックは以下のとおりです。

    データエンジニアが、クエリで5秒ごとにマイクロバッチを実行してデータを処理するだけの場合、空欄を埋めるためにデータエンジニアは次のどのコード行を使用すべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 130

    Delta Live Tablesを使用してデータセットが定義されており、期待値句が含まれています。
    CONSTRAINT valid_timestamp EXPECT (timestamp > '2020-01-01') ON VIOLATION FAIL UPDATE これらの制約に違反するデータを含むデータバッチが処理された場合、どのような動作が期待されますか?