Databricks-Certified-Data-Engineer-Associate 試験問題 51

高精度なデータを必要とする企業において、データエンジニアはストリーミングソースとバッチソースの両方からデータを取り込む必要があります。ストリーミング入力を提供するセンサーによって取得されたデータの一部が、想定されるパラメータの範囲外となる場合があります。このような場合、データは破棄する必要がありますが、ストリームは停止してはなりません。Delta Live Tablesのどの機能がこの要件を満たしますか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 52

    データエンジニアは、Python変数day_of_weekが1であり、かつPython変数review_periodがTrueである場合にのみ、Pythonプログラムの最後のブロックを実行したいと考えています。
    データエンジニアは、この条件付き実行コードブロックを開始するために、以下のどの制御フロー文を使用すべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 53

    データエンジニアは、Databricksを使用してKafkaからDelta Lakeテーブルにストリーミングデータを取り込む必要があります。パイプラインは、厳密に1回限りの処理セマンティクスを保証し、障害から復旧するためのチェックポイント情報を維持する必要があります。信頼性の高い処理と耐障害性を保証するSpark Structured Streamingの機能はどれですか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 54

    データエンジニアが、Databricks Asset Bundleを採用する複数のチーム向けに、リポジトリのレイアウトを標準化している。
    エンジニアは、すべてのプロジェクトにおいて、リポジトリのルートにバンドル名、ターゲット、ワークスペース設定、権限、およびリソースマッピング(ジョブとパイプライン用)を定義する単一の権威ある構成ファイルが存在することを保証したいと考えています。
    データエンジニアはこの目標を達成するために、どのような戦略を用いるべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 55

    データエンジニアは、テーブルの毎日の更新を行う際に間違いを犯したことに気づいた。
    彼らはデルタタイムトラベルを使用して、テーブルを3日前のバージョンに復元する必要がある。しかし、データエンジニアが古いバージョンにタイムトラベルしようとすると、データファイルが削除されているため、データを復元できない。
    データファイルが存在しなくなった理由として、次のうちどれが適切でしょうか?