Databricks-Certified-Data-Engineer-Associate 試験問題 106

データエンジニアが、テーブルからデータを読み込み、データを操作し、新しいテーブルにストリーミング書き込みを行うように、構造化ストリーミングジョブを設定しました。
データエンジニアが使用するcadeブロックは以下のとおりです。

データエンジニアが、クエリで5秒ごとにマイクロバッチを実行してデータを処理するだけの場合、空欄を埋めるためにデータエンジニアは次のどのコード行を使用すべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 107

    データエンジニアは、次のどのシナリオにおいて、新しい Databricks ジョブタスクの [依存関係] フィールドでタスクを選択すべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 108

    ある組織はDatabricksでデータパイプラインを実装しており、手動によるクラスタ管理なしに、ワークロードの変化に応じて自動的にスケーリングできることを保証する必要があります。目標は、Databricksがリソースの割り当てと最適化を自動的に処理する中で、高可用性と最小限のダウンタイムを要求する企業のサービスレベル契約(SLA)を満たすことです。
    これらの要件を満たすのはどの方法でしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 109

    データエンジニアが、自身のDatabricksアカウントにリンクされたGitHubリポジトリを使用してETLパイプラインのコードを保守しています。このデータエンジニアは、そのETLパイプラインをDatabricksワークフローとして本番環境にデプロイしたいと考えています。
    データエンジニアはどちらのアプローチを採用すべきでしょうか?
  • Databricks-Certified-Data-Engineer-Associate 試験問題 110

    Pythonファイルは本番環境への導入準備が整っており、クライアントは最も安価で効率的なクラスタタイプを使用したいと考えています。ワークロードは非常に小さく、処理するデータは10GBのみで、単純な結合処理のみを行い、複雑な集計や大規模な変換処理は行いません。
    どのクラスターが要件を満たしていますか?