[2026-06-05更新,172問] 無料GAQM Databricks-Certified-Data-Engineer-Associate試験問題集、Databricks-Certified-Data-Engineer-Associate勉強方法(ページ 23)

Databricks-Certified-Data-Engineer-Associate 試験問題 106

データエンジニアが、テーブルからデータを読み込み、データを操作し、新しいテーブルにストリーミング書き込みを行うように、構造化ストリーミングジョブを設定しました。
データエンジニアが使用するcadeブロックは以下のとおりです。

データエンジニアが、クエリで5秒ごとにマイクロバッチを実行してデータを処理するだけの場合、空欄を埋めるためにデータエンジニアは次のどのコード行を使用すべきでしょうか？

A. トリガー（"5秒")

B. トリガー()

C. トリガー（1回＝5秒）

D. トリガー(処理時間="5秒")

E. トリガー（連続＝5秒）

Databricks-Certified-Data-Engineer-Associate 試験問題 107

データエンジニアは、次のどのシナリオにおいて、新しい Databricks ジョブタスクの [依存関係] フィールドでタスクを選択すべきでしょうか？

A. 別のタスクを新しいタスクに置き換える必要がある場合

B. 新しいタスクを開始する前に、別のタスクが失敗する必要がある場合

C. 別のタスクが新しいタスクと同じ依存ライブラリを持っている場合

D. 他のタスクが可能な限り少ない計算リソースを使用する必要があるとき

E. 新しいタスクを開始する前に、別のタスクが正常に完了する必要がある場合

正解: E

データエンジニアは、Databricks で、特定の順序で実行される複数のタスクで構成されるマルチタスクジョブを作成できます。各タスクには、1 つ以上の依存関係、つまり現在のタスクの前に実行する必要のある他のタスクを設定できます。新しい Databricks ジョブタスクの [依存関係] フィールドを使用すると、データエンジニアはタスクの依存関係を指定できます。データエンジニアは、選択したタスクが正常に完了した後にのみ新しいタスクを実行したい場合は、[依存関係] フィールドでタスクを選択する必要があります。これにより、データエンジニアは、互いの出力または結果に依存するタスクの論理的なシーケンスを作成できます。たとえば、データエンジニアは、次のタスクで構成されるマルチタスクジョブを作成できます。
* タスク A: Auto Loader を使用してソースからデータを取り込む
* タスク B: Spark SQL を使用してデータを変換する
* タスク C: データを Delta Lake テーブルに書き込む
* タスクD：Spark MLを使用してデータを分析する
* タスク E: Databricks SQL を使用してデータを視覚化する
この場合、データエンジニアは各タスクの依存関係を次のように設定できます。
* タスクA：依存関係なし
* タスクB：タスクAに依存する
* タスクC：タスクBに依存する
* タスクD：タスクCに依存する
* タスクE：タスクDに依存する
こうすることで、データエンジニアは各タスクが前のタスクが正常に完了した後にのみ実行されることを保証でき、データが取り込みから可視化までスムーズに流れるようになります。
他の選択肢は、[依存関係] フィールドでタスクを選択する際の有効なシナリオを説明していないため、誤りです。[依存関係] フィールドは、タスクの以下の側面には影響しません。
* そのタスクを別のタスクに置き換える必要があるかどうか
* 別のタスクを開始する前に、タスクが失敗する必要があるかどうか
* タスクが他のタスクと同じ依存ライブラリを持っているかどうか
* タスクが可能な限り少ないコンピューティングリソースを使用する必要があるかどうか参考資料: マルチタスクジョブの作成、Databricks ジョブで条件付きでタスクを実行する、Databricks ジョブ。

Databricks-Certified-Data-Engineer-Associate 試験問題 108

ある組織はDatabricksでデータパイプラインを実装しており、手動によるクラスタ管理なしに、ワークロードの変化に応じて自動的にスケーリングできることを保証する必要があります。目標は、Databricksがリソースの割り当てと最適化を自動的に処理する中で、高可用性と最小限のダウンタイムを要求する企業のサービスレベル契約（SLA）を満たすことです。
これらの要件を満たすのはどの方法でしょうか？

A. 自動スケーリングを行わず、特定のタスク専用の固定構成のジョブクラスタをデプロイします。

B. スポットインスタンスを使用してリソースを動的に割り当て、コストを最小限に抑えつつ、中断が発生する可能性を排除します。

C. Databricks のインタラクティブクラスターを使用し、ワークロードの要求に基づいてクラスターサイズを手動で調整します。

D. Databricksのサーバーレスコンピューティングを使用して、最小限の手動介入でリソースを自動的にスケーリングおよびプロビジョニングします。

Databricks-Certified-Data-Engineer-Associate 試験問題 109

データエンジニアが、自身のDatabricksアカウントにリンクされたGitHubリポジトリを使用してETLパイプラインのコードを保守しています。このデータエンジニアは、そのETLパイプラインをDatabricksワークフローとして本番環境にデプロイしたいと考えています。
データエンジニアはどちらのアプローチを採用すべきでしょうか？

A. workflow_config.j を維持管理し、Databricks CLI を使用してデプロイします。

B. workflow_conf ig.json を維持し、Terraform を使用してデプロイします。

C. Ulでワークフローを手動で作成および管理する

D. Databricks Asset Bundles (DAB) + GitHub連携

Databricks-Certified-Data-Engineer-Associate 試験問題 110

Pythonファイルは本番環境への導入準備が整っており、クライアントは最も安価で効率的なクラスタタイプを使用したいと考えています。ワークロードは非常に小さく、処理するデータは10GBのみで、単純な結合処理のみを行い、複雑な集計や大規模な変換処理は行いません。
どのクラスターが要件を満たしていますか？

A. Photonが有効なジョブクラスタ

B. スポットインスタンスが有効になっているジョブクラスタ

C. インタラクティブなクラスター

D. スポットインスタンスを使用したジョブクラスタは無効になっています

他のバージョン: 1068GAQM.Databricks-Certified-Data-Engineer-Associate.v2025-09-26.q120; 1069GAQM.Databricks-Certified-Data-Engineer-Associate.v2024-06-19.q89; 477GAQM.Databricks-Certified-Data-Engineer-Associate.v2023-12-11.q16

最新アップロード: 132Databricks.Databricks-Certified-Professional-Data-Engineer.v2026-06-22.q208; 135Oracle.1z0-1054-25.v2026-06-22.q64; 128Fortinet.NSE5_FSW_AD-7.6.v2026-06-22.q41; 120Salesforce.MC-202.v2026-06-22.q57; 121Nutanix.NCA-6.10.v2026-06-22.q43; 141Workday.Workday-Pro-Talent-and-Performance.v2026-06-20.q18; 163Fortinet.NSE4_FGT_AD-7.6.v2026-06-20.q64; 150EMC.D-ISM-FN-01.v2026-06-20.q22; 160F5.F5CAB5.v2026-06-19.q20; 156SAP.C_P2W52_2410.v2026-06-19.q29

Databricks-Certified-Data-Engineer-Associate 試験問題 106

Databricks-Certified-Data-Engineer-Associate 試験問題 107

Databricks-Certified-Data-Engineer-Associate 試験問題 108

Databricks-Certified-Data-Engineer-Associate 試験問題 109

Databricks-Certified-Data-Engineer-Associate 試験問題 110

PDFファイルをダウンロード