Databricks-Certified-Data-Engineer-Associate 試験問題 31
データエンジニアが、複数のテーブルからデータエンティティを作成したいと考えています。このデータエンティティは、他のセッションで他のデータエンジニアによって使用される必要があり、また物理的な場所に保存される必要もあります。
データエンジニアは、以下のどのデータエンティティを作成すべきでしょうか?
データエンジニアは、以下のどのデータエンティティを作成すべきでしょうか?
Databricks-Certified-Data-Engineer-Associate 試験問題 32
データエンジニアが、中央のGitリポジトリからクローンしたDatabricksリポジトリでコードを実行しています。データエンジニアの同僚から、変更が加えられ、中央のGitリポジトリに同期されたとの連絡がありました。データエンジニアは、中央のGitリポジトリから変更を取り込むために、自身のDatabricksリポジトリを同期する必要があります。
データエンジニアがこのタスクを完了するために実行する必要があるGit操作は次のうちどれですか?
データエンジニアがこのタスクを完了するために実行する必要があるGit操作は次のうちどれですか?
Databricks-Certified-Data-Engineer-Associate 試験問題 33
制約違反が発生した場合の ON VIOLATION DROP ROW および ON VIOLATION FAIL UPDATE の影響を特定します。
データエンジニアが、Delta Liveテーブルを使用して会社の出張費精算の詳細を管理するETLパイプラインを作成しました。従業員が場所の詳細を提供していない場合は、パイプラインを終了する必要があることを確認したいと考えています。
このシナリオはどのように実現できますか?
データエンジニアが、Delta Liveテーブルを使用して会社の出張費精算の詳細を管理するETLパイプラインを作成しました。従業員が場所の詳細を提供していない場合は、パイプラインを終了する必要があることを確認したいと考えています。
このシナリオはどのように実現できますか?
Databricks-Certified-Data-Engineer-Associate 試験問題 34
データエンジニアが、クラウドストレージを利用するDatabricksプロジェクトに取り組んでいます。データエンジニアは、ストレージアカウントにJSONファイルが到着したらすぐに、ストレージアカウント上のコンテナから複数のJSONファイルをロードしたいと考えています。Pythonを使用して、まずファイルをデータフレームにロードし、期待どおりに動作していることを確認するには、データエンジニアはどのような構文を使用すればよいでしょうか?
Databricks-Certified-Data-Engineer-Associate 試験問題 35
データエンジニアは、毎晩実行される複数のタスクを含むジョブを持っています。クラスターの起動に時間がかかるため、各タスクの実行速度が遅くなります。
データエンジニアは、ジョブで使用されるクラスターの起動時間を改善するために、次のうちどの操作を実行できますか?
データエンジニアは、ジョブで使用されるクラスターの起動時間を改善するために、次のうちどの操作を実行できますか?
