[2024-07-10更新,88問] 無料Databricks Databricks-Certified-Professional-Data-Engineer試験問題集、Databricks-Certified-Professional-Data-Engineer受験記(ページ 2)

Databricks-Certified-Professional-Data-Engineer 試験問題 1

AUTO LOADER を使用しているときに、ロードの一部として推論された列のほとんどが、整数であるはずの列を含む文字列データ型であることに気づきました。これを修正するにはどうすればよいでしょうか?

A. cloudfiles.schemalocation にソーステーブルのスキーマを指定します。

B. cloudfiles.schemalocation にターゲットテーブルのスキーマを指定します。

C. スキーマのヒントを提供します

D. チェックポイントの場所を更新します

E. データ型を明示的にキャストして受信データを修正します。

Databricks-Certified-Professional-Data-Engineer 試験問題 2

データアーキテクトは、Lakehouse 内のすべてのテーブルを外部 (「アンマネージド」とも呼ばれる) Delta Lake テーブルとして構成することを義務付けています。
この要件を確実に満たせるのはどのアプローチですか?

A. データベースの作成時に、LOCATION キーワードが使用されていることを確認してください。

B. すべてのテーブルストレージに対して外部データウェアハウスを構成する場合は、すべての ELT に対して Databricks を利用します。

C. データをテーブルに保存するときは、デルタ形式とともに完全なファイルパスが指定されていることを確認してください。

D. テーブルを作成するときは、CREATE TABLE ステートメントで EXTERNAL キーワードが使用されていることを確認してください。

E. ワークスペースを構成するときは、外部クラウドオブジェクトストレージがマウントされていることを確認してください。

Databricks-Certified-Professional-Data-Engineer 試験問題 3

各ビジュアライゼーションには入力するデータが大量に含まれているため、ブラウザーへの読み込みに時間がかかるダッシュボードに取り組んでいます。この問題に対処するには、次のどのアプローチを使用できますか?

A. SQL エンドポイントクラスターのサイズを増やす

B. SQL エンドポイントクラスターの最大範囲のスケールを増加します。

C. Databricks SQL クエリフィルターを使用して、各ビジュアライゼーションのデータ量を制限します。

D. Delta Lake からデータを削除します

E. デルタキャッシュを使用して中間結果を保存します

Databricks-Certified-Professional-Data-Engineer 試験問題 4

ユーザーからのコンテンツ投稿に関するメタデータを表す Delta Lake テーブルには、次のスキーマがあります。
user_id LONG、post_text STRING、post_id STRING、経度 FLOAT、緯度 FLOAT、post_time TIMESTAMP、date DATE このテーブルは日付列によってパーティション化されています。クエリは次のフィルターを使用して実行されます。
経度 < 20 & 経度 > -20
データがどのようにフィルタリングされるかを説明するステートメントはどれですか?

A. デルタログの統計は、フィルターされた範囲にファイルが含まれる可能性のあるパーティションを識別するために使用されます。

B. オプティマイザはパーティション列と経度の関係を認識していないため、ファイルのスキップは発生しません。

C. デルタエンジンは、トランザクションログの行レベルの統計を使用して、フィルター基準を満たすフライを識別します。

D. デルタログの統計は、フィルターされた範囲内のレコードを含む可能性のあるデータファイルを識別するために使用されます。

E. デルタエンジンは寄木細工のファイルフッターをスキャンして、フィルター基準を満たす各行を識別します。

Databricks-Certified-Professional-Data-Engineer 試験問題 5

データサイエンスチームは、ユーザーレビューからの自由形式テキストに対するクエリを高速化するための支援を要求しました。
データは現在、以下のスキーマを使用して Parquet に保存されています。
item_id INT、user_id INT、review_id INT、評価 FLOAT、レビュー STRING
レビュー欄には、ユーザーが残したレビューの全文が表示されます。具体的には、データサイエンスチームは、この分野に 30 のキーワードのいずれかが存在するかどうかを特定しようとしています。
若手のデータエンジニアは、このデータを Delta Lake に変換するとクエリのパフォーマンスが向上すると提案しています。
ジュニアデータエンジニアの提案に対する正しい回答はどれですか?

A. Delta Lake の統計は、カーディナリティの高いフリーテキストフィールドに対しては最適化されていません。

B. テキストデータは Delta Lake に保存できません。

C. パフォーマンスの向上を確認するには、ZORDER ON レビューを実行する必要があります。

D. デルタログは、選択的フィルタリングをサポートするためにフリーテキストフィールドの用語マトリックスを作成します。

E. Delta Lake 統計は、テーブルの最初の 4 列についてのみ収集されます。

他のバージョン: 644Databricks.Databricks-Certified-Professional-Data-Engineer.v2026-06-22.q208; 1260Databricks.Databricks-Certified-Professional-Data-Engineer.v2024-09-16.q115; 1185Databricks.Databricks-Certified-Professional-Data-Engineer.v2023-11-18.q93

最新アップロード: 121Oracle.1Z0-184-25.v2026-07-28.q21; 160Salesforce.Salesforce-Associate.v2026-07-28.q106; 176PaloAltoNetworks.NGFW-Engineer.v2026-07-27.q101; 133EXIN.CDFOM.v2026-07-27.q25; 129Huawei.H19-401_V2.0.v2026-07-27.q23; 264EC-COUNCIL.212-89.v2026-07-25.q191; 269Salesforce.Plat-Admn-202.v2026-07-25.q104; 264Salesforce.Sharing-and-Visibility-Architect.v2026-07-24.q80; 298CrowdStrike.CCFA-200b.v2026-07-24.q108; 303Splunk.SPLK-1002.v2026-07-24.q218

Databricks-Certified-Professional-Data-Engineer 試験問題 1

Databricks-Certified-Professional-Data-Engineer 試験問題 2

Databricks-Certified-Professional-Data-Engineer 試験問題 3

Databricks-Certified-Professional-Data-Engineer 試験問題 4

Databricks-Certified-Professional-Data-Engineer 試験問題 5

PDFファイルをダウンロード