[2023-09-15更新,214問] 無料Google Professional-Data-Engineer試験問題集、Professional-Data-Engineer練習問題(ページ 8)

Professional-Data-Engineer 試験問題 31

組織は、ユーザーレベルのデータを含むテーブルを含む Google BigQuery データセットを管理しています。彼らは、ユーザーレベルのデータへのアクセスを制御しながら、このデータの集約を他の Google Cloud プロジェクトに公開したいと考えています。さらに、全体的なストレージコストを最小限に抑え、他のプロジェクトの分析コストがそれらのプロジェクトに確実に割り当てられるようにする必要があります。彼らは何をすべきでしょうか？

A. 集計結果を提供する承認されたビューを作成して共有します。

B. 新しいデータセットと集計結果を提供するビューを作成して共有します。

C. 新しいデータセットと集計結果を含むテーブルを作成して共有します。

D. データセットに dataViewer Identity and Access Management (IAM) ロールを作成して、共有を有効にします。

Professional-Data-Engineer 試験問題 32

BigQuery によって処理される行数を減らすために使用できる方法はどれですか?

A. テーブルを複数のテーブルに分割します。データをパーティションに入れる

B. テーブルを複数のテーブルに分割します。データをパーティションに配置する。LIMIT句を使用する

C. データをパーティションに配置します。LIMIT句を使用する

D. テーブルを複数のテーブルに分割します。LIMIT句を使用する

Professional-Data-Engineer 試験問題 33

Cloud Datastore を使用して車両テレメトリデータをリアルタイムで取り込むことにしました。コストを低く抑えながら、長期的なデータの増加に対応できるストレージシステムを構築したいと考えています。また、ポイントインタイム（PIT）リカバリを作成したり、別の環境で Cloud Datastore 用にデータのコピーを作成したりできるように、データのスナップショットを定期的に作成したいと考えています。これらのスナップショットを長期間アーカイブしたいと考えています。
これを達成できる 2 つの方法はどれですか? 答えを 2 つ選択してください。

A. マネージドエクスポートを使用し、Nearline または Coldline クラスを使用してデータを Cloud Storage バケットに保存します。

B. マネージドエクスポートを使用し、そのエクスポート用に予約された一意の名前空間にある別のプロジェクトの Cloud Datastore にインポートします。

C. マネージドエクスポートを使用し、そのエクスポート専用に作成された BigQuery テーブルにデータをインポートし、一時エクスポートファイルを削除します。

D. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。BigQuery ストリーミング挿入により、各エンティティを BigQuery テーブル行として扱います。エクスポートごとにエクスポートタイムスタンプを割り当て、それを各行の追加列として添付します。BigQuery テーブルがエクスポートタイムスタンプ列を使用してパーティション化されていることを確認してください。

E. Cloud Datastore クライアントライブラリを使用してすべてのエンティティを読み取るアプリケーションを作成します。エクスポートされたデータを JSON ファイルにフォーマットします。データを Cloud Source Repositories に保存する前に圧縮を適用します。

Professional-Data-Engineer 試験問題 34

Cloud Bigtable に依存するパフォーマンステストを実行している場合は、以下の 1 つを除くすべての選択肢が推奨される手順です。推奨されない手順はどれですか?

A. 実稼働インスタンスを使用しないでください。

B. テストを少なくとも 10 分間実行します。

C. テストする前に、数分間の激しい事前テストを実行します。

D. 300 GB 以上のデータを使用します。

Professional-Data-Engineer 試験問題 35

あなたは自然言語処理ドメインで回帰問題に取り組んでおり、データセットには 1 億個のラベル付きサンプルがあります。データをランダムにシャッフルし、データセットをトレーニングサンプルとテストサンプルに (90/10 の比率で) 分割しました。ニューラルネットワークをトレーニングし、テストセットでモデルを評価した後、モデルの二乗平均平方根誤差 (RMSE) がトレーニングセットではテストセットの 2 倍であることがわかりました。モデルのパフォーマンスを向上するにはどうすればよいでしょうか?

A. トレーニングとテストの分割におけるテストサンプルのシェアを増やします。

B. 過剰適合を避けるために、正則化手法 (バッチ正規化のドロップアウトなど) を試してください。

C. より多くのデータを収集し、データセットのサイズを増やしてみます。

D. 追加のレイヤーを導入するか、使用される語彙や N グラムのサイズを増やすなどして、モデルの複雑さを増やします。

他のバージョン: 158Google.Professional-Data-Engineer.v2025-12-29.q327; 1455Google.Professional-Data-Engineer.v2025-01-13.q310; 1483Google.Professional-Data-Engineer.v2024-06-07.q281; 1699Google.Professional-Data-Engineer.v2022-11-23.q197

最新アップロード: 158Google.Professional-Data-Engineer.v2025-12-29.q327; 112SAP.C_ARP2P_2508.v2025-12-29.q29; 110Appian.ACD201.v2025-12-29.q36; 226ServiceNow.CIS-HAM.v2025-12-27.q212; 160Pegasystems.PEGACPBA24V1.v2025-12-27.q118; 151Microsoft.DP-700.v2025-12-27.q84; 114EXIN.CITM.v2025-12-26.q18; 119Microsoft.GH-100.v2025-12-26.q24; 139PennsylvaniaRealEstateCommission.RePA_Sales_S.v2025-12-26.q37; 117SAP.C_BCBTM_2502.v2025-12-25.q10

Professional-Data-Engineer 試験問題 31

Professional-Data-Engineer 試験問題 32

Professional-Data-Engineer 試験問題 33

Professional-Data-Engineer 試験問題 34

Professional-Data-Engineer 試験問題 35

PDFファイルをダウンロード