Professional-Data-Engineer 試験問題 141
御社では、多数のニューロンと層を持つTensorFlowニューラルネットワークモデルを構築しました。このモデルはトレーニングデータには良好に適合しています。しかし、新しいデータでテストするとパフォーマンスが低下します。この問題を解決するには、どのような方法がありますか?
Professional-Data-Engineer 試験問題 142
BigQueryオンデマンド環境を管理しています。ビジネスインテリジェンスツールは、大規模な(50TB)販売履歴ファクトテーブルを日単位と月単位で集計するクエリを毎日数百件送信しています。これらのクエリの応答時間が遅く、予想を超えるコストが発生しています。応答時間を短縮し、クエリコストを削減し、メンテナンスを最小限に抑える必要があります。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 143
Cloud Storage にデータを保存するアプリケーションのアーキテクチャを設計しています。アプリケーションは、生データを含む Cloud Storage バケットからデータを読み取り、処理後に別のバケットに書き込むパイプラインで構成されています。Google Cloud のリージョンで障害が発生した場合でも、復元力のある Cloud Storage リソースを備えたアーキテクチャを設計したいと考えています。障害発生時の復旧ポイント目標(RPO)を最小限に抑えつつ、保存されたデータを使用するアプリケーションに影響を与えないようにしたいと考えています。どうすればよいでしょうか?
Professional-Data-Engineer 試験問題 144
メディアストリーミングサービスであるモバイルアプリケーション用の新しいストレージシステムをデプロイしています。最適なのはGoogle Cloud Datastoreだと判断しました。複数のプロパティを持つエンティティがあり、その中には複数の値を取ることができるものもあります。例えば、エンティティ「Movie」では、プロパティ「actors」とプロパティ「tags」は複数の値を取ることができますが、プロパティ「date released」は複数の値を取ることができません。一般的なクエリでは、actor=<actorname>を持つすべての映画をdate_released順に並べるか、tag=Comedyを持つすべての映画をdate_released順に並べるかのいずれかになります。インデックス数の組み合わせ爆発をどのように回避すればよいでしょうか?




Professional-Data-Engineer 試験問題 145
Google Dataflow SDK を使用してソフトウェア アプリケーションを開発しており、条件分岐、for ループ、その他の複雑なプログラミング構造を使用して分岐パイプラインを作成したいと考えています。データ処理操作にはどのコンポーネントを使用しますか?
