Professional-Data-Engineer 試験問題 31

あなたは、Google Cloud 上のレコメンデーション エンジンを使用するアプリケーションを開発しています。ソリューションでは、過去の視聴に基づいて新しい動画を顧客に表示する必要があります。ソリューションでは、顧客が視聴したビデオ内のエンティティのラベルを生成する必要があります。設計では、数 TB のデータに関する他の顧客の好みのデータに基づいて、非常に高速なフィルタリング提案を提供できる必要があります。
a.あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 32

    あなたは、不動産物件を含む利用可能なデータセットに基づいて住宅価格を予測するモデルをトレーニングしています。
    完全に接続されたニューラル ネットワークをトレーニングする計画があり、データセットに土地の緯度と経度が含まれていることを発見しました。不動産の専​​門家は、物件の位置が価格に大きく影響すると言っているため、この物理的な依存関係を組み込んだ機能を設計したいと考えています。
    あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 33

    金融サービス会社はクラウド テクノロジーに移行しており、50 TB の財務時系列データをクラウドに保存したいと考えています。このデータは頻繁に更新され、新しいデータが常にストリーミングされます。
    あなたの会社は、既存の Apache Hadoop ジョブをクラウドに移行して、このデータについての洞察を得たいと考えています。データの保存にはどの製品を使用する必要がありますか?
  • Professional-Data-Engineer 試験問題 34

    時系列指標を集計して Cloud Bigtable に書き込む Cloud Dataflow ジョブを含むデータ パイプラインがあります。このデータは、組織全体の何千人ものユーザーが使用するダッシュボードにフィードされます。追加の同時ユーザーをサポートし、データの書き込みに必要な時間を短縮する必要があります。どの 2 つのアクションを取る必要がありますか? (2つお選びください。)
  • Professional-Data-Engineer 試験問題 35

    データ サイエンティストが BigQuery ML モデルを作成したので、予測を提供する ML パイプラインを作成するように依頼されました。
    遅延が 100 ミリ秒未満で個々のユーザー ID の予測を提供するという要件を持つ REST API アプリケーションがあります。予測を生成するには、次のクエリを使用します: SELECTdicted_label, user_id FROM ML.PREDICT (MODEL 'dataset.model', table user_features)。ML パイプラインはどのように作成すればよいでしょうか?