Professional-Data-Engineer 試験問題 181

データ サイエンティストが BigQuery ML モデルを作成し、予測を提供するための ML パイプラインを作成するように依頼しました。
レイテンシが 100 ミリ秒未満の個々のユーザー ID の予測を提供する必要がある REST API アプリケーションがあります。予測を生成するには、次のクエリを使用します: SELECT expected_label, user_id FROM ML.PREDICT (MODEL 'dataset.model', table user_features)。ML パイプラインはどのように作成すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 182

    あなたの会社はGCPとのハイブリッド展開を維持しており、匿名化された顧客データに対して分析が実行されます。
    a. データは、GCP で稼働しているデータ転送サーバーへの並列アップロードを通じて、データセンターから Cloud Storage にインポートされます。管理者から、毎日の転送に時間がかかりすぎるため、
    問題を解決するように求められました。転送速度を最大化したいと考えています。どのようなアクションを実行する必要がありますか?
  • Professional-Data-Engineer 試験問題 183

    Cloud Storage バケットに存在する Apache Hive パーティション分割データ用の外部テーブルを作成しました。このバケットには多数のファイルが含まれています。このテーブルに対するクエリが遅いことに気付きました。これらのクエリのパフォーマンスを改善したいと考えています。どうすればよいでしょうか。
  • Professional-Data-Engineer 試験問題 184

    You work for a shipping company that uses handheld scanners to read shipping labels. Your company has strict data privacy standards that require scanners to only transmit recipients' personally identifiable information (PII) to analytics systems, which violates user privacy rules. You want to quickly build a scalable solution using cloud-native managed services to prevent exposure of PII to the analytics systems.
    What should you do?
  • Professional-Data-Engineer 試験問題 185

    機械学習データセットをトレーニング データとテスト データに分割する必要があるのはなぜですか?