Professional-Data-Engineer 試験問題 71

Cloud Machine Learning Engine を使用して自分のコンピュータで TensorFlow トレーニング ジョブを実行するには、コマンドは何で始まりますか?
  • Professional-Data-Engineer 試験問題 72

    あなたの会社はハイブリッド クラウド イニシアティブを持っています。クラウド プロバイダー サービス間でデータを移動し、各クラウド プロバイダーのサービスを利用する複雑なデータ パイプラインがあります。パイプライン全体を調整するにはどのクラウドネイティブ サービスを使用する必要がありますか?
  • Professional-Data-Engineer 試験問題 73

    Cloud Bigtable にデータを保存する場合、保存されるデータの推奨最小量はどれくらいですか?
  • Professional-Data-Engineer 試験問題 74

    MJTelco では、過去のデータの履歴分析を可能にするスキーマを Google Bigtable に作成する必要があります。
    2年間の記録。受信する各レコードは 15 分ごとに送信され、デバイスの一意の識別子とデータ レコードが含まれます。最も一般的なクエリは、特定の日の特定のデバイスのすべてのデータに対するものです。どのスキーマを使用する必要がありますか?
  • Professional-Data-Engineer 試験問題 75

    MJTelco の導入事例
    会社概要
    MJTelco は、急速に成長している世界中の十分なサービスが提供されていない市場にネットワークを構築することを計画している新興企業です。同社は革新的な光通信ハードウェアに関する特許を取得しています。これらの特許に基づいて、安価なハードウェアを使用して信頼性の高い高速バックボーン リンクを多数作成できます。
    会社背景
    経験豊富な通信会社幹部によって設立された MJTelco は、もともと宇宙での通信の課題を克服するために開発されたテクノロジーを使用しています。運用の基礎として、リアルタイム分析を推進し、機械学習を組み込んでトポロジを継続的に最適化する分散データ インフラストラクチャを作成する必要があります。同社のハードウェアは安価であるため、場所の可用性とコストに対する動的な地域政治の影響を考慮して、ネットワークを過剰に展開することを計画しています。
    同社の管理および運用チームは世界中に配置されており、システム内のデータ利用者と提供の間に多対多の関係を構築しています。慎重に検討した結果、パブリック クラウドがニーズをサポートするのに最適な環境であると判断しました。
    ソリューションコンセプト
    MJTelco は、自社の研究所で概念実証 (PoC) プロジェクトを成功させています。彼らには 2 つの主要なニーズがあります。
    PoC を拡張して強化し、より多くのデータ フローが生成されたときに生成される大幅に多くのデータ フローをサポートします。

    インストール数は 50,000 を超えています。
    機械学習サイクルを改良して、制御に使用する動的モデルを検証および改善する

    トポロジ定義。
    MJTelco は、開発/テスト、ステージング、実稼働という 3 つの異なるオペレーティング環境も使用します。
    - 実験の実行、新機能の導入、運用顧客へのサービスのニーズを満たすため。
    ビジネス要件
    最小限のコストで運用環境をスケールアップし、いつでもどこでもリソースをインスタンス化します

    予測不可能な分散型通信ユーザー コミュニティでは必要とされます。
    独自のデータのセキュリティを確保して、最先端の機械学習と分析を保護します。

    分散した研究員が分析用データに確実かつタイムリーにアクセスできるようにする

    機械学習モデルの迅速な反復をサポートする隔離された環境を維持します。

    顧客に影響を与えます。
    技術的要件
    テレメトリ データの安全かつ効率的な転送と保存を確保します。

    インスタンスを迅速に拡張して、複数のフローで 10,000 ~ 100,000 のデータ プロバイダーをサポートします

    各。
    約 2 年間保存されているデータを追跡するデータ テーブルに対する分析とプレゼンテーションが可能

    100m記録/日
    データ パイプラインの問題の認識に重点を置いたモニタリング インフラストラクチャの迅速な反復をサポートします。

    テレメトリ フローと本番環境の学習サイクルの両方で。
    CEOの声明
    当社のビジネス モデルは、特許、分析、動的機械学習に依存しています。当社の安価なハードウェアは信頼性が高くなるように構成されているため、コスト面でのメリットが得られます。信頼性と容量の約束を満たすために、大規模な分散データ パイプラインを迅速に安定させる必要があります。
    CTO ステートメント
    当社のパブリック クラウド サービスは、宣伝どおりに動作する必要があります。データを拡張し、安全に保つためのリソースが必要です。データサイエンティストがモデルを注意深く研究し、迅速に適応できる環境も必要です。私たちは自動化に依存してデータを処理しているため、反復中に機能する開発環境とテスト環境も必要です。
    CFO ステートメント
    プロジェクトが大きすぎるため、データと分析に必要なハードウェアとソフトウェアを維持できません。
    また、非常に多くのデータ フィードを監視するための運用チームに人員を配置する余裕はないため、自動化とインフラストラクチャに依存することになります。Google Cloud の機械学習により、定量的研究者はデータ パイプラインの問題ではなく、価値の高い問題に取り組むことができるようになります。
    MJTelco の Google Cloud Dataflow パイプラインは、50,000 のインストールからデータの受信を開始する準備が整いました。Cloud Dataflow が必要に応じてコンピューティング能力を拡張できるようにしたいと考えています。どの Cloud Dataflow パイプライン構成設定を更新する必要がありますか?