Professional-Data-Engineer 試験問題 136

あるオンライン小売業者は、現在のアプリケーションを Google App Engine 上に構築しました。同社の新しい取り組みでは、顧客がアプリケーションを介して直接取引できるようにアプリケーションを拡張することが義務付けられています。
ビジネス インテリジェンス (BI) ツールを使用して、ショッピング トランザクションを管理し、複数のデータセットからの結合データを分析する必要があります。彼らは、この目的のために単一のデータベースのみを使用したいと考えています。どの Google Cloud データベースを選択すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 137

    フローロジスティックのケーススタディ
    会社概要
    Flowlogistic は、物流およびサプライ チェーンの大手プロバイダーです。これらは、世界中の企業がリソースを管理し、最終目的地に輸送するのに役立ちます。同社は急速に成長し、そのサービスを鉄道、トラック、航空機、海洋輸送にまで拡大しました。
    会社背景
    同社は地域のトラック運送会社としてスタートし、その後他の物流市場にも拡大しました。インフラストラクチャを更新していないため、注文と出荷の管理と追跡がボトルネックになっています。業務を改善するために、Flowlogistic は荷物レベルでリアルタイムに出荷を追跡する独自のテクノロジーを開発しました。ただし、Apache Kafka に基づくテクノロジー スタックが処理量をサポートできないため、これをデプロイすることはできません。さらに、Flowlogistic は注文と出荷をさらに分析して、リソースを最適に配置する方法を決定したいと考えています。
    ソリューションコンセプト
    Flowlogistic は、クラウドを使用して 2 つのコンセプトを実装したいと考えています。
    * 独自のテクノロジーをリアルタイム在庫追跡システムに使用し、荷物の位置を示します
    * 構造化データと非構造化データの両方を含むすべての注文と出荷ログの分析を実行し、リソースを展開する最適な方法と情報を拡大する市場を決定します。また、予測分析を使用して、出荷がいつ遅れるかを早期に把握したいと考えています。
    既存の技術環境
    フローロジスティック アーキテクチャは単一のデータ センターに存在します。
    * データベース
    * 2 つのクラスターに 8 台の物理サーバー
    * SQL Server - ユーザー データ、インベントリ、静的データ
    * 物理サーバー 3 台
    * Cassandra - メタデータ、メッセージの追跡
    10 台の Kafka サーバー - メッセージの集約とバッチ挿入の追跡
    * アプリケーションサーバー - 顧客フロントエンド、注文/カスタム用ミドルウェア
    * 20 台の物理サーバーにわたる 60 台の仮想マシン
    * Tomcat - Java サービス
    * Nginx - 静的コンテンツ
    * バッチサーバー
    ストレージ アプライアンス
    * 仮想マシン (VM) ホスト用の iSCSI
    * ファイバー チャネル ストレージ エリア ネットワーク (FC SAN) - SQL サーバー ストレージ
    * ネットワーク接続ストレージ (NAS) イメージストレージ、ログ、バックアップ
    * 10 台の Apache Hadoop /Spark サーバー
    * コアデータレイク
    * データ分析ワークロード
    * 20 のさまざまなサーバー
    * Jenkins、モニタリング、要塞ホスト、
    ビジネス要件
    * スケールされた本番環境を使用して、信頼性が高く再現可能な環境を構築します。
    * 分析のために一元化されたデータレイクにデータを集約します
    * 履歴データを使用して、将来の出荷に関する予測分析を実行します
    * 独自のテクノロジーを使用して世界中のすべての出荷を正確に追跡します
    * 新しいリソースの迅速なプロビジョニングにより、ビジネスの機敏性とイノベーションの速度を向上させます。
    * クラウドでのパフォーマンスのためにアーキテクチャを分析して最適化する
    * 他のすべての要件が満たされている場合は、クラウドに完全に移行します。
    技術的要件
    * ストリーミング データとバッチ データの両方を処理します
    * 既存の Hadoop ワークロードを移行する
    * 企業の変化する要求に対応できるように、アーキテクチャが拡張性と弾力性を備えていることを確認します。
    * 可能な限りマネージド サービスを使用する
    * データ フライトと保存時の暗号化
    * 本番データセンターとクラウド環境の間に VPN を接続する SEO ステートメント 当社は急速に成長してきたため、インフラストラクチャをアップグレードできないことが、さらなる成長と効率性を実際に妨げています。当社は世界中で荷物を効率的に移動させますが、データを移動させるのは非効率的です。
    顧客がどこにいるのか、何を出荷しているのかをより簡単に理解できるように、情報を整理する必要があります。
    CTO ステートメント
    当社にとって IT はこれまで決して優先事項ではなかったので、データが増大する一方でテクノロジーへの投資が十分ではありませんでした。IT を管理する優秀なスタッフがいますが、彼らはインフラストラクチャの管理で忙しいため、データの整理、分析の構築、CFO の実装方法の検討など、本当に重要なことを彼らにやってもらうことができません。追跡技術。
    CFO ステートメント
    当社の競争上の優位性の 1 つは、出荷と配達の遅延に対してペナルティを課していることです。出荷品がどこにあるかを常に把握することは、当社の収益と収益性と直接的な相関関係があります。さらに、サーバー環境の構築に資金を投入したくありません。
    Flowlogistic の経営陣は、現在の Apache Kafka サーバーではリアルタイム在庫追跡システムのデータ量を処理できないと判断しました。独自の追跡ソフトウェアにフィードを提供する新しいシステムを Google Cloud Platform (GCP) 上に構築する必要があります。システムは、さまざまなグローバル ソースからデータを取り込み、リアルタイムで処理およびクエリを実行し、データを確実に保存できる必要があります。GCP プロダクトのどの組み合わせを選択する必要がありますか?
  • Professional-Data-Engineer 試験問題 138

    あなたは、e コマース会社向けにバスケット放棄システムを設計しています。システムは、次のルールに基づいてユーザーにメッセージを送信します。
    - サイト上でユーザーによる操作が 1 時間行われない
    - 30 ドル以上の商品をバスケットに追加した
    - 取引が完了していない
    Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインをどのように設計すればよいでしょうか?
  • Professional-Data-Engineer 試験問題 139

    あなたは、ハンドヘルド スキャナを使用して配送ラベルを読み取る運送会社で働いています。あなたの会社には、スキャナーが受信者の個人識別情報 (PII) を分析システムにのみ送信することを要求する厳しいデータ プライバシー基準があり、これはユーザー プライバシー ルールに違反します。分析システムへの PII の公開を防ぐために、クラウドネイティブのマネージド サービスを使用してスケーラブルなソリューションを迅速に構築したいと考えています。
    あなたは何をするべきか?
  • Professional-Data-Engineer 試験問題 140

    Dataproc クラスタ インスタンスのソフトウェアをカスタマイズする方法ではないのは次のうちどれですか?