Building Batch Data Pipelines on GCP 日本語版

Por: Coursera . en: , ,

  • はじめに
    • このモジュールでは、本コースの内容とアジェンダを紹介します
  • バッチデータ パイプラインの概要
    • このモジュールでは、EL、ELT、ETL というデータ読み込み方式と、各方式をどのような場合に使うべきかを確認します
  • Cloud Dataproc での Spark の実行
    • このモジュールでは、Cloud Dataproc で Hadoop を実行する方法、GCS の活用法、Dataproc ジョブを最適化する方法を説明します。
  • Cloud Data Fusion と Cloud Composer によるデータ パイプライン管理
    • このモジュールでは、Cloud Data Fusion と Cloud Composer を使ってデータ パイプラインを管理する方法を説明します。
  • Cloud Dataflow によるサーバーレスのデータ処理
    • このモジュールでは、Cloud Dataflow を使ったデータ処理パイプライン構築を取り上げます。
  • まとめ
    • このモジュールでは、本コースで学んだトピックを復習します

Plataforma