Modernizing Data Lakes and Data Warehouses with GCP en Français

Por: Coursera . en: ,

Overview

Les deux principaux composants de tout pipeline de données sont les lacs de données et les entrepôts de données. Ce cours aborde les cas d'utilisation de chacun de ces systèmes de stockage, et présente en détail les solutions disponibles sur Google Cloud Platform. Il décrit également le rôle de Data Engineer et les atouts des pipelines de données pour l'entreprise, en plus d'expliquer l'intérêt de l'environnement cloud pour l'ingénierie de données. Vous vous familiariserez, dans le cadre d'exercices pratiques dans QwikLabs, aux concepts de lacs et d'entrepôts de données sur Google Cloud Platform.

Syllabus

Introduction
-Ce module présente la spécialisation Data Engineering et le cours.

Data Engineering
-Ce module décrit le rôle d'un Data Engineer et explique pourquoi l'ingénierie de données doit être effectuée dans le cloud.

Créer un lac de données
-Ce module explique ce qu'est un lac de données et comment utiliser Google Cloud Storage comme lac de données dans GCP.

Créer un entrepôt de données
-Ce module présente BigQuery en tant qu'entrepôt de données dans GCP.

Résumé
-Ce module récapitule tous les thèmes abordés dans le cours.

Plataforma