Leveraging Unstructured Data with Cloud Dataproc on Google Cloud Platform en Français

Por: Coursera . en: , ,

Overview

Ce cours intensif, d'une durée d'une semaine, se base sur de précédents cours de la spécialisation Data Engineering on Google Cloud Platform. À travers un ensemble de conférences vidéo, de démonstrations et d'ateliers pratiques, vous allez apprendre à créer et à gérer des clusters informatiques pour exécuter des tâches Hadoop, Spark, Pig et Hive sur Google Cloud Platform.Vous apprendrez également à accéder à diverses options de stockage dans le cloud à partir de leurs clusters de calcul et à intégrer les fonctionnalités de machine learning de Google à leurs programmes d'analyse.

Lors des ateliers pratiques, vous allez créer et gérer des clusters Dataproc via la console Web et la CLI, et vous utiliserez les clusters pour exécuter des tâches Spark et Pig. Vous créerez ensuite des notebooks iPython qui s'intègrent à BigQuery et à l'espace de stockage, et vous utiliserez Spark. Enfin, vous intégrerez les API de machine learning à votre analyse de données.

Prérequis
• Avoir suivi la formation Google Cloud Platform Big Data & Machine Learning Fundamentals (ou disposer d'une expérience équivalente)
• Disposer de quelques notions de Python

Syllabus

Module 1 : Présentation de Cloud Dataproc

Module 2 : Exécuter des tâches Dataproc

Module 3 : Tirer parti de GCP

Module 4 : Analyser des données non structurées

Plataforma