Leveraging Unstructured Data with Cloud Dataproc on Google Cloud Platform em Português Brasileiro

Por: Coursera . en: , ,

Overview

Este curso intensivo de uma semana baseia-se nos cursos anteriores da especialização Data Engineering on Google Cloud Platform. Por meio de videoaulas, demonstrações e laboratórios práticos, você aprenderá a criar e gerenciar clusters de computação para executar jobs do Hadoop, Spark, Pig e/ou Hive no Google Cloud Platform.Você também aprenderá a acessar várias opções de armazenamento em nuvem dos clusters de computação e integrar os recursos de machine learning do Google aos respectivos programas de análise.

Nos laboratórios práticos, você criará e gerenciará os clusters do Dataproc usando o console da Web e a CLI e usará o cluster para executar jobs do Spark e Pig. Depois você criará notebooks iPython que são integrados ao BigQuery e ao armazenamento e utilizará o Spark. Por fim, você integrará as APIs de machine learning à análise de dados.

Pré-requisitos
• Noções básicas de Big Data e Machine Learning do Google Cloud Platform (ou experiência equivalente)
• Algum conhecimento de Python

Plataforma