4.「ダーティー」なデータを「クリーン」にする

Por: Coursera . en: , ,

  • 完全性の大切さ
    • このパートでは、データを準備する方法を考えるにあたり、なぜデータ完全性が優れた意思決定に重要であるかについてご説明します。 データがどのように生成され、データアナリストが分析のために収集するデータを決定する際に活用する手法についても学びます。また、構造化データと非構造化データ、データ型、データ フォーマットについても学びます。
  • クリーンデータの美しさ
    • データアナリストは皆、分析を行うさいにクリーンなデータを求めています。このパートでは、クリーンなデータとダーティなデータの違いについて学びます。また、表計算ソフトやその他のツールを使ったデータ クリーニングのテクニックもご紹介します。
  • SQL でデータクリーニングをする
    • データクリーニングのさまざまな方法を知っておくと、データアナリストの仕事がぐっと楽になります。 このパートでは、SQL を使用してデータクリーニングを行う方法を確認します。SQL で使えるクエリや関数を使って、データのクリーニングや変換を行い、分析に使える状態にする方法を探ります。
  • クリーニングの結果を検証し、レポートする
    • データのクリーニングは、データ分析プロセスにおいて不可欠なステップです。クリーニングの検証とレポートは、データが次のステップに進む準備ができていることを示す手段でもあります。このパートでは、データクリーニングの検証とレポート作成に関わるプロセスと、そのメリットについて学んでいきます。
  • オプション:レジュメにデータを追加する
    • 効果的なレジュメを作成することは、データアナリティクスのキャリアを歩む上で役に立ちます。このパートでは、自分の長所と適用できる経験を強調するレジュメの作成に重点を置いて、求職活動のプロセスに関するあらゆることを学びます。まだ求人に応募していない方でも、この機会にぜひレジュメを充実させましょう。メジャーリーグでの初シーズンのスプリングトレーニングのように、これは見逃せないものです。
  • *コース チャレンジ*
    • 用語集で用語と定義を確認し、コースチャレンジに備えましょう。その後、サンプルサイズの重要性、データの完全性、データとビジネス上の目的との関連性に関する知識を、クイズを通して実証しましょう。また、表計算ソフトと SQL の両方で、データクリーニングの技術を適用する機会もあります。最後に、データクリーニングのプロセスと結果を文書化し、レポートし、検証しましょう。

Plataforma