Feature Engineering 日本語版

Por: Coursera . en: , ,

  • コースの概要
    • 特徴量エンジニアリングは、ML プロジェクトを構築する作業で特に時間がかかり、難易度も高いフェーズです。特徴量エンジニアリング プロセスでは、まず元データを準備し、独自のドメイン知識を活用しながら、機械学習アルゴリズムを動作させるための特徴量を作成します。
  • 元データから特徴量への変換
    • 特徴量エンジニアリングは、ML プロジェクトを構築する作業で特に時間がかかり、難易度も高いフェーズです。特徴量エンジニアリング プロセスでは、まず元データを準備し、独自のドメイン知識を活用しながら、機械学習アルゴリズムを動作させるための特徴量を作成します。このモジュールでは、良い特徴量の特性と、ML モデルで特徴量を表現する方法について説明します。
  • 前処理と特徴量作成
    • このセクションでは、前処理と特徴量作成について説明します。これらのデータ処理手法により、機械学習システムで使う特徴セットを効率的に準備できます。
  • 特徴クロス
    • 特徴クロスは、従来の機械学習ではそれほど大きな役割を果たしていませんでしたが、近年の機械学習の手法ではツールキットで重要な役割を担います。このモジュールでは、どのような問題において特徴クロスで機械学習を強力にサポートできるのかを認識する方法を学習します。
  • TensorFlow Transform
    • TensorFlow Transform (tf.Transform) は、データを TensorFlow で前処理するためのライブラリです。tf.Transform はデータの全走査が必要な前処理を効率的に実行できるため、平均と標準偏差による入力値の正規化や、すべての入力サンプルの値検索による語彙の整数化、観察されるデータ分布に基づく入力のバケット化などに適しています。このモジュールでは、tf.Transform の使用例について説明します。
  • まとめ

Plataforma