本/雑誌
機械学習のための特徴量エンジニアリング その原理とPythonによる実践 / 原タイトル:Feature Engineering for Machine Learning
AliceZheng/著 AmandaCasari/著 ホクソエム/訳
3300円
ポイント | 1% (33p) |
---|---|
発売日 | 2019年02月発売 |
出荷目安 | メーカー在庫見込あり:1-3週間
※出荷目安について |
- 追跡可能メール便 送料無料
著者・出版社・関連アーティスト
商品説明
本書は、機械学習モデルの性能を向上させるために、データから良い特徴量を作る特徴量エンジニアリングについて解説します。前半では初学者に向けて、数値、テキスト、カテゴリ変数の基本的な取り扱い方を説明し、後半では特徴量ハッシング、ビンカウンティング、PCAによるデータの圧縮、さらに非線形特徴量とモデルスタッキング、画像特徴量抽出と深層学習による自動特徴学習などの高度なテーマを扱います。特徴量エンジニアリングの原理について直感的な理解が得られるように図や例を豊富に使い、またPythonコードによる実行例を数多くあげて解説しており、実際の業務に適用するための具体的な知識が得られます。特徴量エンジニアリングを使いこなし、機械学習モデルの性能を最大限に引き出したいエンジニア必携の一冊です。Kaggle GrandmasterのKohei Ozaki(@smly)氏による「日本語版に寄せて」を収録しています。
関連記事
収録内容
1 | 1章 機械学習パイプライン |
2 | 2章 数値データの取り扱い |
3 | 3章 テキストデータの取り扱い |
4 | 4章 特徴量スケーリングによる効果:Bag‐of‐WordsのTF‐IDFによる重み付け |
5 | 5章 カテゴリ変数の取り扱い |
6 | 6章 次元削減:膨大なデータをPCAで圧縮 |
7 | 7章 非線形特徴量の生成:κ‐meansを使ったスタッキング |
8 | 8章 特徴量作成の自動化:画像特徴量の抽出と深層学習 |
9 | 9章 バック・トゥ・ザ・「フィーチャー」:学術論文レコメンドアルゴリズムの構築 |
10 | 付録A 線形モデリングと線形代数の基礎 |