【機械学習】Pythonでの重回帰分析方法
Pythonでの重回帰分析方法の覚書
はじめに使用ツールのimport
- Python 3.X
- Pandas
データ量・統計量の確認、グラフ化、データの編集・演算、欠損値の補完 - Numpy
数値型の扱いに特化しており、計算がPandasより早い - scikit-learn
Pythonの機械学習ライブラリ。分類・回帰・クラスタリング分析ができる。
○分類:SGD、カーネル近似、LinearSVC、k近傍法
○回帰:SGD、LASSO,ElasticNet、Ridge,LinerSVR、SVR,Ensemble
○クラスタリング:Kmeans、スペクトラルクラスタリング,GMM、MeanShift,VBGMM
その後データのimport〜データクレンジング
- Pandasでデータの確認、欠損値の補完、数値型でないものは数値型に変更
- Pandasで数値型に変更したデータをNumpyで分析
機械学習
scikit-learnで決定木・ランダムフォレストで分析
結果のアウトプット