【機械学習】Pythonでの重回帰分析方法

Pythonでの重回帰分析方法の覚書

はじめに使用ツールのimport

  • Python 3.X
  • Pandas
    データ量・統計量の確認、グラフ化、データの編集・演算、欠損値の補完
  • Numpy
    数値型の扱いに特化しており、計算がPandasより早い
  • scikit-learn
    Pythonの機械学習ライブラリ。分類・回帰・クラスタリング分析ができる。
    ○分類:SGD、カーネル近似、LinearSVC、k近傍法
    ○回帰:SGD、LASSO,ElasticNet、Ridge,LinerSVR、SVR,Ensemble
    ○クラスタリング:Kmeans、スペクトラルクラスタリング,GMM、MeanShift,VBGMM

その後データのimport〜データクレンジング

  1. Pandasでデータの確認、欠損値の補完、数値型でないものは数値型に変更
  2. Pandasで数値型に変更したデータをNumpyで分析

機械学習

scikit-learnで決定木・ランダムフォレストで分析

結果のアウトプット

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA