機械学習

[機械学習] sklearnのグリッドサーチ(Grid Search)について

投稿日:2019年1月24日 更新日:

こちらを読むと

  • 機械学習のグリッドサーチ(Grid Search)の概要が分かります
  • sklearnのグリッドサーチ使用方法が分かります

グリッドサーチとは

機械学習のモデルを作成するとき、”ハイパーパラメータ”という、本来は人が試行錯誤で決める値があります。このパラメータにより、モデルの予測性能が変わってきます。
グリッドサーチは、あらかじめ決めたパラメータの候補を順番に試していき、一番良いパラメータを見つける手法です。

グリッドサーチの概念図:予めパラメータの候補を決めておく

例えば、scikit-learnのロジスティック回帰では、以下のようなハイパーパラメータがあります(一部を抜粋)。
これらのパラメータについて、候補値を試していくわけです。

  • penalty : str, ‘l1’ or ‘l2’, default: ‘l2’
  • tol : float, default: 1e-4
  • C : float, default: 1.0

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

グリッドサーチの使い方

scikit-learnのGridSearchCVを使います。

# グリッドサーチ作成
gs = GridSearchCV(estimator=’分析器’,param_grid=’ハイパーパラメータ候補値’,scoring=’評価指標’,)
# フィッティング
gs.fit(X, y)
# 予測
gs.predict(X)

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

まとめ

  • 機械学習のグリッドサーチ(Grid Search)の概要が分かりました
  • sklearnのグリッドサーチ使用方法が分かりました

実際の実行例は、以下をご参照ください。
http://sumikitch.com/grid-search/



-機械学習

執筆者:


  1. […] 前回、グリッドサーチの概要について説明しました。http://sumikitch.com/sklearn-grid-search/今回は、実装例を見て、理解を深めたいと思います。 […]

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

scikit-learn load_iris datasetのデータ観察

こちらを読むと scikit-learnのload_iris datasetのデータ観察の初歩が分かります。特に散布図マトリクス(scatter_matrix)の解説をします。記事の所要時間は15分で …

ロジスティック回帰② アルゴリズム

[mathjax] こちらを読むと ロジスティック回帰のアルゴリズムを理解できます 前回の記事で、ロジスティック回帰はシグモイド関数を用いていること、モデル式が以下のように表せることまでを説明しました …

多クラスロジスティック回帰⑤ モデル式

[mathjax] こちらを読むと 多クラスロジスティック回帰のモデル式の概要と導出方法が分かります。 モデルのおさらい 多クラスロジスティック回帰のモデルは、以下のようになっていました。 モデル出力 …

単純パーセプトロン②

こちらを読むと 単純パーセプトロンのモデルの数式での表し方が分かります モデルの数式 前回のブログで、以下のような\(f(x)\)を定義すると、 $$\begin{eqnarray}f(x)=\lef …

機械学習でのカテゴリ特徴量の扱いについて

こちらを読むと カテゴリ特徴量とは何か?が分かります。機械学習でカテゴリ特徴量はどう扱うべきか?の概要が分かります。記事の所要時間は5分です。 カテゴリ特徴量とは データの特徴量(カラム)が、数値では …