こちらを読むと
- 機械学習のグリッドサーチ(Grid Search)の概要が分かります
- sklearnのグリッドサーチ使用方法が分かります
グリッドサーチとは
機械学習のモデルを作成するとき、”ハイパーパラメータ”という、本来は人が試行錯誤で決める値があります。このパラメータにより、モデルの予測性能が変わってきます。
グリッドサーチは、あらかじめ決めたパラメータの候補を順番に試していき、一番良いパラメータを見つける手法です。
例えば、scikit-learnのロジスティック回帰では、以下のようなハイパーパラメータがあります(一部を抜粋)。
これらのパラメータについて、候補値を試していくわけです。
- penalty : str, ‘l1’ or ‘l2’, default: ‘l2’
- tol : float, default: 1e-4
- C : float, default: 1.0
https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html
グリッドサーチの使い方
scikit-learnのGridSearchCVを使います。
# グリッドサーチ作成
gs = GridSearchCV(estimator=’分析器’,param_grid=’ハイパーパラメータ候補値’,scoring=’評価指標’,)
# フィッティング
gs.fit(X, y)
# 予測
gs.predict(X)
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
まとめ
- 機械学習のグリッドサーチ(Grid Search)の概要が分かりました
- sklearnのグリッドサーチ使用方法が分かりました
実際の実行例は、以下をご参照ください。
http://sumikitch.com/grid-search/
[…] 前回、グリッドサーチの概要について説明しました。http://sumikitch.com/sklearn-grid-search/今回は、実装例を見て、理解を深めたいと思います。 […]