2017.01.12

雪が降っていた。止むまで家でアニメを見ていた。

午後から研究室に行った。自作の MatrixFactorization のハイパラを決定するのに sklearn の GridSearchCV() を使っていたんだが、どうも到底最適とはかけ離れたパラメタばかりを最適値に選ぶので、詳しく見る羽目になった。

GridSearchCV() は引数で渡された Estimator の score() を以て最適パラメタを決定するらしい。それで、score() は自乗誤差かなんかを返すもんだと思っていて、MatrixFactorization 含め、自作の Estimator は自乗誤差返していたんだが、、sklearn の Estimator たちは R2 決定係数を返していた。よって score() で最も大きい値を返すパラメタを最適に選ぶということなんだが、自乗誤差だと smaller is better なので、どうりでゴミみたいなパラメタを選ぶわけだ。直したら良いパラメタを選ぶようになった。

実験を回し直して帰った。