今日は晴れていたけど朝起きるとやっぱり頭痛が酷かったが起きだして活動開始すれば収まった。朝食を済ませて大学へ行った。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (26件) を見る
GLMM と階層ベイズモデルについて混乱していたので緑本を引っ張りだして復習した。どちらもパラメータに分布を仮定するモデルだが、GLMM はパラメータに分布を仮定した変数を積分して潰して最尤推定に持ち込む。一方階層ベイズはベイズの定理により自然な形でパラメータに分布を仮定できるように見える。
緑本のスタイルでは、GLMM でパラメータに分布を仮定しても良いが一般に積分が上手く行かないことが多く、MCMC で近似的に最尤推定値を求めることになるが、MCMC では最尤推定値は分布として得られるので、そもそも頻度主義的発想の最尤推定においてパラメータを分布で得るのっておかしくない?階層ベイズでモデル化したほうが筋がいいよ、という感じだと思った。
というわけで混乱が解消されたので、前に読んだ Probabilistic Matrix Factorization の論文を引っ張ってきて見なおしたら、この論文は階層ベイズじゃ無かった。ハイパーパラメータに分布は仮定してなくて、この論文ではハイパラは固定して再急降下法で解いてた。Conclusion で "ハイパラに事前分布仮定して MCMC で解けばより良い推定になる" みたいなこと書いてある。それを実装したのが Bayesian Probabilistic Matrix Factorization using Markov Chain Monte Carlo こっちか。
- 出版社/メーカー: 20世紀フォックス・ホーム・エンターテイメント・ジャパン
- 発売日: 2014/07/02
- メディア: Blu-ray
- この商品を含むブログ (5件) を見る
10時からは映画に行った。午前十時の映画祭、今日はポセイドンアドベンチャーだった。各映画の選定基準にテーマが決まっていて、前回と今回は"諦めない男たち女たち"がテーマなんだが、前回のゲッタウェイはダメだった。スリラーアクションと言うらいんだけど、常に背中に嫌な汗を書くようなシチュエーションの連続で、且つ世界観もダメで苦手に思った。いつ殺されるかわからない、というシチュエーションを疑似体験するのは面白いかもしれないけどボクはダメだとわかってよかった。さて、ポセイドンアドベンチャー、見たけれども、やはりずっと緊張しっぱなしの映画で辛かった。ゲッタウェイと違って災害がテーマなので、なおさらリアリティがあってぞわぞわした。シン・ゴジラもそうなんだけど、災害の前には悠長な人間ドラマが展開される隙は無くって刹那的な人間関係が展開されるので、それはそれで面白かったりはする。
研究室に戻って研究活動を再開した。昨日に引き続き Modeling User Exposure in Recommendation を読む。モデリングのところはわかった。要するに選択バイアスを補正してユーザによるアイテムの評価値の推定値を算出しろっていうモデルだ。潜在変数モデルなので推定には EM アルゴリズムを使っていた。そういえば EM アルゴリズム自前で実装したことが無い。PRML で理論だけ眺めてふーんと思っただけだ。混合ガウス分布のやつをやってみても良いかもしれない。
読んで考えているうちに推薦システムにおける選択バイアスって結構あるなと思ったので似たようなネタで何かできそう。
帰ってからマクロスΔ 22話を見た。美雲さんとハヤテの関係が心地の良い感じになってる。これ、完全に美雲さん、ヒロイン枠から外れて…、いやミラージュとフレイヤの三角関係だってわかってはいたけど、そうか、美雲さん、こういうポジションに行くのか…。24 か 25 話で終わると思うけど、どうするんだろう。マクロスのことだから歌をきっかけに敵と和解して終わるはずなんだ。そういう意味で和解のきっかけにカシムがなりそうだったんだけど死んでしまった。白騎士が敵意丸出しだけど眼鏡と喧嘩しているのでその辺りの不満と、ワルキューレの歌で活性化したプロトカルチャーの遺跡によってウィンダミアの寿命問題の解消によって、白騎士が「戦う理由はもはや無くなった」とか言って終わりかな、と思っている。