チラシの裏の落書き日記

統計とか,研究とか,日常についての備忘録的なもの。

ベイズ統計学を推進していることに関する違和感と所感

例によってダラダラと気になることをなんの脈絡もなく書き留めておく。

昨今のベイズ統計学を推進しようとしている人たちがやっていることは,ベイズ統計学というより,実際にはパラメタ推定方法として,事後分布を使うということに過ぎない。
実際には予測分布の話は殆ど出てこず,StanやBUGS,JAGSといったソフトの使い方を習熟することを指して”ベイズ統計学を教える”と言っているように感じられる。
ベイズ統計学をどう教えるか”,ということに腐心している人たちもいるようだが,彼らがやっていることは尤度と事前分布からMCMCを使って事後分布からのサンプリングをしているということだけのように見える。それを,特定のソフトでどのように書くか,ということだけが問題になっている。
ベイズ統計学といってもカバーする範囲は非常に広い。ノンパラメトリックベイズベイジアンネットワークもある。
結局,彼らが批判している頻度論的な手法の”暗記”と対して変わらない気がする。(これを検証したいときにはこんな感じモデルをもとに,もにょっとパラメタを追加すればいい,的な。)
ソフトを使えるようになっている人の何割が,完全条件付き分布を書き下す事ができるだろうか。あるいは,そこから自分でMCMCを導けるだろうか。結局のところやんわりとした,ソフトの使い方の習得がベイズ統計学の習得と同地ではない。
もちろん,ソフトが使えて,ほぼ既存のモデルに対して,事後分布からのサンプリングができれば十分ということも多分にしてあるだろう。
また,ベイズ統計学の方が誤用が少ないという主張もあるが,この根拠はいまいちわからない。誤用とは何を指しているのだろうか?pハッキング?率直に考えて,手作業で指定しなければならないことが増える分だけ誤用が入る余地が多くなるのではないか。生成モデルは彼らのいうところのベイズ統計学の枠組みでなければ考えられないのだろうか。これまで普通に行われてきたモデルは生成モデルではないのか?ベイズ統計学と頻度論的統計学を分けて考える必要性はもはやないはずなのに。数学的背景がない以上は,諸々のことを覚えるなりなんなりしないとなにもできないと思われる。彼らのいうところのベイズ統計学は数学的背景がなくても使えるものなのだろうか?あまりわからない。