最高の初期値職人を目指して
潜在クラス分析(有限混合モデル)やら,k-meansとかいろいろと初期値に依存する分析するがある。
また,Latent variableモデリングではEMアルゴリズムを使った最尤推定を行うことが多いが,複雑なモデルになるほど解が収束しないこともしばしばある。
とくに,因子分析と潜在クラスを組合せた場合や,いわゆるGrowth mixture modelなどは収束しないだけでなく,局所解のオンパレードである。
そんな時に,いい感じの初期値を設定する方法について,まとめておく。
- モデル全体を最小二乗方による推定がうまくいくかを確認する。
上手くいけば,その解を初期値として分析を行う。だめであれば次へ。
- 一度にモデルを推定するのではなく,部分的に推定する。
このときキチンと収束することを確認する。推定方法はなんでもいい。
- すべての部分モデルを推定する。
因子分析を含んでいるのであれば,因子得点を推定して,それを顕在変数として分析する。たとえば,growth mixtureモデルの切片,傾き得点など。
ベイズ推定をした場合にも,事後分布が収束することなどをキチンと確かめる必要がある。
- その他関連する話題。
構造パラメータの段階推定について。
測定モデルを推定して,測定パラメータを固定して,潜在変数得点を推定する。
その潜在変数得点を使って,構造パラメータを推定する。この構造パラメータは一致推定量であることが示されている(光永・星野・繁桝・前川, 2005;
ci.nii.ac.jp
)。
段階推定をすることはあまり無いかもしれないが,知っておいて損ではない話題かと。
基本的には,部分的に分析してみてそれを初期値にするという戦略が重要。
初期値の指定の方法については,分析ソフトによってさまざまなので,使っているソフトのマニュアルを参考にすること。