ピエール瀧になりたい

備忘録として

祖先配列再構築-marginal reconstruction と joint reconstruction

Ancestral reconstruction - PLoSWiki

 

祖先配列再構築には大きくmarginal reconstruction と joint reconstructionがある。

marginal reconstructionはその名の通り、それぞれのノードにおいて*周辺確率を最大化する手法。

つまり、与えられた樹形の元で、あるノードで推定されたある祖先配列(β)が、現存する配列を出力する確率を最大化する。ここで、現存する配列というのはそのノード以下にある直系の子孫だけを考慮する。

しかし、それぞれのノードで独立に祖先配列を推定するため(?)、系統樹全体を考慮した最適解は保証されない。

 

対してjoint reconstructionは全てのノードの全ての祖先配列のセットについて周辺確率を最大化する手法っぽい。解析的に難しいし計算時間も遅いとのこと。

 

f:id:kmooog:20150731132600p:plain

 

つまり、☆印の配列を推定する際、marginal reconstructionの場合はABCDの配列の影響しか受けないけど、joint reconstructionではEの配列にも影響を受ける。

 

理屈的にはjoint reconstructionの方がよさそうだけど、外群に大きく気を使わなきゃいけなくなるし、問題設定にもよるけど大抵の場合はmarginal reconstructionの方が良さそうな気がする。系統樹の樹形とか、明らかに配列データが足りていないクレードがあるとか、そんなのによってもどっちの手法が有効かは変わってきそう。

 

 

*周辺確率

訓練標本X = {x1,x2,,,,,,xn}が与えられた時、あるパラメータβの元でXが出力される確率

参考: http://nlp.dse.ibaraki.ac.jp/~shinnou/zemi2010/staml/staml-tsaito-0706.pdf