Aritalab:Lecture/NetworkBiology/Markov Chains/Birth-death Process
(→木村資生の中立進化説) |
(→出生死亡過程) |
||
(12 intermediate revisions by one user not shown) | |||
Line 8: | Line 8: | ||
==出生死亡過程== | ==出生死亡過程== | ||
===モラン過程=== | ===モラン過程=== | ||
− | 個体数を ''N'' とし、状態 ''i'' から ''i'' + 1, ''i'' − 1 の状態へそれぞれ確率 | + | 個体数を ''N'' とし、状態 ''i'' から ''i'' + 1, ''i'' − 1 の状態へそれぞれ確率 α, β ( α + β < 1) で遷移する場合を考えましょう。 |
− | また状態 0 と ''N'' | + | また状態 0 と ''N'' は吸収状態とします。(従ってユニークな定常分布を考えるわけではない。) |
− | + | このマルコフ連鎖を、1958年にモデルを発表した遺伝学者PAP MoranにちなんでMoran過程といいます。 | |
− | 状態 ''i'' から出発して状態 ''N'' に到達する確率を <math>x_i</math> | + | 状態 ''i'' から出発して状態 ''N'' に到達する確率を <math>x_i</math> と書き、これを固定確率と呼びます。 |
<math> | <math> | ||
Line 32: | Line 32: | ||
</math> | </math> | ||
− | + | を導入します。 | |
<math>\textstyle y_{i+1} = \gamma y_i, \quad \sum^N_{i=1} y_i = 1</math> | <math>\textstyle y_{i+1} = \gamma y_i, \quad \sum^N_{i=1} y_i = 1</math> | ||
− | + | Moran過程では通常、少ない個体数から N 個体にまで増殖するケースを考えるため、γ は 1 より小さい値 ( つまり β < α ) と考えてよいでしょう。 | |
<math> y_1 = x_1, \ y_2 = \gamma x_1, \ y_3 = \gamma^2 x_1, \cdots, y_n = \gamma^{N-1} x_1 </math> | <math> y_1 = x_1, \ y_2 = \gamma x_1, \ y_3 = \gamma^2 x_1, \cdots, y_n = \gamma^{N-1} x_1 </math> | ||
Line 57: | Line 57: | ||
</math> | </math> | ||
− | + | とあわせて以下のようになります。 | |
<math> | <math> | ||
Line 64: | Line 64: | ||
</math> | </math> | ||
− | |||
===式の解釈=== | ===式の解釈=== | ||
− | + | ||
− | + | N 個体の集団において、全ての個体が最初タイプ A であるとする。 | |
− | + | このときタイプ B という突然変異が 1 個生じたとする。 | |
+ | タイプ B が γ < 1 を満たす、すなわち α > β (個体数を増やす傾向) と仮定する。 | ||
タイプ B が何らかの優性種であると考えてもよい。 | タイプ B が何らかの優性種であると考えてもよい。 | ||
初めに 1 個生じたタイプBが集団 ''N'' の中に固定される(集団全体をカバーする)確率はモラン過程より <math>x_1 \xrightarrow{N \rightarrow \infty} 1 - \gamma</math> になる。 | 初めに 1 個生じたタイプBが集団 ''N'' の中に固定される(集団全体をカバーする)確率はモラン過程より <math>x_1 \xrightarrow{N \rightarrow \infty} 1 - \gamma</math> になる。 | ||
− | つまり、A より10倍優位な変異体であっても ( | + | つまり、A より10倍優位な変異体であっても (γ = 1/10)、集団全体にその変異が保持される確率は 9/10 でしかない。 |
− | + | 通常の遺伝子変異で生存戦略に極めて優性となるケースは非常に稀だと考えられる。そうすると、優性な変異が集団全体に保持される可能性はそう大きくない。 | |
===木村資生の中立進化説=== | ===木村資生の中立進化説=== | ||
Line 80: | Line 80: | ||
ほとんどの遺伝子の突然変異は、自然淘汰において有利でも不利でもないとする[http://www.nig.ac.jp/museum_080501/evolution/C/bunsi-02.html 中立進化説]は当時大きな反響を呼んだ。 | ほとんどの遺伝子の突然変異は、自然淘汰において有利でも不利でもないとする[http://www.nig.ac.jp/museum_080501/evolution/C/bunsi-02.html 中立進化説]は当時大きな反響を呼んだ。 | ||
− | 突然変異が完全に中立な場合、 | + | 突然変異が完全に中立な場合、γ = 1 となり左右に均等なランダムウォークになる。 |
+ | このとき <math>x_1 = 1/N</math> となる([[Aritalab:Lecture/NetworkBiology/Random Walk|ランダムウォーク]]のギャンブラー破産問題を参照)。 | ||
各個体の子孫がそれぞれ集団全体をカバーする可能性があり、各個体が均等な機会を持つから、これは当然の値ともいえる。 | 各個体の子孫がそれぞれ集団全体をカバーする可能性があり、各個体が均等な機会を持つから、これは当然の値ともいえる。 | ||
さて、確率 ''m'' でタイプ B という突然変異が生じるとき、変異体 B の生じる個体数は ''mN'' になる。 | さて、確率 ''m'' でタイプ B という突然変異が生じるとき、変異体 B の生じる個体数は ''mN'' になる。 | ||
Line 87: | Line 88: | ||
==ネットワーク上の出生死亡過程== | ==ネットワーク上の出生死亡過程== | ||
− | + | モラン過程では A 個体と B 個体の個数のみを考え、個体間のネットワークという概念が無かった。 | |
− | + | 言い方を変えると、モラン過程は完全グラフ (complete graph) 上の相互作用である。 | |
− | + | さて ''N'' 個体が遷移行列 <math>{\mathbf P}</math> で与えられるネットワークを構成する場合を考えよう。 | |
− | + | 各頂点は状態 A または B をとり、単位時間にある頂点 ''i'' が隣接する頂点 ''j'' に確率 <math>p_{ij}</math> で自分の状態をコピーする。 | |
+ | また、B は A に比べ <math>1/r</math> の割合で選ばれる確率が高いとする。ここで扱うのは 0 ≤ ''r'' ≤ 1 の場合である (B は次第に増える)。 | ||
===モラン過程と同等なネットワーク=== | ===モラン過程と同等なネットワーク=== | ||
− | + | 初めに1個体であった B が全体に広がる確率がMoran過程と同じ <math>\textstyle \frac{1-r}{1-r^N}</math> であるための条件を考えよう。 | |
− | 現在 ''m'' | + | 現在 ''m'' 頂点が状態 B、残りが状態 A と仮定する。 |
− | + | B のほうが A より <math>1/r</math> 倍選択されやすい場合、''N'' 個の頂点のうち、状態 A にある頂点が選択される確率は <math>m/r</math> だけ個体数が増えていることに等しいから <math>1 /(N-m + m/r)</math> となる。 | |
− | + | 状態 B の頂点が選択される確率は<math>1/r(N-m+ m/r)</math>である。両者をあわせると | |
+ | <math>\textstyle (N-m) \cdot \frac{1}{N-m + m/r} + m \cdot \frac{1}{r(N-m+ m/r)} = 1</math> になっている。 | ||
頂点 ''i'' が状態Bのとき <math>v_i = 1</math>, 状態Aのとき <math>v_i = 0</math>と書こう。 | 頂点 ''i'' が状態Bのとき <math>v_i = 1</math>, 状態Aのとき <math>v_i = 0</math>と書こう。 | ||
− | + | ||
+ | B 個体が ''m'' + 1 に増える確率は、状態 B の頂点 ''i'' (<math> v_i = 1</math>) が選ばれて、隣接する状態 A の頂点 ''j'' (<math> v_j = 0</math>) を上書きすればよい。 | ||
<math>\textstyle B_{m\rightarrow (m+1)} = \frac{1}{r} \frac{\sum_i\sum_j p_{ij} v_i (1-v_j)}{m/r + N - m} </math> | <math>\textstyle B_{m\rightarrow (m+1)} = \frac{1}{r} \frac{\sum_i\sum_j p_{ij} v_i (1-v_j)}{m/r + N - m} </math> | ||
− | + | 同様に、B 個体が''m'' − 1 に減少する確率は、状態 A の頂点 ''i'' (<math> v_i = 0</math>) が選ばれて、隣接する状態 B の頂点 ''j'' (<math> v_j = 1</math>) を上書きすればよい。 | |
<math>\textstyle B_{m\rightarrow (m-1)} = \frac{\sum_i\sum_j p_{ij} (1-v_i) v_j}{m/r + N - m} </math> | <math>\textstyle B_{m\rightarrow (m-1)} = \frac{\sum_i\sum_j p_{ij} (1-v_i) v_j}{m/r + N - m} </math> | ||
Line 111: | Line 115: | ||
<math>\textstyle \frac{B_{m\rightarrow (m-1)}}{B_{m\rightarrow (m+1)}} = r</math> | <math>\textstyle \frac{B_{m\rightarrow (m-1)}}{B_{m\rightarrow (m+1)}} = r</math> | ||
− | + | が成立せねばならず、すべての ''i'', ''j'' について | |
<math>\textstyle \sum_i\sum_j p_{ij} v_i (1-v_j) = \sum_i\sum_j p_{ij} (1-v_i) v_j</math> | <math>\textstyle \sum_i\sum_j p_{ij} v_i (1-v_j) = \sum_i\sum_j p_{ij} (1-v_i) v_j</math> | ||
− | 個体 ''k'' | + | となる。 |
+ | |||
+ | 個体 ''k'' ただ一つが B である特殊例 <math>v_k = 1,\ v_i = 0\, (\forall i \neq k)</math> を考えると <math>\textstyle \sum_j p_{jk} = \sum_j p_{kj} = 1</math> が必要条件となる。 | ||
ただし右側の等号は、考えているネットワークがマルコフ連鎖であるため、頂点から出る辺確率の和が1であることから導かれる。 | ただし右側の等号は、考えているネットワークがマルコフ連鎖であるため、頂点から出る辺確率の和が1であることから導かれる。 | ||
− | + | この条件がすべての頂点について成立する。したがって、定常分布での存在確率が全頂点において等しいときには(別の言葉でいうと、全頂点が対等な関係にある場合は)、Moran過程と同じプロセスになる。 | |
− | + | 定常分布での存在確率が全頂点で等しくなるのは、接続関係が対称なネットワークだけに限らず、非対称な場合もありうる。 例えば一方向にのみ遷移する環状ネットワークは方向性を持つので非対称だがMoran過程と同等になる。 | |
− | + | ||
===固定確率を低めるネットワーク=== | ===固定確率を低めるネットワーク=== | ||
− | + | いかに優性な個体 B が生じても、固定確率が中立進化の場合に同じ <math>1/n</math> 以上になれないネットワークは簡単に構成できる。 | |
− | 例えば既約なネットワークに根 (root) | + | 例えば既約なネットワークに根 (root) となる頂点を一つ付け足した場合を考えれば、根にあたる頂点に優性な変異 B が生じない限り固定されないので、固定確率が <math>1/n</math> となる。同じ理由で、根にあたる頂点が複数あるネットワークは決して固定されることがない。 |
===固定確率を高めるネットワーク=== | ===固定確率を高めるネットワーク=== | ||
Line 132: | Line 137: | ||
結果から先に言うと、固定確率は <math>\textstyle x_i = \frac{1-r^{2i}}{1-r^{2n}}</math> であらわされる。 | 結果から先に言うと、固定確率は <math>\textstyle x_i = \frac{1-r^{2i}}{1-r^{2n}}</math> であらわされる。 | ||
− | + | 星型の枝が非常に多い場合を考えよう。 | |
− | + | 周囲の頂点で状態 B を増やすには、中央の頂点が状態 B の際に選択されねばならず、 | |
− | + | 周囲の頂点で状態 A を増やすには、中央の頂点が状態 A の際に選択されねばならない。 | |
− | + | 中央の頂点は状態 B と A の間を行き来するが、状態 B のほうが <math>1/r</math> 倍選択されやすい。 | |
− | + | 中央の頂点が状態 B にいるほうが <math>1/r</math> 倍選択されやすく、更に中央の頂点の状態にかかわらず周囲の頂点のうち B が選択されるほうが <math>1/r</math> 倍多いため、結果として B が <math>1/r^2</math> 倍選択されることになる。 | |
つまり | つまり | ||
Line 143: | Line 148: | ||
= r^2 </math> | = r^2 </math> | ||
− | 適応度がMoran過程に比べて <math>r^2</math> に増幅されていることがわかる。この議論の詳細な解析は、冒頭の参考文献 (Broom & Rychtar) | + | 適応度がMoran過程に比べて <math>r^2</math> に増幅されていることがわかる。この議論の詳細な解析は、冒頭の参考文献 (Broom & Rychtar) を参照のこと。 |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + |
Latest revision as of 12:10, 28 August 2015
Wiki Top | Up one level | レポートの書き方 | Arita Laboratory |
|
[edit] 参考文献
- Lieberman E, Hauert C, Nowak MA (2005) Evolutionary Dynamics on Graphs. Nature 433:312-316
- Nowak MA (2006) Evolutionary Dynamics: Exploring the Equations of Life, Belknap Press of Harvard University Press
- Broom M, Rychtar J (2008) An analysis of the fixation probability of a mutant on special classes of non-directed graphs Proc R Soc A 464:2609-2627
[edit] 出生死亡過程
[edit] モラン過程
個体数を N とし、状態 i から i + 1, i − 1 の状態へそれぞれ確率 α, β ( α + β < 1) で遷移する場合を考えましょう。 また状態 0 と N は吸収状態とします。(従ってユニークな定常分布を考えるわけではない。) このマルコフ連鎖を、1958年にモデルを発表した遺伝学者PAP MoranにちなんでMoran過程といいます。
状態 i から出発して状態 N に到達する確率を と書き、これを固定確率と呼びます。
ここで記法
を導入します。
Moran過程では通常、少ない個体数から N 個体にまで増殖するケースを考えるため、γ は 1 より小さい値 ( つまり β < α ) と考えてよいでしょう。
を足し合わせると
また
とあわせて以下のようになります。
[edit] 式の解釈
N 個体の集団において、全ての個体が最初タイプ A であるとする。 このときタイプ B という突然変異が 1 個生じたとする。 タイプ B が γ < 1 を満たす、すなわち α > β (個体数を増やす傾向) と仮定する。 タイプ B が何らかの優性種であると考えてもよい。
初めに 1 個生じたタイプBが集団 N の中に固定される(集団全体をカバーする)確率はモラン過程より になる。 つまり、A より10倍優位な変異体であっても (γ = 1/10)、集団全体にその変異が保持される確率は 9/10 でしかない。 通常の遺伝子変異で生存戦略に極めて優性となるケースは非常に稀だと考えられる。そうすると、優性な変異が集団全体に保持される可能性はそう大きくない。
[edit] 木村資生の中立進化説
木村資生(きむらもとお)は1970年代に活躍した国立遺伝学研究所の研究者である。 ほとんどの遺伝子の突然変異は、自然淘汰において有利でも不利でもないとする中立進化説は当時大きな反響を呼んだ。
突然変異が完全に中立な場合、γ = 1 となり左右に均等なランダムウォークになる。 このとき となる(ランダムウォークのギャンブラー破産問題を参照)。 各個体の子孫がそれぞれ集団全体をカバーする可能性があり、各個体が均等な機会を持つから、これは当然の値ともいえる。 さて、確率 m でタイプ B という突然変異が生じるとき、変異体 B の生じる個体数は mN になる。 各個体がそれぞれ集団をカバーしうるから、全てタイプ A の集団からはじまって全てタイプ B の集団に進化する速度は、 となり、集団のサイズに依存しない。 ここから「分子時計」仮説が導かれる。
[edit] ネットワーク上の出生死亡過程
モラン過程では A 個体と B 個体の個数のみを考え、個体間のネットワークという概念が無かった。 言い方を変えると、モラン過程は完全グラフ (complete graph) 上の相互作用である。 さて N 個体が遷移行列 で与えられるネットワークを構成する場合を考えよう。 各頂点は状態 A または B をとり、単位時間にある頂点 i が隣接する頂点 j に確率 で自分の状態をコピーする。 また、B は A に比べ の割合で選ばれる確率が高いとする。ここで扱うのは 0 ≤ r ≤ 1 の場合である (B は次第に増える)。
[edit] モラン過程と同等なネットワーク
初めに1個体であった B が全体に広がる確率がMoran過程と同じ であるための条件を考えよう。 現在 m 頂点が状態 B、残りが状態 A と仮定する。 B のほうが A より 倍選択されやすい場合、N 個の頂点のうち、状態 A にある頂点が選択される確率は だけ個体数が増えていることに等しいから となる。 状態 B の頂点が選択される確率はである。両者をあわせると になっている。
頂点 i が状態Bのとき , 状態Aのとき と書こう。
B 個体が m + 1 に増える確率は、状態 B の頂点 i () が選ばれて、隣接する状態 A の頂点 j () を上書きすればよい。
同様に、B 個体がm − 1 に減少する確率は、状態 A の頂点 i () が選ばれて、隣接する状態 B の頂点 j () を上書きすればよい。
Moran過程と同等になるには各頂点の状態に非依存で
が成立せねばならず、すべての i, j について
となる。
個体 k ただ一つが B である特殊例 を考えると が必要条件となる。 ただし右側の等号は、考えているネットワークがマルコフ連鎖であるため、頂点から出る辺確率の和が1であることから導かれる。 この条件がすべての頂点について成立する。したがって、定常分布での存在確率が全頂点において等しいときには(別の言葉でいうと、全頂点が対等な関係にある場合は)、Moran過程と同じプロセスになる。
定常分布での存在確率が全頂点で等しくなるのは、接続関係が対称なネットワークだけに限らず、非対称な場合もありうる。 例えば一方向にのみ遷移する環状ネットワークは方向性を持つので非対称だがMoran過程と同等になる。
[edit] 固定確率を低めるネットワーク
いかに優性な個体 B が生じても、固定確率が中立進化の場合に同じ 以上になれないネットワークは簡単に構成できる。 例えば既約なネットワークに根 (root) となる頂点を一つ付け足した場合を考えれば、根にあたる頂点に優性な変異 B が生じない限り固定されないので、固定確率が となる。同じ理由で、根にあたる頂点が複数あるネットワークは決して固定されることがない。
[edit] 固定確率を高めるネットワーク
ここでは星型 (star) のネットワークはMoran過程より固定確率が高くなることを説明する。 結果から先に言うと、固定確率は であらわされる。
星型の枝が非常に多い場合を考えよう。 周囲の頂点で状態 B を増やすには、中央の頂点が状態 B の際に選択されねばならず、 周囲の頂点で状態 A を増やすには、中央の頂点が状態 A の際に選択されねばならない。 中央の頂点は状態 B と A の間を行き来するが、状態 B のほうが 倍選択されやすい。 中央の頂点が状態 B にいるほうが 倍選択されやすく、更に中央の頂点の状態にかかわらず周囲の頂点のうち B が選択されるほうが 倍多いため、結果として B が 倍選択されることになる。
つまり
適応度がMoran過程に比べて に増幅されていることがわかる。この議論の詳細な解析は、冒頭の参考文献 (Broom & Rychtar) を参照のこと。