分子系統樹の作成2
東京大学大学院農学生命科学研究科 大森宏
http://lbm.ab.a.u-tokyo.ac.jp/~omori/phylogeny/txt/phylo2.html
2014年11月 4日
0.DNA データの取得と系統樹作成のビデオ
当研究室卒業生林氏のご尽力により,系統樹作成のビデオが YouTube にアップロード
されています.参考にどうぞ.
http://jp.youtube.com/watch?v=vfNFkn5cuIM
動画画面右下の▲にマウスを載せると表示されるうちの下側のボタン(キャプ
ション機能をオンにする)をクリックすると字幕の説明が表示されます.
そのままだと画質が粗いですが、同じく右下の「高画質で表示する」をクリック
すると、オリジナルと同等の高画質動画で再生されます.
課題1. 系統樹による EDN と ECP の関係の考察
RNA 分解酵素(リボヌクレアーゼ (RNase))ファミリーでのうち EDN (eosinophil-derived neurotoxin)
の配列をサルで取得し,系統樹を作成した.一方,RNA 分解酵素ファミリーには ECP (eosinophil
cationic protein) もある.EDN は取り上げた 6 種のサルすべてにあるが、
ECPはシシザルには無く 5 種のサルにある.
ECP は EDN からの遺伝子重複により形成されたと考えられている.
そうすると,遺伝子重複後 EDN から ECP に変化した遺伝子系統は配列が大きく変化したと考えられるので、進化
距離が大きくなっていることが予想される.これを確かめるには,EDN と ECP を混ぜて系統樹をつくればよい.
- 系統樹の作成手法を UPGMA,NJ,最尤法の中から1つ選び.EDN と ECP を混ぜて系統樹を作成せよ.
EDN と ECP とにどのような関係があるか,系統樹を見て論ぜよ.ただし,「遺伝子重複」と「進化距離」の2文字
は必ず使用すること.
- サル以外の系統に EDN や ECP があるか調べよ.たとえば,ハツカネズミ(Mus musculus)などの
ハツカネズミ属(Mus Genus)や
Rattus(Old World rats, クマネズミ属),イヌ(Canis lupus familiaris),ヤマネコ(Felis silvestris),イノシシ(Sus scrofa)などで調べる.類似配列検索の Blast を使う手もある.
見つかった場合にはそれらを混ぜて系統樹を作成
し,考察を加えよ.なお,このように 2 種の遺伝子の関係をみるときは,UPGMAによる系統樹が見やすい.
課題2. ブートストラップ法による分岐の信頼性の評価
分子系統樹を作成したときに,その分岐パターンがどの程度信頼性があるか調べる統計的手法.
いま,系統樹を n サイトで構成したとき,この n サイトから繰り返しを許して n サイトをリサンプル
して系統樹を作成する.リサンプルされた系統樹で同一の分岐パターンが得られればその分岐パターン
はそれだけ信頼性がおけることになる.
サル族の EDN と ECP の系統樹にブートストラップ法を適用し,分岐の信頼性を調べる.
参考(当研究室卒業生林氏作成ビデオ)
http://www.youtube.com/watch?v=-YXjOFQ0dds
- ブートストラップ配列データの生成:`seqboot' を起動.
phylip 形式の配列データセットから、サイトのリサンプリングにより、100の配列データセット
を生成する.
- UPGMA, NJ 系統樹:`dnadist' を起動.100の配列データセットそれぞれに対して、距離行列を生成する.
オプションは `M',データセット数は,`100',適当な奇数の値を入れる.
データかウエイトは,`D',データセット数は,`100' を入力する.できあがった距離行列セットファイルを
適当な名前に変え、`neghibor' の入力データとする.オプションは `M',
- 最尤法系統樹:`dnaml' を起動.100の配列データセットそれぞれに対して、最尤法による系統樹を生成する.
オプションは `M',
データかウエイトは,`D',データセット数は,`100',適当な奇数の値を入れ,jumble には 1 を指定する.
- 最頻出枝の出現回数: `consense' を起動.
先ほどの `neghibor' か `dnaml' で得られた tree ファイルを入力すると,枝ごとのブートストラップ
回数が出力される.
- 最初の配列データセットから得られたUPGMA, NJ 系統樹もしくは最尤系統樹の分岐のところに,[ ] をつけ,その中にブートストラップ確率を記入し,
NJtree で見る.
Copyright (C) 2004, Hiroshi Omori. 最終更新:2010年11月 9日