2008年度生物測定学応用実験
分子系統樹の作成
東京大学大学院農学生命科学研究科 大森宏
http://lbm.ab.a.u-tokyo.ac.jp/~omori/phylogeny/txt/phylogeny_zikken.html
2008年11月 4日,11日,12日
1. はじめに
今回の実験では,データベースからインターネットにより
DNA シーケンスデータを取得し,そのデータから遺伝子系統樹を
作成する実験を行う.手元になにも情報がない状態から、
どのように情報を得るかを学び,合わせて,分子系統樹が実際のデータから
どのように作成されるかを見ることを目的としている.
なお,以下の解説は windows 環境のものであるので,マック環境で行う場合は適宜
変更すること.
2. シーケンスデータの取得
サルのリボヌクレアーゼスーパーファミリー
RNA 分解酵素(リボヌクレアーゼ (RNase))ファミリーである ECP (eosinophil cationic protein)
と EDN (eosinophil-derived neurotoxin) は,エオシン好性白血球 (eosinophil leukocyte) という
顆粒白血球に局在している.EDN の生理機能はよくわかっていないが,リボヌクレアーゼと
しての活性は高く,レトロウィルスのゲノム RNA
を破壊することにより一種の抗ウィルス剤として働いているのではないかという報告が
なされている.一方,ENP はリボヌクレアーゼの活性は低いが,病原性バクテリアや寄生虫
の細胞膜に穴をあけて殺す機能があり,これらの病原体に対する強力な防御を行っている.
今回の実験では,ヒトとサルの EDN と ECP のシーケンスデータをインターネットで取得
して,分子系統樹を作成する.用いる生物種は,
- human Homo sapiens
- chimpanzee Pan troglodytes
- gorilla Gorilla gorilla
- orangutan Pongo pygmaeus
- macaque Macaca fascicularis,ニホンザル,タイワンザルなど
- tamarin Saguinus oedipus,シシザル
である.ECP は1から5までの生物種にあり,EDN は上に挙げたすべての生物種にある.
DNA データの取得と系統樹作成のビデオ
当研究室大学院生の林さんのご尽力により,系統樹作成のビデオが YouTube にアップロード
されました.
http://jp.youtube.com/watch?v=vfNFkn5cuIM
動画画面右下の▲にマウスを載せると表示されるうちの下側のボタン(キャプ
ション機能をオンにする)をクリックすると字幕の説明が表示されます。
そのままだと画質が粗いですが、同じく右下の「高画質で表示する」をクリック
すると、オリジナルと同等の高画質動画で再生されます。
ヒト DNA データの取得
以下のようにして,シーケンスデータをインターネットを
用いてデータベース
から取得する.一つのサイトに集中すると迷惑なので,各自で以下のサイトを適宜選ぶ.
ヒトの場合について述べる.
1.ゲノムネット(京都大学化学研究所バイオインフォマティックスセンター)
- 京都大学ゲノムネット(http://www.genome.ad.jp) に行く.
- `Search' ボックスを `DNA sequence' にする.
- `for' ボックスの中に `eosinophil human' と書く.
- `eosinophil cationic protein' で検索してもよい.
- `Go' をクリックする.
- 検索された中から良さそうなものを見に行く.([GenBank],[EMBL],[DDBJ] なんでも良い)
- `ORIGIN(SQ)' を見に行く.
- `ORIGIN' の内容をコピーして,メモ帳に
張り付ける.
- humanEDN.txt' などという名前をつけて適当な場所に保存する.
2.DDBJ(DNA Data Bank of Japan )
注)11月4日は,メンテナンスのため使用できない模様.
-
DDBJ(http://www.ddbj.nig.ac.jp/Welcome-j.html)に行く.
- 左の`検索' をみる。
- `データベース検索' の `SRS' (キーワード検索 )をクリック.
- キーワードに `eosinophil' と `human' を入れて `検索実行' をクリック.
- 検索された中から良さそうなものを見に行く.
- `ORIGIN' を見に行く.
- 内容をコピーして,メモ帳に
張り付ける.
- humanEDN.txt' などという名前をつけて適当な場所に保存する.
他の種のシークエンスデータの取得
ヒトの遺伝子配列が入手できたので,他の種の配列データをを取得する.
ヒトの配列を取得したのと同様の方法(`eosinophil gorilla' で検索)で取得できる.
また,相同配列検索 `BLAST' を用いてもよい.
`BLAST' の使い方
- 下の方の `Sequence Analysis' を見る.
- `BLAST' をクリック.
- `BLASTN' をチェックする.
- Human の配列を `Sequence data' ボックスにコピーして `compute' ボタンを押し実行させる.
- 他の生物種の配列を捜す.
3. 系統樹作成
ソフトウェア
系統樹を作成するためのフリーのソフトウェアはネット上にある.
`google' などの検索サイトを利用すれば手軽にダウンロードできる.
今回の実験のためのソフトは,
に用意してあるので,ここからダウンロードする.
注)ダウンロード先のフォルダ名はスペースを用いていないものにすること.
(`\My Documents' はダメ)
アラインメント clustalX
取得した相同領域のシーケンスの長さが種により異なるときは,アラインメントを
行って長さを揃える必要がある.
一般に3種以上の種を同時に扱うときはマルティプルアラインメトをしなければ
ならない.これは,clustalX というソフトウエアを用いて行う.
- 新規のメモ帳を開き,取得した生物種の配列データをコピーして順に貼り付けて行く.
- `>' を書き,その後に10文字以内で配列名を記入する.
- 系統樹をつくる
配列データ
ができたら,適当な名前で保存する.
- `clustalX' を用いてアラインメントを行う.結果は、`PHYLIP' 形式で
保存する.
- `clustalX' をクリックして開く.
- `File' メニューの `Load sequences' で配列データを入力する.
- `Alignment' メニューの `Output Format Options' をクリックし、`PHYLIP format' にチェックを入れる.
- `Alignment' メニューの `Do Complete Alignment' を選ぶ.
アライメントをかける配列データ例
アラインメントしたデータを PHYLIP format にした例
このデータ形式にすれば系統樹作成ソフト PHYLIP に入力できる.
進化距離の推定 DNADIST
`DNADIST' を用いて,進化距離 d を以下のようにして計算する.
距離の計算オプションとして,
Junkes-Cantor 法,Kimura's 2 parameter 法の2通りを試す.
- `DNADIST' をクリックする.
- `filename' に先程作成したシーケンスデータを指定する.
- オプションを入力する.
- `y' を打ち込んで実行させる.
- 結果はフォルダ内の `outfile' にできる.
- `outfile' をメモ帳で見て確認し,問題がなければ適当な名前に変えておく.
系統樹作成ソフト phylip
今回の実験で用いるソフトは以下のものである.
- NEIGHBOR
距離行列から系統樹を作成する.UPGMA と Neibor Joining Method (最小進化) が選べる.
- DNAPARS
塩基配列から,最大節約法により系統樹を作成する.
- DNAML
塩基配列から,最尤法(最大確率)により系統樹を作成する.
- TreeView/FigTree
生成した `tree' ファイルから系統樹をきれいに表示する.
PYLIP が生成した "treefile" の名前を変え、拡張子を ".tre" にして読み込ませる.
- 課題1: 生物種1-6のEDN遺伝子に対し,
- 適当な置換モデルを選び,
UPGMA による系統樹をつくれ.
- 適当な置換モデルを選び,
Neibor Joining Method による系統樹をつくれ.
- 最大節約法で系統樹をつくれ.
- 最尤法で系統樹をつくれ.
Copyright (C) 2004, Hiroshi Omori. 最終更新:2008年10月15日