Bioinformatics のセッション。
[ 14: メディカルゲノム黄色ブドウ球菌タンデムパラログ遺伝子群における多様性形成モデル ]
バスに乗り遅れて、間に合わなかった…
[ 15: ゲノムアライメントに基づく近縁微生物ゲノムのコア構造の抽出 ]
基生研の内山先生。
Core = 類縁ゲノム感で主に垂直的に伝搬し、広く保存されている。
共通部分をとることで見つけるのが簡単。でも、
– 全部が持っている遺伝子は、生物種が増えるほど減る
– 正しいオーソログをどうとるか?
そこで、遺伝子の並び順の保存性に基づいて決定することにする。
MBGD で ortholog group を作成、グラフを作って DP で決定。
半分以上で保存されていればいいことにして、バチルス: 1376, 腸内細菌: 1814 のコア遺伝子セットを抽出。
ゲノムが大きいからといって、コア遺伝子を全部持っているとは限らず、コア構造からはたくさん欠失してしまっている場合もある。
並びはわりときれいに保存されている。
コア遺伝子には metabolism とか replication が多い。逆に膜輸送・signal transduction とかが少ない傾向。
RECOG というツールを公開予定。MBGD でできることがだいたいできる?
[ 16: 248種の原核生物ゲノム間の膜タンパク質割合 ]
SOSUI: 膜タンパク質予測ツール。
このツールを使った結果、総遺伝子数に占める膜タンパク質の割合はどんな生物種でもだいたい同じ、と予測。
多少ばらつきがあるが、ばらつきは正規分布でフィッティングできる。
ゲノムにランダムな変異を与えて (ただし、アミノ酸組成の割合は保つという制約あり) シミュレーションしてみると、同じ傾向のばらつきになる。
本質とは関係ないが、めちゃめちゃスライドがかっこいい。図とかが気合い入ってる。
Mac かと思ったら、Office XP なんだけどね。やっぱりツールよりセンスが重要ってことです。
[ 17: オリゴペプタイド情報を用いた一括学習型の自己組織化マップ法による機能未知のタンパク質類の機能推定法の開発 ]
SOM で、2連・3連アミノ酸の使用頻度を学習させることでタンパク質の機能を分類。
タンパク質はひとつひと機能とは限らない、とこいうところが今後の問題。
[ 18: 代謝ネットワークにおけるノードの「機能」とネットワーク内での「位置」の関係に関する研究 ]
完全に気絶してました。
[ 19: KazusaAnnotation: ゲノム情報への注釈付け、注釈の利用を支援するシステム ]
Social bookmark による open annotation.
http://a.kazusa.or.jp/
アノテーションと文献と関連づけとか、そういう感じ。どの文献にどの遺伝子がでてきたか、みたいなのを集積できるのだが、どうやら手動っぽい。
ふうむ。
でも、social bookmark 的にやれるのはおもしろいね。
[ 20: GenomeMatcher比較ゲノム用ソフトウエア ]
http://www.ige.tohoku.ac.jp/joho/gm.html
– BLAST, clustalW などを呼べる
– ユーザの注釈情報を簡単に反映できる
Excel からannotation が copy&paste で流し込める (フォーマットは決まってるけどね)。かっこいい!
拡大したりパラメータをかえて描いた絵を一覧にしておけるところがイカす。
gap のところを clustalW に投げたりできるのかー。
うおお。細かいところを見られるのがいいね。
丸いのも見られる。
やべー、俺もやることはまだまだあるな!
どれくらい大きい配列までいける? → 300Mbp くらいまで行ける。10Mbp くらいに区切って、1時間とか。