DAS その後

DAS client を本気で実装することにしようと思う今日この頃。
DSN のアドレス:
UCSC: http://genome.cse.ucsc.edu/cgi-bin/das/dsn
EnsEMBL: http://www.ensembl.org/das/dsn
KEGG: http://das.hgc.jp/cgi-bin/das/kegg/dsn
DSN entry の、MAPMASTER で示される URL (たとえば http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18) のうしろに、entry_points をつけてやると、そのデータベースの entry point が出る。
http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18/entry_points とか。
同様に、types をつけてやると、そのデータベースから手に入るデータタイプのリストが手に入る。
http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18/typesとか。
entry point には segment (つまり、染色体とか) の id のリストが載っているから、
http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18/features?segment=1:1,5000
みたいに叩けば、1番染色体の 1-5000bp のところのデータががっつり取れる。
ほかにも、
http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18/features?segment=1:1,100000;type=knownGene
特定の type だけを選んだり、
http://genome.cse.ucsc.edu:80/cgi-bin/das/hg18/features?segment=1:1,100000;type=knownGene;type=refGene
複数のtypeを選んだりできる。
UCSC の DAS は human genome とかだとかなりよさそう (EnsEMBL のデータも入ってるし)。
ensGene(EnsEMBL gene), knownGene, refGene, mrna, ECGene (cDNA ベースの予測ツールの結果), geneid (ab initio の予測ツールの結果), genscan(ab initio の予測ツールの結果), nscanGene(比較ゲノムベースの予測ツールの結果) などのデータが使えそう。Thanks to Hacchy!

コメントを残す