Recently in Conference Logs Category

SGMJ 2010: Day 2

| No Comments | No TrackBacks

[高温・高圧の地下原油鉱床における固有微生物群とその特性]

秋田市八橋、新八橋油田。
- SR123 1687m, 98度, 113atm
- SR39 1100m, 74度, 29.2atm
のふたつの井戸から、地層水を含めてサンプルを直接採取。ここは海水注入とかそういうことはしていない井戸で、地表の取り出し口じゃなくてその地層のところから直接サンプルを採取している。

菌種の分布には違いがある。
高熱性の菌は GC-content が高いので、それを使って並べ替えると面白い。地表の取り出し口ではいろんな菌が増殖している。油井を掘るときに岩を削るのにたくさん水を流すので、そこでコンタミして、昔はいなかった連中がいる可能性もある。

重要なのは Bacteria と Archaea がうまくまじっているということ。酸素がない状況で Bacteria が有機物から水素を生成して Archaea がそこからメタンを作ることによる栄養共生。

[ランチョンセミナー]

Roche GS Junior
- Read length: 350bp
- Reads/run 100,000
- レーザープリンタと同じくらいのサイズで、机における。経済性を追求。
- 454 の 1/3 くらいの値段 (キャピラリーシークエンサと同じくらいの値段?)
- 2000万円あれば周辺機器も全部買えます。本体は1500万円くらいかな? コンピュータも付属
- 1 run の費用は10万円くらい

GS FLX Titanium 1k
- Read length: 1000bp
- Reads/run: 1,000,000

ガスケットで仕切るのと tag を使って分けるのとどっちがいい? → サンプルが少ないときはガスケット使った方が簡単。

[受賞記念講演]

真核生物の研究は酵母や動物細胞で行われており、植物では遅れている。
植物は倍数体が多いのでしんどいが、光合成をする真核微生物であれば、いろいろなことがわかる。
なるほどなー。

アブラムシの共生細菌からの水平転移遺伝子群。細胞内共生。
もう細菌は住んでいないけど、水平転移して残っている、というのがある。
共生とか寄生は面白いなあ (寄生されるのは、いやだけど)。

[マルカメムシ類の腸内に存在する必須共生細菌イシカワエラの比較ゲノム解析]

植物師管液を主たる栄養源とし、腸内に必須共生細菌イシカワエラをもつ。
ダイズでどれくらい繁殖できるか、というのが共生細菌で決まっている。

[Metagenomics-based 16S ribosomal RNA gene profiling]

454を使うので、chimera ができたり PCR bias がかかったりしない。
そうかー。うーん。やっぱり metagenomics って難しいんだなあ。

SGMJ 2010: Day 1

| No Comments | No TrackBacks

[比較ゲノム解析から発見されたグラム陰性細菌の新規タンパク分泌機構]

慢性歯周病の最重要細菌 Porphyromonas gingivalis.
偏性嫌気性、糖非発酵性、タンパク質分解酵素産生分泌、ヘム鉄要求性...
(つまり血液寒天培地で増やす)

II 型、III 型の分泌機構をもっていない!
この新しい分泌機構は2成分制御系で動いている。でもなんでだろ?
外部環境との関係とかがあるのかな、というお話。

[酢酸菌のゲノム易変異性の解析]

リケッチアとか根粒細菌と同じ Alpha-proteobacteria だけど独立して増殖できる。
ナタデココ (セルロース) を合成する奴もいる。
いろいろな carbon source を使っていろいろな二次代謝産物を作るのでよく使われるが、培養している間にどんどん形質がかわって、複数のコロニーを形成するようになることがある。

プラスミドが7つとか、たくさんある。それから、全遺伝子3000くらいで、そのうちトランスポゾンが300個くらい。10% 近いので、わりと多い方。Microsatellite, short tandem repeat がみられ、その長さで DNA polymerase III とか DNA helicase が変わってしまう。

90kbp とかの欠失が起きている株もあり、このグループの連中は genome reduction が起きやすいのかも?

大きな欠失があっても代謝系が壊れない (死なない) のでいろいろな mutant が見つかるのかも、というコメントも。

[転写開始点の塩基種に依存した枯草菌の緊縮転写制御ネットワークの解明]

アミノ酸飢餓状態とかでの転写制御系が、転写開始点の1文字目2文字目が A か G かで正の制御になるか負の制御になるかが違う。GC 含量ってそういうところにもきくのかな?なんか面白いね。

大腸菌と枯草菌では違う系だということだけど、他はどうなってる? → グラム陽性・陰性でずばっと分かれるのかも。

[新規情報学的手法によるインフルエンザAウイルスの俯瞰的可視化及び新型H1N1の変化予測]

BLSOM で、4塩基連続頻度をマップしてみると宿主別にきれいに分かれるよ、というお話。でも、新型H1N1はいままでの human のとは傾向が違って、avian のとの境界あたりにマップされる。これ使うと、いろんなインフルエンザウイルスのどれが次にヒトに感染しやすいか、みたいなのを計算できる。

Human flu は AT rich らしい。まじで?

[次世代シーケンサSOLiD3システムを用いた泡盛実用黒麹菌の比較ゲノム解析]

A. niger, A. awamori, A, saitoi など。
A. niger などの既報配列と比べたり。

GejiGeji: リファレンスと2試料について類似性を調べるツール (これ、read depth がずっと出るわけだけど、けっこう面白いな)。これを使ってみると、それぞれの麹菌株に特徴的な欠失領域があり、A. awamori と A. niger は大きく異なることがわかった。

欠失があるのはわかったが、特異的に多いところというのはわからない? →いまの解析方法だとわかんないです。

[バクテリアゲノムのリシーケンスによる変異解析とその問題点]

枯草菌168のリシーケンスのお話。枯草菌がみんなに配布されてから20年で、その間にいろいろ変異が溜まっておる。

maq (ungapped) と bwa (gapped) を使っている。
挿入・欠失など De novo のところは velvet + mummer を使っている。
いろいろなところの株を読んでみた。SNPは遺伝子の中に、indel は遺伝子間に多い。変異はいろいろあるが、どこでも同じようなところの変異が起きている。3rd letter の変異率が高い (42%)。ナンセンス変異は起きていない。

[多数株の種内比較によるゲノム進化ダイナミクス解析]

ピロリ菌日本株。
Mutagenesis, recombination, rearrangement で、とにかくゲノム進化が速い。
正確に読みたかったので Sangar 法で読んだ。
東アジア株はずいぶん遺伝的に遠いんだな。
1200の遺伝子について、RECOGを使ってマッピングしている。

東アジア株で特異的に喪われている遺伝子が5、特異的に存在する遺伝子が3。
東アジア株で特異的に重複が起きている、あるいは逆の遺伝子もある。などなど。
Mauve で rearrengement を計算している。Mauve か・・・悲しい。

[大腸菌における複製と翻訳の遺伝的ネットワーク解析]

E.coli の網羅的一遺伝子ノックアウトライブラリ (Keio collection) を使ってる。

科研費ゲノム特定成果公開シンポ: Day 2

| No Comments | No TrackBacks

[ DNA はどのように折りたたまれているのか? ]

森下先生@東大。
源氏物語: 原本は存在しなくて、写本がたくさんあり、それぞれ巻数が違ったり indel とかがある → ゲノムの染色体の本数とか配列の違いに似ている?
ヒトのゲノムは 10 時間で複製される。50塩基/秒で、100並列。

祖先ゲノムがどうだったか、ということを知るのに、ヒト・チンパンジーとホヤ・ナメクジウオだけではなくて真ん中の魚類くらいのが必要だった。
脊椎動物の祖先ゲノムは10本くらいの染色体があったのではないかと推定しており、ヒトに至るには2度のゲノム重複が起きている。魚類はさらにもう一度。

染色体が物語の一巻だとしたら、ページに対応するのがヌクレオソーム構造。
プロモーター結合がページを開くことに、メチル化がページを閉じることに例えられる。
(染色体をコピーするときはヒストンに巻きついた状態で複製され、体細胞の分裂の際にはメチル化の情報も伝わっているっぽい、のだそうです。)

メダカ+Solexa で調べてみた結果、ヌクレオソーム構造を取っているところとそうでないところで、塩基置換率が違う (ヌクレオソーム構造を取っているところでは、ヌクレオソーム構造を保存する方向に塩基置換が起きている。10年くらい前の酵母の研究では、ヌクレオソーム構造の中心ではリンカーの部分に比べて修復率が落ちているので、そっちが問題なのかも) ことがわかった。おもしろいな。

コンピュータはだいたい 2x in 18month なのが、sequencer は 2x in 8month なのでやばいね、というお話も。そうなんです...
Solexa は 1bp/h くらいで超並列だけど、Pacific bio のは 4bp/s くらい。ただ、後者は並列化が課題みたい。

中国はすごい勢いで Solexa GA とかを購入して頑張っているそうだ (台数としては、日本全体とあんまりかわらないけど、日本は分散しているのが問題かな。)。うおー。がんばらないとなあ。

[ Wiki によるデータベースと研究成果の発信 ]

有田先生@東大。
計測と解析は速くなった。でもその真ん中にある整理 (curation) は?
科学は知識の積み上げだから、成果が再利用されないと意味がない。でも、論文も学会発表も報道発表も、再利用には向いていない。

我々はデータ中心という新しいパラダイムに直面している。一般人は科学を信じ、期待しているのに、科学者は一般人に理解してもらうことを放棄。科学者がデータ中心の概念に対応できていないのは問題で、いつまで雑誌崇拝がつづくのか?
subscription fee が上がっている背景には、投資ファンドが雑誌の出資元を持っていることも影響している。

有田先生 Wiki はすでにいくつかの学会の公式なデータベースとして認定していただいているそうで、成果公開というのは大変重要なプロセスにおけるこういう活動は非常に重要だと思う。

数式とか理論的なものはいいけど、ゲノムとかそういう大規模なデータはどうやったらいいと思いますか (森下先生) → Wiki は backend が RDB なので、なにかそういうものを考え直さないといけない。いずれにしても Web ベースでやれる仕掛けは必要。

[ 多生物種のゲノムを高速に比較する並列システムの開発 ]

榊原先生@慶應大。
質疑だけメモ。

- マウス・ラットでは再編成が起こりやすい系統があるようですがそういうのと比べてみると面白いかもしれません。
- X染色体はヒトとチンパンジーでかなり保存されているがY染色体はシャッフルされている、という話がでているけれど、どうでしょう。 → Y のほうはまだアセンブリがきれいに進んでいない生物が多いので比較ができないのが現状です。
- NIG とか UCSC で visualize できなくて Murasaki & GMV でできるものは? 入力フォーマットは一般的なもの? → お答えしておきました。まさか回答させられるとは・・・

科研費ゲノム特定成果公開シンポ: Day 1

| No Comments | No TrackBacks

午後から参加。微妙に遅刻したところを U 先生に見つかってしまいました。えへへ。
廊下で立ち話して、最近の進捗をお伺いする。お手伝いできることがありそうなのでがんばります。

[ 土壌での微生物の生き様をゲノムから見る ]

津田先生@東北大。
土壌汚染物質を添加して、時系列でメタゲノム。菌叢が大きく変わるの、面白いな−。
しかし、メタゲノムやると、16s rRNA は 99% データベースに当たらない暗黒な世界なのだそうで、それはどうやったら解決できるのかね?

[ 麹菌のゲノム情報を活用した有用タンパク質の高生産 ]

五味先生@東北大。
「もやしもん」で微生物に興味を持つ高校生が多いのかー。
洗剤のアルカリ・リパーゼは麹菌の組み替え株で大量生産しているのだそうな。
固体培養 (麹培養) と液体培養では全然生産性が違う。低水分ストレスとかが効いてるのかな。
いろんな転写因子を網羅的に高発現させてみた。

麹菌に遺伝子導入をして工業的に使う、というのは既にいろいろやられているのだけれど、麹菌はプロテアーゼとかペプチダーゼを大量に作る (しかもものすごい種類を持っている!) ので、遺伝子導入してもせっかく作ったタンパク質を壊してしまう。
タンパク質分解酵素に関連する転写因子をみつけてそれを破壊してみたところ、多くのプロテアーゼの活性を抑えることができ、収量が改善した。

[ 病原性大腸菌の比較ゲノム解析とその応用 ]

林先生。
O157 ではふたつの IS (IS629, ISEc8) が飛び回っており、ファージのところに頻繁に入っている。
2回のPCRでO157であるかと、どの株であるかを特定することができるプライマーセットを作った。これは、集団感染であるかどうかを診断するために非常に有用で、制限酵素+パルスフィールドよりずっと速く、簡単。TOYOBOでキット化しており、診断に使われている。

日本では O157 >> O26 > O111 だけど Non-O157 の割合が増えてきている。欧州などではO157 の割合は比較的少なく O121 > O91 > O103 > O128 > ...
O26, O111, O103 の配列を決定したが、ゲノムワイド系統解析では O157 とはまったく別になるものの、遺伝子クラスタに基づく解析だと EHEC は同じグループになり、並行進化していることがわかった。
Non-O157 EHEC のラムダ型ファージも、O157同様に III 型分泌器をもっていたり、プラスミドが同じような病原遺伝子セットをコードしている。でも、プラスミド間で相同性があるのは病原遺伝子の領域だけで、もともと同じプラスミドを獲得してきたわけではなさそう。

O157 とウシとの関わりはこれからやらないといけない。直腸の出口あたりにかなりの長期間定住しており、ウシでは病気は引き起こさない。一種の常在細菌といえるかも。

[ メダカの研究から発生、進化、病気のメカニズムを理解する ]

武田先生@東大。
メダカの内臓逆位個体では繊毛のモータータンパク質の欠失による腎臓病 (多発性嚢胞腎) や精子の運動性低下が起きる。ヒトでも繊毛の運動性低下が原因の遺伝性疾患があるが、同じ遺伝子の塩基多型が原因で発生することがわかった。

背腹の形成に異常がある変異体 (お腹も背中も丸くて銀色で、背びれと腹びれが同じ大きさ) もある。これの原因領域には2つの遺伝子があるだけだが、これらのコード領域は同じ。しかし、変異体では転写制御領域に変異があって発言パターンが異常になっていた。

メダカはいろいろな変異体が愛好家によって飼われていて、ゲノムも一倍体なのでいい感じ。金魚は四倍体?

[ 立襟鞭毛虫のゲノム情報から動物の多細胞化を探る ]

岩部先生@京大。
Monosiga ovata. 淡水性。64Mbp. 2万遺伝子。
海水性のは 42Mbp で、9000遺伝子くらい。

チロシンキナーゼは動物特異的だと思われてきたが、立襟鞭毛虫でも見つかっており、分子進化系統樹を書くと面白い。ほかにも動物特異的に多様化したと考えられていたシグナル伝達分子があり、それらは今後の課題。

イソギンチャク (刺胞動物): 神経系あり。
センモウヒラムシ (板状動物): 細胞が4〜5種類。神経系がない。
とかの微妙なところを含めて比較ゲノム解析してみた。

これすごいなー。

カドヘリンは僕らは細胞接着に使うけど、立襟鞭毛虫も持っている。襟のあたりでエサを捕まえるとか、なにか違うことに使っているのかも?

[ マウス亜種間ゲノム分化を利用した複合形質の遺伝解剖 ]

城石先生@遺伝研。
Mus musculus は地域ごとにいろんな亜種がある (北米には元々いなかった!)。
世の中で使われている実験系統 (C57BL/6J) は西ヨーロッパ産亜種。
遺伝研では三島でつかまえたマウスから日本産亜種の系統 (MSM/Ms: MSM=MiShiMa) を確立。 亜種間の塩基置換率は 0.87% くらい。

MSM/Ms はキャピラリーで 2.4x, Solexa で 15x で読んで貼り付けて、99% coverage. 11,742,976 SNPs. うち、Non-synon. SNPs (アミノ産置換あり) が 26.000. Non-sense mutations は 131 遺伝子で見つかった (0.5%!)。
MSM/Ms は体のサイズが約半分、発がん抵抗性が高い、エネルギー代謝系が節約型、など、表現形のレベルでいろいろな違いがある。

亜種間交配によって特定の染色体だけが別の亜種由来なもの (コンソミック系統) をすべての染色体について作った。

多くの量的形質については、単に足し算と引き算だけで成り立つ (全部足したら100%になる) のではなく、全部足すと100よりずっと大きくなる (遺伝的交互作用=epistatsis が強い) ことがわかった。

ReConFig '09: Day 3

| No Comments | No TrackBacks

- A reconfigurable architecture for stereo-assisted detection of point features for robot mapping

Active sensors: sonar or radar is effective in low density, low noise, low interference environment. (Low density というのが、なるほど、と思った)
Passive sensors like vision systems are effective in practical situations.

Dynamic programming を使ってステレオ処理をやるらしい。かっこいいぞ!

- FPGA implementation for direct kinematics of a spherical robot manipulator

ロボットアームがいまどういう状態になっていて、どういうふうに力をいれれば所望の状態に持って行けるかを計算する。行列演算。

- Parallax‐Docking and Reconfiguration of Field Programmable Robot Arrays using an Intermittently‐Powered One‐Hot Controller

Field programmable robot array!
マイクロロボットですよ。ロボットは configuration 情報をもっており、いろいろ書き換えられる。MEMS な足で動き回ったり、MRAM based な nonvolatile flip-flop とかを持っている模様。
すげえかっこいい。なんじゃこりゃー。

[ Session SC1 : Track on Reconfigurable Computing for Security and Cryptography ]

- Improving the Security of Dual Rail Logic in FPGA using Controlled Placement and Routing

消費電力からのサイドチャネルアタックを防ぐために、逆の論理で動く回路をつけて対称にするやりかたがあるわけだが、それをうまくやるための FPGA アーキテクチャと設計ツールの研究。

- Accelerating Cryptographic Applications Using Dynamically Reconfigurable Functional Units

村上先生のところの発表。フランスの人ですが。
Reconfigurable functional unit を持った ASIP (Application Specific Instruction-set Processor) を作って暗号を高速化しましょう。

- Tailoring a Reconfigurable Platform to SHA‐256 and HMAC through Custom Instructions and Peripherals.

[Session SC2 : Track on Reconfigurable Computing for Security and Cryptography]

- Observing the randomness in RO‐based TRNG

Ring oscillator based TRNG!
デバイスは STRATIX. FPL '08 にもあったかな...

- Proof‐carrying Hardware: Towards Runtime Verification of Reconfigurable Modules

こういう研究は大事だと思うのだが、どういうタイミングから現実的なものになってくるのかね?ソフトウェアでそういうもの (つまり、実行するバイナリが安全であると証明するもの・仕掛け) があるか、といわれるとそれは微妙だったりするし、しかし、ハードウェアであるからこそ大事なのかもしれない。うーん。。。

モジュールを使う側の検証にかかる時間をなるべく少なくして、負担をモジュールを作る側に移すことが大事なのか。なるほど。

ReConFig '09: day 2

| No Comments | No TrackBacks

自分の発表まではすごい勢いでいっぱいいっぱい。
僕は HPC というより design automation だと思うんだけどな...
HPC のセッションは僕以外けっこうおもしろかった。帰ったら予稿を読もう。

ReConFig '09

| No Comments | No TrackBacks

[Opening]

- 131 submitted papers
- 42 full papers
- 35 posters
- 4 from Japan (5位くらい)

[ Keynote 1 ]

Semiconductor in transition:
- 32nm scheduled to debut by 2010
- 22nm is deemed feasible
- fewer, new architectures on the latest processes
- programmability and concurrency are the new imperatives

Parallel processing becomes Chip-level Multi-core processing (CMP)
- Power dissipation is a dominant, cross-cutting concern

Xilinx vision: fabless & programmability.
よく考えるとああいう最先端のチップを fabless vendor が作るってすごい。

SPARTAN-6 では昔のように、Parallel I/O は外周に配置されているが、Virtex-6 では内側にある。かっこいい。
消費電力は最大で 65% 減っている。

Linux 2.6.30 included the MicroBlaze architecture for the first time in a mainstream kernel release! まじか!!
QEMU + PetaLinux で、実機がなくてもデバッグできる。
http://youtube.com/watch?v=f3cC44OPZ1M

Embedded Software design cost already exceeds hardware design cost.
並列プログラミングが問題。
Concurrent software compiler: enables compilation and SW development in highly parallel processing SOCs. Productivity +200% in SW. Expected in 2013.

[ General Session 1: Arithmetics ]

- FPGA implementation of decimal floating-point accurate scalar product unit with a parallel fixed-point multiplier

10進です。
iEEE754-2008 の decimal64 data format. BCD使って計算する。
Virtex-II Pro での周波数は 70MHz+ で、悪くない。パイプライン段数は 11.

"It makes me nervous to fly on airplanes, since I know they are designed using floating-point arithmetic" Alston Scott Householder.

- Runtime memory allocation in a heterogeneous reconfigurable platform

TUDelft の人。
しかしわし、こういう話はわからんちゅうに。

- Hotspot Mitigation using Dynamic Partial Reconfiguration for Improved Performance

Temperature distribution is not uniform → Temperature controlled reconfiguration をしましょう、という話。温度は ring oscillator で測るのか!
それで、しんどいところを移動させることで、全体の発熱を抑えることができるらしい。結果として速い周波数のまま動かせてスループットが上がるのか。なるほどー。

- A systolic array based architecture for implementing multivariate polynomial interpolation tasks

なんかプログラムと違うぞ、と考えていて、Session 1 と 2 がfuse されている、ということにやっときづいた。
どういうことだ・・・

[ General Session 3: New FPGA Architectures ]

- A Novel High-Density Single-Event Upset Hardened Configurable SRAM Applied to FPGA.

Xilinx の QPro シリーズでは 4SEU/Day くらい。
TMR + Scrubbing が必要かな。

SEU-hardened CSRAM というのを提案。
PMOS トランジスタを入れて、8トランジスタ/Cell になるけど、これならそれほど大きくないよね、という話。
6-T SRAM だと 29um^2 くらいだけど、このやりかただと 32um^2 くらい、だと思った。数字間違ってたらごめんなさい。でも、オーバーヘッドは 10% くらい。

SEU が起きる threshold みたいなのは MeV で測るのかしらん?
勉強しないと...

- MRAM based eFPGAs: Programming and silicon flows, ...

SRAM is fast, easy to reconfigure, but volatile.
Flash is nonvolatile, but slow.
MRAM is... wow.

shadow reconfiguration: update magnetic information independently from the latch configuration (change committed later).
SR とかは普通にできるっぽい。

[ Session HPC1: Track on High-Performance Reconfigurable Computing ]

- A Traversal Cache Framework for FPGA Acceleration of Pointer Data Structures: A Case Study on Barnes-Hut N-body Simulation

FPGA を使う場合にしんどいのはポインタを使った間接アクセスで、アクセスパターンが irregular になるので遅くなる。間に traversal cache を入れて、うまくバンド幅を稼げるようにしたい。
普通の traversal cache は同じアクセスパターンが繰り返される場合に効果があるが、それではたいていはうまくいかない。そこで、似たようなアクセスパターンでも効くように改善。

n体問題ではうまくアクセスレイテンシを隠蔽できたそうだ。
濱田さんの実装も参考にしたらどうよ、と平木先生。

- Triple line-based playout for Go

碁ってよくわかってなかったんですが、なんか理解した気がする。
ひとつ石を置いたときにがらっと場がかわることがあるので、実装はけっこう難しい。

碁盤を3段ずつにわけてスキャンするのは、19x19だとでかすぎるから。
ソフトウェアの倍くらい出ているが、こういう問題では性能でなさそうなので、すごいのかも。

- Scalability Studies of the BLASTn Scan and Ungapped Extention Functions

Univ. of North Carolina at Charlotte
かなり速い。ベンチマークには env_nt とか env_nr database を使っているので、scalability issue は問題なさそうだ。処理は NCBI BLAST に準じているとのこと。データセットも現実的だし、価格対性能比なんかも示しており、非常に好感が持てる。

TimeLogic Decypher Machine というのを比較に使っているけど、これなんだろ。Quad-core Xeon と FPGA が載っているらしい。これ か。

配列関係はバンド幅が手強いのでやらずにきたんだが、最近は PCIe とかあるし、やってみるかなー。

- Low power, reconfigurable computing platform for spacecraft

High throughput, radiation tolerant and low power. Streaming 処理とかしたい。
FPPA: Field programmable processor array
NASA と組んでいる。

[ Poster 1 ]

- Prevention of hot spot development on coarse-grained DR architectures
- Floating point hardware for embedded processors in FPGAs: Design space exploration for performance and area
- A 10Gbps OTN framer implementation targeting FPGA devices
- FPGA implementations of BCD multipliers
- Matrix multiplication based on scalable macro-pipelined FPGA accelerator
- PCIREX: a fast prototyping platform for TMR DR systems
- Speeding up fault injection for asynchronous logic by FPGA-based emulation
- Base-calling in DNA pyrosequencing with reconfigurable bayesian network
最後のやつに興味があったのですが、cancel っぽい。

デザインガイア2009: Dec.04, 2009

| No Comments | No TrackBacks

[ FLOPS2D の設計コンセプト ]

JAXA における数値シミュレーション:
- 1980 年に M380 で二次元翼
- NS-I (1987): 1GFLOPS
- NS-II (1995): 数値風洞 : ベクトル計算機 280GFLOPS
- NS-III (2000): スカラ型 9.7TFLOPS
- JSS (2009): 140TFLOPS

二次元翼→三次元翼→オイラー全機→反応流→タービン全周解析→NS全機解析→...

三次元非定常計算の例: 液噴流コアの直接数値計算 (気液二相解析):
- 格子点: 60億
- 格子幅: 0.6um
- 5760コア、60TFLOPSで1ヶ月
- 出力総量: 153TB
100倍の計算をしようと思ったらどうするか...?

いろいろなCFDのコードがあって、メモリアクセスが主だったりディスクアクセスが主だったりする。ということは、固定されたアーキテクチャではしんどい。
リコンフィギャラブルで、「運用可能な程度にコンパクト」なシステム方式。
さきほどの乱流噴霧のだと、実行効率は4%くらいなので、もうちょっと効率よくしたい...

非定常計算が増えているのでファイル処理が問題。

柴田先生: 計算に合わせて構造を変える、というのは、つなぎかたを変えることを考えている? それともFPGAの中だけ? → 両方を考えています。現段階では機能を詰め込めるか、というところが問題。将来的にはバックプレーン的なもので専用の interconnect を作ることも考えている。
京先生: 4% くらいの実効、というボトルネックはどこにあるか解析されていますか? → 噴流の問題では通信が問題になってしまっている。実際のところスカラ型の並列計算機で 4% というのはそんなに悪くないと考えているが、ひと桁効率をあげたい。
山口先生: GPGPUでもGRAPEのような専用パイプラインでもなくFPGAなのはなぜでしょう? → GPUやCellのほうが性能は出しやすいのだが、センター運用という観点で reconfigurability に魅力を感じている。
泉先生: いまのソフトウェア実装は並列システムに適した実装 (データの空間的局所性) になっている? → はい。HPF 系の言語を使っているのでわりと楽にかけています。MPI を使う場合はデータの局所性を考えてやっている。マルチコアに関してはコンパイラに任せてスレッド並列化し、ユーザはチップ間の並列化をチューニングする感じ。
中條先生: ホストに接続できるカードの枚数は上限がある? → プロトコル的には 64 くらいまでだけど、まだ実装はしていない (し、ハードウェア的には制限がないはず)
京先生: どれくらい市場規模があるか、というのがメーカーの人間としては気になります → CFDの計算機の潜在的な需要は高いが、大規模なCFDとなるとあまり売れないと思う。それでも共通利用施設としての計算機センターとしてシステムを提供することは重要。

[ 各種暗号処理に適した2入力LUTプログラマブルロジックアーキテクチャの検討 ]

2入力LUTからなるePLXcryptと、sbox用のメモリMEMcrypt.
DES, AES, Camellia, などを実装することを考慮している。
ePLXcrypt は、配線と LUT の粒度を変えることでトランジスタ数を 40% くらい削減。

中原先生: LUTの入力サイズが2、というのが気になる。配線ふえないのはなぜ? → XOR とかが多いので。
山口先生: 結局はこれ、粗粒度アーキテクチャ的な方向なのでは? → ビットシフトとかがどれくらいうまくできるかがよくわからないので、検討していきたい。
京先生: 開発ツールは? → ePLX は専用のツールがある。ePLXcrypt はまだない。

[ マルチFPGAシステムFLOPS-2Dに向けたパイプライン構築手法の検討 ]

RER! RER!

中條先生: PCクラスタの限界というのは台数を増やしても性能が上がらないということ? →通信が飽和しちゃう。
回路を分割した場合の複数のFPGAの同期はどうしている? → そのうち...
柴田先生: 複数のFPGAに分割するときの問題にはまず通信量があるのでは? → 切り口にするところはなるべく細いところを手で探して、そこを候補点にしている。
山口先生: メモリボトルネックなのか、演算密度が高いのか、発表ではよくわからなかった →
名古屋先生: 分割したもののひとつだけが速くなっていても全体は速くなりませんよね → グローバル最適化が必要だと思います...

[ 3アドレスQDDマシン用コードの最適化アルゴリズムについて ]

Binary Decision Diagram: 論理関数を評価してシミュレーションを行う。
評価時間は平均ステップ数に依存。

MDD(k): BDDの2値変数をk個ずつグループ化した決定グラフ。
最大でBDDのk倍速くなるが、メモリ量が2^kに比例して必要。
で、QDD を評価するための専用マシンを作る。

ふんがさん: 命令長とかアドレス長は? → 命令が32bitで、アドレスが8bitくらいで3アドレッシング。ほんとはQDDだから4アドレス入れたいけど、そうするとアドレス幅が短くなりすぎて、大きな関数が評価できなくなってしまう。
柴田先生: どの変数とどの変数を合体させるのかとか評価順とかを含めて最適化している? →

[ 動的再構成型可変長複合回路の性能評価 ]

すみません、ちょっと席を外しておりました。

[ H264エンコーダのコア関数のSTPエンジンへの実装 ]

H264は動き予測が高度で、2倍以上の圧縮効率。だが、CPUでは大変。
NECの STP (Stream transpose) エンジン搭載の X-bridge に実装。
む、これって DRP か!!

泉先生: いまのチューニングは将来はコンパイラがやってくれそうか? → いまは手作業です。将来はやってくれると信じたい。
堀先生: オフロードしたのは全体のどれくらい? → 11% くらい。他の部分も同じくらいいけるかな、と思っている (が、関数を選ばないと難しい)
堀先生: 配列にアクセスできるのはふたつまで、というのは改善できる?→ DP RAM なので、たくさん使えば同時アクセス数は増やせます

デザインガイア2009: Dec.03, 2009 午後

| No Comments | No TrackBacks

午後の RECONF

[SRAM型FPGAの部分再構成によるエラー訂正手法の一検討]

SEUで回路が壊れたときにそこを部分再構成する。
Virtex-4 からフレーム単位で部分再構成ができるが、Xilinx のツールではできない。

九工大 中原先生: TMR自体のエラーは考えていない? → voter は壊れないものとしている。voter のところは一定時間間隔で scrubbing (書き直し?) することで信頼性を確保すればいい。
堀先生: フレーム単位での部分再構成は EDA がサポートしていない、というより、1フレームに収まるモジュールは扱えるけど、複数フレームにまたがるようなモジュールはダメ、ということであっていますか? → はい。
堀先生: Readback は誰がやっている? → 外部のPCでやっています。FPGA内部でやるよりは、同じボードにそういう回路を載せることを考えている。

[ MEMS を用いた反転・非反転ダイナミック光再構成型ゲートアレイ ]

TI のデジタルミラー (1024x768) を使用。応答時間は数 ms.
ゲートアレイのほうは、フォトダイオードの接合容量をメモリとして使うやつ。

LUT には 16 個のフォトダイオードがある。でも、照射する点の数が増えるとパワーが下がるので、なるべく照射点数は抑えたい。それで、LUT あたり 4 つのビット反転用フォトダイオードを追加して、それを使って転送ビット数を増やせるかな、という研究。

22% くらい明点を減らせて、それに従って 700ns から 600ns に再構成時間が縮みました。わほーい。

久我先生: 今回は OR 回路なので単純で、明点の数が少ないと思うんだが、実用的な回路になるとどうか → ビット反転の仕掛けで明点を削減するのは大事。複数のレーザーを使ってやる方法もある。
山口先生: 細粒度だけどいっぺんに書き換えられるからいいよね、という方向性か、粗粒度な方向にいくのか → ちょうどいま分岐点に立っていて、考えている。

[ 宇宙放射線に対して高い耐性をもつ光バッファリング手法 ]

構成情報をホログラムメモリに記録しておいて、それを使って不良部分を再プログラムする。
ホログラムメモリにノイズを付加した場合の再構成時間なども測定。

名古屋先生: フォトダイオードが一部不良でもうまくいく、というところをもうすこし詳しく教えてください → 不良になったビットが使えなくなるだけで、他は使える。
渡辺先生@岡山大: ホログラムの冗長性というのは何倍くらいあるんでしょうか? → ポスターでお願いします。

[ PCAにおける圧力の概念を用いた回路増殖法の評価 ]

どこかで集中的に回路リソースを管理するのではなくて、ローカルに混雑具合を見ながら回路をずらしたりしていって、必要なところに空き領域を作る。
構成手順は大幅に減ったけど、通信量が増える。まあ、そりゃしょうがないか。

[ スケーラブルFPGAシステムにおけるハードウェア拡張プロトコル ]

複数の FPGA にまたがる回路をどうやって同期するか?

久我先生: こういうの、どういうアプリケーションだったらうまくいくとかいかないとか、そういう知見があればぜひ...

[ 並列ふるい法とMPUを用いたウイルス検出エンジンについて ]

Snort と ClamAV: パターン数が二桁違う。Snort のほうが手の込んだ正規表現を使っている。

ClamAV では2段階マッチングをしており、パターンの先頭3文字をexact matchで見て、残りをpattern matchする。
インデックス生成関数がキモなのかな。

泉先生: 束縛変数とかを見つけるのはPCでやっているので、アップデートはFPGAの上だけじゃできない? → はい。
山口先生: 最初のexact match のところが速くなっても後ろがしんどくなる、ということはない? → そういうケースはカウンタを入れて見つけて、攻撃とみなしてしまえばいい。

[ サイドチャネル攻撃手法の評価環境の実装 ]

サイドチャネル攻撃対策を入れると回路規模がふくらんで、昔の SASEBO では入らなくなってしまったので SASEBO-GII というのを作りました。V5LX30 or 50 が載る。95,000 円 from TED で USB から configuration + 給電 (!)。

泉先生: ボードの個体差とか、このボードが持っている特性による癖のようなものはある? → 個体差はたくさん作るのでこれから調べていく。SASEBO でやったらこうで、このボードでやったらこうでした、という知識を集積していきたい。
山口先生: 130nm から 65nm になって電圧以外にかわったことは? テクノロジが変わっても対策はかわらない? → かわらない感じです。だから、昔のデバイスのほうが取りやすいし、そこで対策を考えるのもいいかも。

[ FPGA実装されたストリーム暗号 CryptMT の評価 ]

ストリーム暗号ではブロック暗号と違って、疑似乱数を送信元と受信先で作って、それとデータの XOR をとることで暗号化を行う方式。通信系で多く使われている。

デザインガイア 2009: Dec.03, 2009 午前

| No Comments | No TrackBacks

最初はコンピュータシステム研究会。

[ Smith-Waterman アルゴリズムにおける GPU を用いた実装方法の位置提案 ]

土肥君@長崎大の発表。

既存の GPU 実装 (CUDASW++) とか Cell 版、Xeon 版に比べて健闘している。いいね。

通信バンド幅についてきいてみた。
時間的にはスコア計算のほうが支配的で、まだバンド幅には余裕がある模様。

でも、発表後にマイク付けたまま戻っちゃダメだよ。

[ 高性能かつ低消費電力を実現する可変レベルキャッシュのモード切替アルゴリズムの改良と評価 ]

最近のマイクロプロセッサはなんと言ってもキャッシュで性能を稼ぐわけだけど、キャッシュのリーク電流の割合というのは無視できない。
ノーマルモード (ふつうのキャッシュ) と低消費電力モードがある。
キャッシュの容量が小さくてもよさそうなら低消費電力モードで動かす。低消費電力ではキャッシュの半分をスリープモードにし、そこにあるデータを使いたいときだけ起こして、L2 の中身と入れ替える。

SimpleScalar にこのモード切替コントローラを実装。
除算を使って (わりとちゃんと) 計算する版と、そうでないのと作ったが、性能差は 1% くらいなので除算器なしのほうでもいいかな。

横田先生: キャッシュの容量は変えて評価はとってないの? → はい。
三木先生: スリープモードというのはどこをどう落としたモード? → バンクごとに電圧を変えるようにしておいて、スリープにするときはデータが死なない範囲でキャッシュメモリのそのバンクの電源電圧を丸ごと下げます。
柴田先生: 連想度はどうしてますか? → 4-way です。連想度は変えずにキャッシュラインの数だけが半分になったりします。
渡辺先生@岡山大: 256kB と 512kB で評価をとっているけど、256kB だけとか 512kB だけで走らせた評価があれば教えてください → ありません。

[ 可変パイプライン段数プロセッサのためのメモリアクセスに着目した細粒度なモード切替コントローラ ]

高速モードではパイプラインを D-FF で刻み、低速モードではそれを外す。
メモリアクセスと負荷の関係があることがわかったので、それを基準 (最近の32サイクル分のload,store命令の数) にして制御をする。

あまり細かく制御すると、パイプラインを flush する回数が増えてよろしくない。

- 共有のハードウェアとして作ると、それでオーバーヘッドがあってかえって電力消費が増えるのでは → D-FF のところにマルチプレクサをつけるだけなので、それほど大変ではない
- パイプライン段数を3段階とかにもできる? → 考えてはいる。基本的にパイプラインの各ステージの遅延は同じはずなので、段数は整数倍になっていたほうがいいよね。

[ パス限定投機実行を実現するマルチコアプロセッサPALSの提案 ]

薬袋さんの ISIS-SimpleScalar がベースです!
投機がパス単位なので、メモリ周りは大変ではないかしら? メモリバッファそのものはひとつの投機状態をずっと保持している? → そうです。パス (スレッド) の実行が終了したときにはじめて共有キャッシュに反映される。

OpenID accepted here Learn more about OpenID
Powered by Movable Type 5.01

March 2010

Sun Mon Tue Wed Thu Fri Sat
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

About this Archive

This page is an archive of recent entries in the Conference Logs category.

でんき is the previous category.

研究とか is the next category.

Find recent content on the main index or look in the archives to find all content.