FPL 2006 (Aug.28 午前)

[ 採録状況 ]307 submissions / 85 full paper / 80 poster paper50 PhD forum submissions / 21 PhD forum postersUSA 37Spain 24Germany 23Japan 16?日本が4位に転落ですよ。

午前の。


[ 採録状況 ]
307 submissions / 85 full paper / 80 poster paper
50 PhD forum submissions / 21 PhD forum posters
USA 37
Spain 24
Germany 23
Japan 16?
日本が4位に転落ですよ。
[ Opening Keynote ]
FPGAs at 65nm and Beyond: Powerful New FPGAs Bring New (Software) Challenges:
Ken McElvain, Synplicity Corp.
クロックの分配に mesh ではなくて tree を使っている。これは電力や面積のためなのだが、on-chip variation で、クロックのマージンがどeんどん厳しくなってきている。あと、放射線によるソフトエラーとか、低電圧化でノイズマージンが厳しくなったりとか。こういうのを、このまま放っておくとユーザが気にしなきゃいけなくなって、FPGA の design abstraction というメリットがなくなってしまうので、なんとかせなあかん。
したがって、物理合成が大事なのですよ。そうかもなあ。
つまり、従来はワイヤ長だけをみて配線していたが、dynamic power 削減のためには wire length * activity を最小化するようにしたりとか、activity の高い信号を low-power wire に接続したりとか、いろいろ。
いろんなシミュレーションとかを高速化する話も。つまり、こういうの、HDL じゃ手間がかかって話にならんわけだ (まあ、だから研究のネタにもなるんだけどね)。だから、まあ、つまり、C とか Matlab とかから合成したいわけですが。でも、具体的にどうこうという話ではなかった。
[ M1.A: Scientific Applications ]
Improved Interpolation and System Integration for FPGA-Based Molecular Dynamics Simulations
Boston University の人たち。
Tom VanCourt さんはいま、 Altera にいらっしゃるそうです。うおー。
テーブル引きで補間を使う。
区間数、補間の関数の次数とかがキモ。
35bit precision を使っております。semi FP. MD 向けに特化してある。
1k particles, 10k time-steps. 5.5x to PC (2VP70). 2VP100 なら倍になるかもだぜ!
実際にPC にのっけて5倍速いんで、いい感じですね。計算だけなら 40x とかなんだけど、PCI にさしてズギャ!とやるのは、やっぱりなかなか難しいっす。
High Performance Scientific Computing Using FPGAs with IEEE Floating Point and Logarithmic Arithmetic for Lattice QCD.
Quantum ChemoDynamics だっけ。
Dirac operator という演算操作が QCD のコアで、いちばんたいへん。
各ポイントをタイムステップごとに update するのだが、1回の1ポイントの更新には 2616 FP operations が必要(!)。複素数だし。
Log arithmetic だと xeon よりちょっと速いくらい。double FP だとけっこう速いな。
ううむ。double ってうまくいくんだろうか? 演算器とかの詳細は不明。
[ M2.A: Applications I ]
RAID6 Hardware Acceleration
RAID5 は rebuild のときの read error で死ぬ可能性があるっていうアレです。ディスクが大きければその当然リスクも高くなるわけで、あぶない。RAID5 ではパリティが1セットなのを、RAID6 では2セットにすることで解決を図るんだそうだ。なるほどー。Reed-Solomon で encode するのであり、ソフトウェアではちょっと大変すぎる感じ。パリティ計算のところを、PCI な FPGA ボードを使ってやることで高速化する。1.5 倍くらい速くなりそうだ。CPU 負荷は 33~50% 程度下がっているもよう。地味だけど、いいですね!
DMA は使ってるの? →Yes.
ブロックサイズを大きくしたら速くなるかな?→ I/O ボトルネックなので、ダメだと思う。
Detection Moudle in a Complementary Set of Sequence-based Pulse Compression System
これ、アプリケーションがそもそも難しくてよくわからないんですよ。ごめんなさい。
超音波の emitter と receiver があって、receiver が自分の位置を把握したりするものみたいだ。つまり、receiver はロボットとかですね。z 変換とかしてた。
何に使うの?medical application? → いや、いろんなところ動く奴。
音の resolution は? → 10bit
FPGA Implementation of a Ridge Extraction Fingerprint Algorithm based on MicroBlaze and Hardware Coprocessor
画像から指紋の山の部分を検出して、線を細くしてから分岐とか終端のところを検出する。そうすると、特徴的なポイントの分布で誰だかわかるわけですね。
MicroBlaze+アクセラレータを使うと 260ms くらい。MicroBlaze 単体だと 97 秒。最近の intel でも 2.9秒だから、こりゃけっこう速いぞ。安いしね。
ノイズ除去と、方向の検出のところを HW 化して高速化するんだそうだ。なるほどー。
DSP 使ったら Intel より速い? → やってないからわかんない。
入力ってどういうデバイスからくるの?CCD? → この研究ではデータベースを使ってやってます。ま、そりゃそうか。
False positive とか false negative は? → typical recognition error rate は 0.05% くらい。FP/FN はまあ、どっちもだいたい同じくらい、みたいな感じ。

コメントを残す