FIT2007: イベント企画 (カスタムコンピューティング)

中京大学は、愛知環状鉄道の駅から歩いてわりとすぐ。三精システム さんにお世話になったりしていたので、実はけっこう乗り慣れており、久しぶりで懐かしかった。昔は国鉄から受け継いだ電車が走ったりしていたのだが、愛知万博の前あたりから電車が新しくなったりして、けっこうきれい。しかも、
中央線からの直通電車が走ったりしており、高蔵寺の1番線で電車を待っていたら「次は6番線だ」といわれて、びっくりした。
で、会場に着いたら10分前。しかも、最初の濱田さんが台風で遅れており、トップバッターにされてしまった。うひー、スライドさっきできたばっかりですよ。しかも、まだちゃんとチェックしてません、ごめんなさい。そういうわけで、めちゃめちゃ緊張してました。
FIT って誰がきてるんだろうなー、と思ったら、会場のメンバーはけっこうオールスターズだった。すごい。みんな座長とかで呼ばれるからかな? 発表は (僕のを除けば) みんな非常におもしろかった。
[ FPGA の部分再構成を利用したコンテンツ配信システム ]
産総研の堀さん。
2006年度、映像配信市場は1500億円、音楽は2500億円 (すごいな!)。
安全にコンテンツを配信するための研究。
コンテンツと一緒に部分回路をダウンロードする「ハードウェア割り符」の実現!
コンテンツを保護するだけでなく、デコーダを配信したりすることができる。
しかも、オンチップで処理が行われるので、いろいろな意味で堅牢で、部分回路と本体の I/O インタフェイスを機種毎に規定してしまえば、機種認証のようなこともできる。うおーーー。かっこいいぜ!かっこよすぎるぜ!
NEC 梶原さん: 部分再構成を使う上で、アーキテクチャ的な希望はどんなのがありますか? 堀さん: 現在は比較的大きな矩形領域が必要なので、もうちょっと小さな粒度で作れるといいな。それから、デバイス横断的に使えるような共通ビットストリームのフォーマットがあるといいんですが。
末吉先生: PlanAhead とかが使えるようになったけど、どんな感じですか?
堀さん: やっと「できる」が「使える」になった。ISE だけでは部分再構成できないので、もうちょっと普通にサポートしてもいいんじゃないか。
(PlanAhead は、ひみつのページで登録しないと使えない)
僕はやっぱり、そろそろ FPGA はバイナリ互換性とかを考えるべき時代になっているんじゃないかと思うんですが、どうでしょう。いや、ものすごく難しいのを理解した上でいってるわけですが。あるいは、libxilinxbitstream みたいな、bitstream を hack するツールを作る、というのもおもしろそうね。
[マトリクス型超並列プロセッサMX-1とその応用事例]
ルネサスの水本さん。
2bit ALU による SIMD array。1024 個で、それぞれ 1024 bit のメモリがついてる。制御用のプロセッサは別。面積や消費電力を抑えるために、90nm の SRAM プロセスで製造 (!) 。SoC に組み込むのが前提。
電力あたりの性能に優れる (固定小数点演算の評価が出てる)。
ソフトウェア開発は C 言語。ライブラリがある。
動画処理のデモをいくつか見せていただきました。メディア処理は楽しくていいなー。
[カーチューナ向けリコンフィギャラブルアーキテクチャ]
三洋の小曽根さん。
三洋のカーチューナLSI は世界シェア No1 (30%) だそうだ。すごい!
でも、国毎にデジタル放送の方式が違ったり、車種のグレードによって要求仕様が異なるので、チューナ処理のDSP化を進めている。でもDSPでは、処理能力的にオーディオ帯域処理しかできないので、ALU array based reconfigurable processor を開発。
6列 x 4段の ALU array で 1 core。15個でワンセグ受信、8個で FM radio 受信。いまは FPGA でプロトタイピングしていて、16 cores.
PipeWrench みたい。パイプラインぐるぐるー。
谷川先生: 配線をもうちょっと rich にするとかは考えてますか? 使用率は?
小曽根さん: コンパイラを調整しながらいろいろ検討した結果、トレードオフとして向こう三軒ネットワーク。FM ラジオでは 70〜80% の使用率です。
[ 理論宇宙物理学でのハイパフォーマンスコンピューティング事例 ]
濱田さんは RIKEN GSC に行かれた模様。タンパク質構造解析とかをやってらっしゃる模様。
宇宙の多体問題シミュレーションの手法が分子動力学にも使える、というのはまさに宇宙の神秘、というやつだ。この世界は美しい。
GPU (GeForce 8800GTX) でもやっているが、GPU は SIMD thread 間での計算結果 reduction が苦手。
ピーク性能: Core2Duo 2GHz は 40GFLOPSe 、GeForce だと 500GFLOPS くらい。
実効性能: Core2Duo で 1GFLOPS くらい、GeForce で 70GFLOPS くらい。GeForce は reduction でワリを食っているが、充分速い。ただし、150W も食う (PROGRAPE-4 は 5W) …
Manycore の時代になったら GPU はなくなるんじゃないかな、という濱田さんの予想はとても興味深いと思う。言われてみればそうかもなー。

コメントを残す