[ 三重冗長ソフトコアプロセッサにおける同期復旧処理の一検討 ]
エラーが起きなければ3つのプロセッサが同じところを取りに行くけど、エラーが起きると voter とか detector が必要ですよ。壊れたら部分再構成で高速に直します。
voter が壊れることは考慮している (井口先生) ? 確率としては voter の面積を小さくすれば故障率が下がりそうですが → voter が壊れたら全体再構成するしかないから、復旧時間の隠蔽はどうせできないので、今回の scope とは異なる。
Bus macro はどういうの使ってますか (堀先生) ? → async だと思う → bus macro が足を引っ張っているようなので、sync にしたほうが速いかも。
[ 配線性とアクティビティを利用するFPGAの低消費電力化クラスタリング手法 ]
クリティカルパス上にあるものをクラスタリングの対象にするのではなくて、アクティビティが高い net 上のものをクラスタリングの対象にすることで、クラスタ内部に frequency が高い配線を閉じこめる。
電力は確実に落ちる。遅延はだいたい悪くなるが、よくなる場合もある。
アクティビティはどうやっていれる (名古屋先生) ? → testbench を流して、というわけではなくて、and だったら 1+1 のときしか 1 にならないとか、そういう static な activity をとるので、実際とは違うかもしれない。
必要な論理ブロック数は変わっていない (柴田先生) ? → 変わってません。
内部配線を使うことでどれくらいお得になるか、という数字は (谷川先生) ? → わかりません。
[ リコンフィギャラブルシステムにおけるマルチスレッドプログラミングモデルを用いたメモリアクセス最適化手法の一検討 ]
[ 動作合成による暗号回路の生成と性能評価 ]
Catapult 使ってみた。AES実装。
HDLより小さいのも、ソフトウェアより速いのも、一応作れる。
なるほど。
[ 高速パターン認識システムのための動的な再構成手法の評価と比較 ]
DDI (Direct Data Implementation) でカーネル関数を作る。
関数は GA でチューニングする。
on-chip dynamic DDI の再構成には 7 分くらい (GA の計算に時間がかかるので、再構成自体は 0.04 秒)。
[ FPGAを用いた局所的コントラスト強調の実時間処理の実現 ]
ヒストグラム作ってもげもげ。
42.6fps @ 1920×1080
[ 幾つかの画像処理問題を用いたGPUとFPGAの性能比較 ]
すべてのピクセルが独立、みたいな問題だと GPU はすごいが、やっぱりいろいろ難しそう。
FPGAの性能を制約しちゃってるのは何 (佐野先生) ? → GPU はグローバルメモリのバンド幅。FPGA の場合は BlockRAM に入っちゃってるので。
GPUはメモリアクセスのところのプログラミング次第で性能が大きく変わってくる (濱田先生)
[ A comparative study of implementing N-body simulation on FPGAs, GPUs and general purpose processors ]
電力効率: FPGA > GPU > CPU
演算性能: FPGA はだいたい Core2 と同じくらい。
Floating point ですよね (井口先生) ? → FPGA は内部で対数使ってる。
誤差の点は公平な比較になっている? → 結果が正しい範囲で使っているから、上の性能比較も、この業界で求められる範囲での話。
FPGA が電力効率がいいのはなぜ (弘中先生) ? → SPARTAN-3 を使ってるところがポイント。省電力。
[ CFD専用計算機FLOPS-2Dへ向けたUPACS制限関数群モジュール化の検討 ]
[ FPGAによるUPACSサブルーチンの高速化 ]
うあ、Mac なのにパワポ使ってるよ!
– GFLOPS 換算でちゃんと測らないとダメ
– なぜボードは V4 なのに V5 なのさ
– 分割は手でやるの? 無理です。