1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

「宇宙を作る」シミュレーション天文学への招待 第2回 アテルイIIIの特性とその目指すサイエンスのゴールとは?

マイナビニュース / 2025年2月3日 7時1分

流体シミュレーションは、プログラム中の演算数(足し算、引き算、掛け算などの回数の合計)に対して多くの変数を必要とするため、計算速度の向上にはCPUとメモリの間でやり取りできる情報通信量を表すメモリ転送バンド幅が重要となる。より正確にいうと、理論演算性能とメモリ転送バンド幅のバランスが重要だといい、これは、試験会場のようなイメージで捉えることができるとする。近年のスパコンの理論演算性能の向上は、コア数の搭載数の増加によるところが大きく、いわばテストの回答者が増えたことに例えられる。しかし計算を行うには、メモリからデータを読んでCPUに送る必要がある。これは、答案用紙を回答者に配ったり受け取ったりする先生のような役割。要は、近年は回答者の数が増えているのだが、先生の数やその能力が不足しがちな状況となっているのである。実際にアテルイIIでは、多くのアプリケーションにおいて、メモリ転送バンド幅の狭さが原因で計算速度の低下を招いてしまっていたことから、アテルイIIIでは、メモリ転送バンド幅を重視したシステムMが用意されたのである。

これまで、アテルイ→アテルイ(アップグレード)→アテルイIIと進むにつれ、理論演算性能とメモリ転送バンド幅のバランスを表す、メモリ転送バンド幅を理論演算性能で割った「実バイト/フロップス(B/F)」の値はどんどん悪化していたという(初代が約0.3→初代アップグレードが約0.14→アテルイIIが約0.08)。つまり、メモリ転送バンド幅が広がらないのに対し、理論演算性能だけが上がってしまっていたのである。先ほどのテストのイメージなら、せっかくテストの回答者の人数はどんどん増えているのに、先生がずっとひとりのままで、答案用紙を配るのに時間がかかっているような状況だ。

世の中のスパコンの実B/Fは大半が1以下であり、計算結果にかかる時間を左右する要素は、理論演算性能よりもメモリ転送バンド幅の方が大きい。もちろん場合にもよるが、要はメモリ転送バンド幅が広いほど、間違いなく計算にかかる時間を短縮できるのである。

しかし、このメモリ転送バンド幅を上げることは容易ではない。そこでシステムMでは、アテルイIIで採用されていたDDRメモリをやめ、半導体を三次元的に多層構造にして一度に多量のデータをやり取りできるようにしたHBMメモリ(HBM2e)を採用したとのこと。その結果、アテルイIIに比べて12.5倍と、大きくメモリ転送バンド幅が向上したのである。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください