「宇宙を作る」シミュレーション天文学への招待 第2回 アテルイIIIの特性とその目指すサイエンスのゴールとは?
マイナビニュース / 2025年2月3日 7時1分
流体シミュレーションは、プログラム中の演算数(足し算、引き算、掛け算などの回数の合計)に対して多くの変数を必要とするため、計算速度の向上にはCPUとメモリの間でやり取りできる情報通信量を表すメモリ転送バンド幅が重要となる。より正確にいうと、理論演算性能とメモリ転送バンド幅のバランスが重要だといい、これは、試験会場のようなイメージで捉えることができるとする。近年のスパコンの理論演算性能の向上は、コア数の搭載数の増加によるところが大きく、いわばテストの回答者が増えたことに例えられる。しかし計算を行うには、メモリからデータを読んでCPUに送る必要がある。これは、答案用紙を回答者に配ったり受け取ったりする先生のような役割。要は、近年は回答者の数が増えているのだが、先生の数やその能力が不足しがちな状況となっているのである。実際にアテルイIIでは、多くのアプリケーションにおいて、メモリ転送バンド幅の狭さが原因で計算速度の低下を招いてしまっていたことから、アテルイIIIでは、メモリ転送バンド幅を重視したシステムMが用意されたのである。
これまで、アテルイ→アテルイ(アップグレード)→アテルイIIと進むにつれ、理論演算性能とメモリ転送バンド幅のバランスを表す、メモリ転送バンド幅を理論演算性能で割った「実バイト/フロップス(B/F)」の値はどんどん悪化していたという(初代が約0.3→初代アップグレードが約0.14→アテルイIIが約0.08)。つまり、メモリ転送バンド幅が広がらないのに対し、理論演算性能だけが上がってしまっていたのである。先ほどのテストのイメージなら、せっかくテストの回答者の人数はどんどん増えているのに、先生がずっとひとりのままで、答案用紙を配るのに時間がかかっているような状況だ。
世の中のスパコンの実B/Fは大半が1以下であり、計算結果にかかる時間を左右する要素は、理論演算性能よりもメモリ転送バンド幅の方が大きい。もちろん場合にもよるが、要はメモリ転送バンド幅が広いほど、間違いなく計算にかかる時間を短縮できるのである。
しかし、このメモリ転送バンド幅を上げることは容易ではない。そこでシステムMでは、アテルイIIで採用されていたDDRメモリをやめ、半導体を三次元的に多層構造にして一度に多量のデータをやり取りできるようにしたHBMメモリ(HBM2e)を採用したとのこと。その結果、アテルイIIに比べて12.5倍と、大きくメモリ転送バンド幅が向上したのである。
この記事に関連するニュース
-
「宇宙を作る」シミュレーション天文学への招待 第1回 第3の天文学である「シミュレーション天文学」とは?
マイナビニュース / 2025年1月31日 7時1分
-
国立天文台の新天文学用スパコン「アテルイIII」始動! “理論の望遠鏡”で何が見える?
マイナビニュース / 2025年1月17日 19時57分
-
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
ITmedia PC USER / 2025年1月10日 17時40分
-
NVIDIAが新型GPU「GeForce RTX 50シリーズ」を発表 新アーキテクチャ「Blackwell」でパフォーマンスを約2倍向上 モバイル向けも
ITmedia PC USER / 2025年1月7日 18時50分
-
天文学、宇宙物理学においてスーパーコンピューターはどのように貢献してきたか?
sorae.jp / 2025年1月6日 11時4分
ランキング
-
1ヒガシマル直伝! うどんスープで作る“絶品クラムチャウダー”が170万表示 「これ!めちゃくちゃ美味しいです!」「試してみます!」
ねとらぼ / 2025年2月2日 20時10分
-
2「正直破格です」 成城石井の元店長が辞めてからも買い続ける“名品”がリピ必至 「ヨダレが出そう」
ねとらぼ / 2025年2月2日 7時0分
-
3超初心者向けの“RAW現像入門”的な話
ITmedia NEWS / 2025年2月2日 8時20分
-
4なぜ地域差が……? セブン-イレブン「おでんの大根」、千葉県と茨城県だけ他県と違う理由を聞いた 「なんでなん?」
ねとらぼ / 2025年2月1日 8時30分
-
5空き缶にニンニクを植えて約1カ月後…… “驚きの変化”が42万再生 「やってみたいです」
ねとらぼ / 2025年2月1日 9時15分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください