home > Tosky's Archive >
(株)オーム社 技術総合誌「OHM」 2008年9月号 掲載 PDFファイル
「Cell」が世界最高速を実現!
酒井 寿紀 (さかい としのり) 酒井ITビジネス研究所
「Cell」が変革をもたらす?
Cellとは、ソニーのビデオゲームPlayStation 3用にソニー、IBM、東芝の3社が共同開発したプロセッサである。2005年5月号の本コラム “「Cell」はどうなる?” で、その概要を紹介し、疑問点を指摘した。Cellの最大の特徴は、汎用プロセッサ1個と、演算専用のプロセッサ8個を一つの半導体チップに搭載した、ヘテロジニアスなマルチコアのプロセッサであることだ。そして、ソニーはこれをPlayStation 3の他、多数のAV機器に使う予定だとし、また、ソニー製品のみならず、世界中のコンピュータに使われるようになって、コンピュータの世界に変革をもたらすと言っていた。上記のコラムでは、一般のコンピュータやAV機器に広く使われるという考えに疑問を呈し、ただし、「性能の限界を追求するスーパーコンピュータには、それがCellになるかどうかは別にして、将来ヘテロジニアスなマルチコアが有力な選択肢になると思われる」と記した(a)。3年余り経った現在、CellはPlayStation 3の他、どこで使われるようになっただろうか?
Roadrunner登場
今年6月、IBMは、Cellを使ったRoadrunnerというスーパーコンピュータが、史上初めて1 ペタFlops(毎秒1,000兆回の演算を実行)を達成したと発表した。これは従来の記録を一挙に倍以上高めたものである。ビデオゲーム用のプロセッサが、一体どのようにして世界最高速を実現しているのか見てみよう。
まず、従来のCellを改造して、倍精度演算の性能を5倍に高めた。そのCellを2個、ブレードと呼ばれる厚さ約3cmの板状の箱に搭載している。そして、このブレード2枚と、汎用のマイクロプロセッサを搭載したブレード、通信用のブレードの4枚を1組にし、それを3組、標準のシャシという箱に収容している。次に、このシャシを4段積みにして標準のラックに搭載している。標準のラックの寸法は、一般に、幅60cm、奥行80cm、高さ2m程度で、このようなラックに48個のCellが収容されることになる。
RoadrunnerのCell数は合計12,960個だというので、これをラックにフル搭載すれば270ラックになる。Roadrunnerは合計296ラックだというので、その他のラックにはラック間を接続するスイッチなどが搭載されているのであろう。
Roadrunnerの設置面積は約560uだというので、バスケットボールのコートの約1.3倍の広さである。今回1ペタFlopsの性能を測定したのはIBMのニューヨーク州ポケプシーの工場だが、7月には注文主であるエネルギー省ロスアラモス国立研究所(ニューメキシコ州)に納入されるという。輸送には21台のトレーラーが使われるそうだ。アメリカ大陸を横断してこの大コンボイが移動するのはさぞ壮観なことだろう(b)。
Roadrunnerの費用は約1億ドル(100億円程度)ということだ。
試験運転の後、Roadrunnerの3/4は軍事用に使われ、残り1/4は多目的に使われるという。その中には、HIVウィルスやバイオ・エタノールの研究もあるそうだ。
IBMは、Cellを搭載したブレードを一般にも販売している。その納入先には、アニメの制作、投資ポートフォリオの分析、石油探査などの企業があるという(c)。今年5月には、デリバティブの計算用としてみずほ証券にも納入したと発表された。
今後のスーパーコンピュータは?
スーパーコンピュータの実現方法には、ヘテロジニアス方式の他、IBMのBlue Gene のように、1種類のプロセッサ・コアのみを使うホモジニアス方式がある。今後両者はどのような使い分けになるのだろうか?
IBMのディープ・コンピューティング担当のテュレック副社長は、Blue Geneを使ったスーパーコンピュータがなくなり、すべてCellに置き換わるわけではない、と言っている。RoadrunnerにはCellが適しているのでそれを使ったのであって、Blue Geneを使ったスーパーコンピュータも引き続き開発していくということだ。同氏は、両者は競合するものではなく、異なる分野に異なる手法で対応するものだ、と言う。
2008年6月のスーパーコンピュータの番付表「TOP500」において、Roadrunnerが性能のトップの座を占めたが、実はもう一つ、消費電力当たりの性能でもトップになった。ヘテロジニアス方式は、演算に特化したプロセッサを使うので、ホモジニアス方式より電力が少なくて済むのだ。消費電力が少なければ、冷却が容易で、高密度実装が可能になり、装置を小型にできる。半導体技術の進歩で、演算速度はどんどん速くなるが、装置内を伝わる電気信号の速さは不変なため、現在の大型のスーパーコンピュータでは、装置内の信号の伝播に何百回も演算を実行する時間がかかってしまう。したがって、装置を小さくできることは、高速化上きわめて重要なのである。
ヘテロジニアス方式にはプログラムの書き換えを要する点などの欠点もある。しかし、腕力で技術の限界まで高性能を追求しようとする時、上記のように装置を小型化できることは大きい利点だ。したがって、トップクラスのスーパーコンピュータの実現方法としては、今後もヘテロジニアス方式が有力な選択肢になると思われる。
[関連記事]
(a) 酒井 寿紀、「「Cell」はどうなる?」、OHM、2005年5月号、オーム社
(http://www.toskyworld.com/archive/2005/ar0505ohm.htm)
(b) "Fact Sheet & Background: Roadrunner Smashes the Petaflop Barrier", 09 Jun 2008, IBM
(https://www-03.ibm.com/press/us/en/pressrelease/24405.wss)
(c) "IBM Offers High Performance Computing Outside the Lab", 13 May 2008, IBM
(http://www-03.ibm.com/press/us/en/pressrelease/24180.wss)
(d) 酒井 寿紀、「「Cell」はどうなった?」、OHM、2013年6月号、オーム社
(http://www.toskyworld.com/archive/2013/ar1306ohm.htm)
「Tosky's Archive」掲載通知サービス : 新しい記事が掲載された際 、メールでご連絡します。
Copyright (C) 2008, Toshinori Sakai, All rights reserved