- 2020-09-14
絵解き|POWER10プロセッサ ~IBM開発者のプレゼン資料から理解する◎前編
POWER10の設計テーマ
IBMが8月に発表したPOWER10については、「米IBMがOpenShiftに最適化した次世代プロセッサ「POWER10」を公開」としてお伝え済みですが、Webサイト上で、POWER10の開発者らによるプレゼンテーションや技術情報が公開されています。本記事では、それらを基に、コンピュータ技術の最先端とも言えるPOWER10の“凄さ”に触れてみます。
最初に、POWER10の設計テーマに触れておきます。次の図のように5項目を挙げています。
POWER10の設計テーマ
上図をざっくり翻訳すると、次のようになります。
● データプレーンの帯域・キャパシティ・コンポーザビリティ・スケーラビリティの向上
ソケットあたりテラバイト/秒、ペタバイト級のシステムメモリ、16ソケットのSMP(Symmetric Multiprocessing)からクラスター化へ
● 強力なエンタープライズ・コア
新しいコア・アーキテクチャの採用、柔軟性、キャッシュの拡大、レイテンシー(遅延)の削減
● エンドtoエンドのセキュリティ
PowerVMを用いたハードウェア駆動かつ最適化されたセキュリティ
● 電力消費の効率向上
POWER9の3倍の効率化
● AI融合のコア
POWER9と比較してソケットあたり10~20倍の行列計算パフォーマンス
POWERプロセッサのロードマップ
POWERプロセッサは、2004年のPOWER5からほぼ3年ごとに次世代のプロセッサが発表されてきています。POWER6は2007年、POWER7は2010年、POWER8は2013年で、2017年にPOWER9が発表されて、今年のPOWER10へと続きます。
IBMは、次のPOWER 11を開発中であることをアナウンスしています。従来通りのスケジュールでいくと2023年のリリースになりますが、詳細は公表されていません。
三星電子で製造されたPOWER10のウエハー
POWER10プロセッサの内容
冒頭にも掲示した上の写真は、Samsung Electronics(韓国の三星電子)で製造されたPOWER10のウエハーです。IBMにとって初めての線幅7ナノメートル(nm)のチップで、POWER9の14nmよりも大幅に精密化が図られています。
チップのサイズは602mm2(平方ミリメートル)で、トランジスタ数は180憶個。8スレッドのSMT(Simultaneous Multithreading:同時マルチスレッディング)を備える「SMT 8コア」を最大15個搭載しています。各コアのL2キャッシュは2MB、チップのL3キャッシュは最大120MBです。
ソケットに収容されたPOWER10
上の写真は、ソケットに収容されたPOWER10です。ソケット内に1チップを搭載するSingle-chip Modele(SCM)と、2チップを搭載するDual-chip Module(DCM)があります。SCMの動作周波数は最大4GHz、DCMの最大は3.5GHzです。
下図はSCMとDCMの違いを示したもので、SCMのソケットは最大16個まで、DCMは最大4個のソケットを搭載可能です。
Single-chip Modele(SCM)とDual-chip Module(DCM)
POWER10プロセッサのブロック図
上の図は、プロセッサの構造を示したブロック図です。この図に添えられた説明には、次のように明記されています。
・・・・・・・・
● テクノロジー&パッケージング
・チップサイズ602mm2、線幅7nm、180億トランジスタ
・18層のメタル、拡張されたデバイス
・1チップまたは2チップ搭載のソケット
● 計算能力
・SMT8を最大15個搭載(最大120の同時ハードウェア・スレッド)
・コアあたり2MBのL2キャッシュ
・最大120MBのL3キャッシュ、ローレイテンシーのNUCA採用
・POWER9と比較して3倍の消費電力効率
・スレッド機能の最適化
・AIおよびセキュリティにフォーカスした命令セットアーキテクチャ(ISA)
・POWER9と比較して2倍の汎用演算、4倍の行列演算
・EAレベルのL1キャッシュ、POWER9と比較して4倍のメモリ管理ユニット(MMU)
● オープンメモリインターフェース
・最大32 GT/s(Transfer/秒)=1TB/秒を実現
・ニアメモリ→メインメモリ→ストレージ・クラス・メモリのティア間の接続をサポート
● PowerAXONメモリインターフェース
・最大32 GT/s(Transfer/秒)=1TB/秒を実現
・最大16ソケットまでSMP(同時マルチスレッディング)インターコネクト
・OpenCAPI、高速I/Oなどの接続に利用
・統合的クラスタリングを実現
● PCIe Gen5インターフェース
・最大32 GT/s(Transfer/秒)=1TB/秒を実現
・・・・・・・・
POWER10は上記のように「オープンメモリインターフェース(OMI)」「PowerAXONメモリインターフェース」「PCIe Gen5インターフェース」という3週類の高速インターフェースを備えています。
OMIとPowerAXONメモリインターフェース、PCIe Gen5インターフェースの適用先の違いについては、次の本稿でまとめます。
(後編はこちら)