← 一覧へ戻る

Claude が書いた記事

AI チップが熱い本当の理由は「計算」やなく「通信」 ── 銅の壁と、光への移行

GPU が熱いのも巨大化するのも、主犯は計算やなくデータ移動やった。銅線の物理的な限界と、チップの際から光で繋ぐ (CPO / シリコンフォトニクス) 話。

俺の最初の疑問

AI クラスタの記事を読んでると「チップのすぐ近くから光ファイバーで繋ぐ」みたいな話がよく出てくる。最初に引っかかったのはここやった。

  • 「マザーボードに光ファイバーを埋め込むってことか?」
  • 「つまりマザーボード上の導線を短くしたい、もしくはなくしたいってことか?」
  • 「シリコン上の通信そのものを光にはできへんのか?」

掘っていくうちに、もっと根っこの疑問に行き着いた ── 「GPU が発熱するのは、演算やなくて、チップ上に銅線を引きまくってるからちゃうんか?」。これが当たりやった。そこを軸にまとめ直す。

まず一言でいうと

AI チップ (GPU など) の性能と発熱を決めてる主役は、「計算」やなく「データ移動 (通信)」や

チップの中でデータを 1 回動かすのに食うエネルギーは、そのデータで 1 回計算するエネルギーの数百〜数千倍。だから「速く動かす・低い電力で動かす」の戦いがインフラ全体のボトルネックになっていて、銅線がその限界に達したから、いまは「外に出る瞬間から光にする」方向に移ろうとしている

何と比べるとわかるか

なぜ「移動」がそんなに効くのか。距離ごとの遅延 (レイテンシ) を、人間の時間感覚に引き伸ばすと一発でわかる。チップ内の 1 サイクルを「1 秒」とした例えがこれ。

どこへデータを取りに行くか実際の時間人間の感覚
チップ内の隣の演算器 (数ミリ)約 0.5 ナノ秒約 1 秒(隣の席に声をかける)
チップ外のメモリ (HBM / DRAM、数センチ)約 50〜100 ナノ秒約 2〜3 分(下の階の自販機へ行く)
ネットワーク経由で隣のサーバー約 1〜5 マイクロ秒約 1〜3 時間(電車で隣県のオフィスへ)

AI の計算は「前の結果をすぐ次に使う」を何兆回も繰り返す。途中で 1 回でもネットワークに出ると、計算コアは「隣県から書類が届くまで数時間ボーッと待つ」状態になる。これがレイテンシの壁

同じ「データを取りに行く」でも、距離が一段上がるごとに桁が変わる

何が問題なのか

銅の壁 ── 線を引くだけで熱くなる

銅線に信号を流すのは、ただ電気が通り抜けることやない。微細な世界では、銅線とまわりの間に勝手にコンデンサのような構造(寄生容量)ができる。信号を 1 にする = 充電、0 にする = 放電。データを送るとは、この充電と放電を毎秒何十億回 (GHz) 繰り返すこと。この「溜めては捨てる」自体が熱(ジュール熱)を生む。銅線が長いほど、捨てる電気が増えて熱くなる。

計算はサボれる、通信はサボれない

GPU の中の演算コアは、使ってないものは電源を落とせる(パワーゲーティング)。でもデータが流れてる通信路(バス)は、流れてる限り充放電を続けてサボれない。速度のためにバス幅を広げて銅線を敷き詰めるほど、そこが巨大な床暖房になる

なら、なぜ銅線を敷き詰めたのか

ここが俺の腑に落ちたポイント。外のネットワークに出す遅延(さっきの「隣県 1〜3 時間」)が壊滅的すぎるから。「外に出すと数千倍遅い。なら本来は外に出すレベルの大量のコアとメモリを 1 枚の巨大なシリコンに全部乗せて、超高密度の銅線で強引に結べ」── これが GPU の巨大化と、内部に銅線を狂ったように敷き詰めた理由。爆熱でも、チップ内ならナノ秒で届くからコアを遊ばせずに済む。

その力技も限界に来た

  • レチクル限界:製造装置の都合で、1 枚のシリコンとして切り出せる大きさに上限(約 858 平方ミリ)がある。これ以上は物理的に詰め込めない。
  • 熱で溶ける:銅線密度を上げると発熱がシリコンの許容を超え、空冷も水冷も追いつかない。

「外に出すと遅すぎる、でもチップ内にこれ以上は引けない」── このデッドロックを破るのが、銅から光への移行や。

図で見る

銅線は「マザーボードの上を電気でダラダラ走る」から熱とロスが出る。だったら電気で走る距離をチップのパッケージ内の数ミリに縮めて、外に出た瞬間から光にしてしまえ、というのが CPO (Co-Packaged Optics)

左: 銅線をマザーボード上で長く走らせる(熱・ロス)。右: パッケージの際で光に変え、あとは光ファイバー

そして発熱の正体を並べるとこうなる。計算は安く、移動が高い。

チップ内で「1 回計算」より「1 回移動」の方が数百〜数千倍のエネルギーを食う

混乱しやすいポイント

  • 「GPU が熱い = 計算をフル回転してるから」ではない。 主犯はデータ移動(通信)。計算そのものは意外とエコ。
  • 「光にできるなら、チップの中も全部光にすればいい」ではない。 2 つの壁がある。
    • サイズの壁:通信に使う光には波長(約 1 マイクロメートル = 1000 ナノメートル)がある。光の通り道は波長より小さくできないので、ナノメートル単位の電気回路ほど細く詰め込めない。
    • 材料の壁:シリコンは電気を流すのは得意やけど、自分でレーザー光を出すのが苦手(間接遷移半導体)。光る部品は別材料(インジウムリンなど)で作ってシリコンに貼り付ける必要がある。
  • だから現実は「全部いきなり光」やなく、まずデータが一番渋滞する大通り(チップ間 → コアとメモリの幹線)から順に光に置き換える

たとえ話

  • 銅線 = 床暖房。データが流れてる限り充放電し続けて、熱を放ち続ける。線を長く・太く敷くほど暖房面積が広がる。
  • 光の波長多重 (WDM) = 同じ 1 本の道に、色違いの車を何千台も同時に流す。電気は「1 本の線 = 1 つの信号」(混ざるとショート)やけど、光は色(波長)が違えば同じ空間を同時に通ってもぶつからない。だから 1 本の通り道に何百〜何千のデータを詰め込めて、帯域が桁違いに増える。

出てきた言葉の変換表

出てきた言葉つまり何の話?
CPO (Co-Packaged Optics)チップのパッケージの際に光変換器を同居させ、そこから直接光ファイバーを引き出す方式。電気で走る距離を数ミリに縮める
シリコンフォトニクス (光電融合)電子回路と光回路を同じシリコンに作り込む技術。CPO の先にある「チップ自体から光を出す」方向
寄生容量銅線のまわりに勝手にできるコンデンサ的構造。これの充放電が発熱の正体
ジュール熱抵抗に電気を流したときに出る熱。銅線が長いほど増える
レチクル限界1 枚のシリコンとして作れる大きさの上限(約 858 平方ミリ)。チップ巨大化の天井
WDM (波長分割多重)色(波長)の違う光を 1 本の道に同時に流す技。光が桁違いの帯域を出せる理由
リタイマーなまった電気信号を途中で補正・増幅するチップ。銅線を延命する「今主流」の力技
HBMGPU のすぐ脇に積む高帯域メモリ。「数センチ先 = 数分」の相手
パワーゲーティング使ってない演算コアの電源を落とす省電力技。計算はサボれるが通信はサボれない
深掘りメニュー 次におすすめのトピック
  • 光接続の覇権争い ── 誰がこのボトルネックを獲るか。Broadcom のオープンなイーサネット vs NVIDIA の InfiniBand / NVLink、Astera Labs の CXL / PCIe リタイマー。今日の話の「次は誰が勝つ」版
  • HBM とメモリの壁 ── 「数センチ先 = 数分」の相手。今日の通信の話と対になる、もう一つのボトルネック
  • 電気と光以外の手段 ── スピントロニクス(磁気)・超伝導・光コンピューティング。なぜ結局「電子と光子」に落ち着くのか