Claude が書いた記事
AI チップが熱い本当の理由は「計算」やなく「通信」 ── 銅の壁と、光への移行
GPU が熱いのも巨大化するのも、主犯は計算やなくデータ移動やった。銅線の物理的な限界と、チップの際から光で繋ぐ (CPO / シリコンフォトニクス) 話。
俺の最初の疑問
AI クラスタの記事を読んでると「チップのすぐ近くから光ファイバーで繋ぐ」みたいな話がよく出てくる。最初に引っかかったのはここやった。
- 「マザーボードに光ファイバーを埋め込むってことか?」
- 「つまりマザーボード上の導線を短くしたい、もしくはなくしたいってことか?」
- 「シリコン上の通信そのものを光にはできへんのか?」
掘っていくうちに、もっと根っこの疑問に行き着いた ── 「GPU が発熱するのは、演算やなくて、チップ上に銅線を引きまくってるからちゃうんか?」。これが当たりやった。そこを軸にまとめ直す。
まず一言でいうと
AI チップ (GPU など) の性能と発熱を決めてる主役は、「計算」やなく「データ移動 (通信)」や。
チップの中でデータを 1 回動かすのに食うエネルギーは、そのデータで 1 回計算するエネルギーの数百〜数千倍。だから「速く動かす・低い電力で動かす」の戦いがインフラ全体のボトルネックになっていて、銅線がその限界に達したから、いまは「外に出る瞬間から光にする」方向に移ろうとしている。
何と比べるとわかるか
なぜ「移動」がそんなに効くのか。距離ごとの遅延 (レイテンシ) を、人間の時間感覚に引き伸ばすと一発でわかる。チップ内の 1 サイクルを「1 秒」とした例えがこれ。
| どこへデータを取りに行くか | 実際の時間 | 人間の感覚 |
|---|---|---|
| チップ内の隣の演算器 (数ミリ) | 約 0.5 ナノ秒 | 約 1 秒(隣の席に声をかける) |
| チップ外のメモリ (HBM / DRAM、数センチ) | 約 50〜100 ナノ秒 | 約 2〜3 分(下の階の自販機へ行く) |
| ネットワーク経由で隣のサーバー | 約 1〜5 マイクロ秒 | 約 1〜3 時間(電車で隣県のオフィスへ) |
AI の計算は「前の結果をすぐ次に使う」を何兆回も繰り返す。途中で 1 回でもネットワークに出ると、計算コアは「隣県から書類が届くまで数時間ボーッと待つ」状態になる。これがレイテンシの壁。
何が問題なのか
銅の壁 ── 線を引くだけで熱くなる
銅線に信号を流すのは、ただ電気が通り抜けることやない。微細な世界では、銅線とまわりの間に勝手にコンデンサのような構造(寄生容量)ができる。信号を 1 にする = 充電、0 にする = 放電。データを送るとは、この充電と放電を毎秒何十億回 (GHz) 繰り返すこと。この「溜めては捨てる」自体が熱(ジュール熱)を生む。銅線が長いほど、捨てる電気が増えて熱くなる。
計算はサボれる、通信はサボれない
GPU の中の演算コアは、使ってないものは電源を落とせる(パワーゲーティング)。でもデータが流れてる通信路(バス)は、流れてる限り充放電を続けてサボれない。速度のためにバス幅を広げて銅線を敷き詰めるほど、そこが巨大な床暖房になる。
なら、なぜ銅線を敷き詰めたのか
ここが俺の腑に落ちたポイント。外のネットワークに出す遅延(さっきの「隣県 1〜3 時間」)が壊滅的すぎるから。「外に出すと数千倍遅い。なら本来は外に出すレベルの大量のコアとメモリを 1 枚の巨大なシリコンに全部乗せて、超高密度の銅線で強引に結べ」── これが GPU の巨大化と、内部に銅線を狂ったように敷き詰めた理由。爆熱でも、チップ内ならナノ秒で届くからコアを遊ばせずに済む。
その力技も限界に来た
- レチクル限界:製造装置の都合で、1 枚のシリコンとして切り出せる大きさに上限(約 858 平方ミリ)がある。これ以上は物理的に詰め込めない。
- 熱で溶ける:銅線密度を上げると発熱がシリコンの許容を超え、空冷も水冷も追いつかない。
「外に出すと遅すぎる、でもチップ内にこれ以上は引けない」── このデッドロックを破るのが、銅から光への移行や。
図で見る
銅線は「マザーボードの上を電気でダラダラ走る」から熱とロスが出る。だったら電気で走る距離をチップのパッケージ内の数ミリに縮めて、外に出た瞬間から光にしてしまえ、というのが CPO (Co-Packaged Optics)。
そして発熱の正体を並べるとこうなる。計算は安く、移動が高い。
混乱しやすいポイント
- 「GPU が熱い = 計算をフル回転してるから」ではない。 主犯はデータ移動(通信)。計算そのものは意外とエコ。
- 「光にできるなら、チップの中も全部光にすればいい」ではない。 2 つの壁がある。
- サイズの壁:通信に使う光には波長(約 1 マイクロメートル = 1000 ナノメートル)がある。光の通り道は波長より小さくできないので、ナノメートル単位の電気回路ほど細く詰め込めない。
- 材料の壁:シリコンは電気を流すのは得意やけど、自分でレーザー光を出すのが苦手(間接遷移半導体)。光る部品は別材料(インジウムリンなど)で作ってシリコンに貼り付ける必要がある。
- だから現実は「全部いきなり光」やなく、まずデータが一番渋滞する大通り(チップ間 → コアとメモリの幹線)から順に光に置き換える。
たとえ話
- 銅線 = 床暖房。データが流れてる限り充放電し続けて、熱を放ち続ける。線を長く・太く敷くほど暖房面積が広がる。
- 光の波長多重 (WDM) = 同じ 1 本の道に、色違いの車を何千台も同時に流す。電気は「1 本の線 = 1 つの信号」(混ざるとショート)やけど、光は色(波長)が違えば同じ空間を同時に通ってもぶつからない。だから 1 本の通り道に何百〜何千のデータを詰め込めて、帯域が桁違いに増える。
出てきた言葉の変換表
| 出てきた言葉 | つまり何の話? |
|---|---|
| CPO (Co-Packaged Optics) | チップのパッケージの際に光変換器を同居させ、そこから直接光ファイバーを引き出す方式。電気で走る距離を数ミリに縮める |
| シリコンフォトニクス (光電融合) | 電子回路と光回路を同じシリコンに作り込む技術。CPO の先にある「チップ自体から光を出す」方向 |
| 寄生容量 | 銅線のまわりに勝手にできるコンデンサ的構造。これの充放電が発熱の正体 |
| ジュール熱 | 抵抗に電気を流したときに出る熱。銅線が長いほど増える |
| レチクル限界 | 1 枚のシリコンとして作れる大きさの上限(約 858 平方ミリ)。チップ巨大化の天井 |
| WDM (波長分割多重) | 色(波長)の違う光を 1 本の道に同時に流す技。光が桁違いの帯域を出せる理由 |
| リタイマー | なまった電気信号を途中で補正・増幅するチップ。銅線を延命する「今主流」の力技 |
| HBM | GPU のすぐ脇に積む高帯域メモリ。「数センチ先 = 数分」の相手 |
| パワーゲーティング | 使ってない演算コアの電源を落とす省電力技。計算はサボれるが通信はサボれない |
- 光接続の覇権争い ── 誰がこのボトルネックを獲るか。Broadcom のオープンなイーサネット vs NVIDIA の InfiniBand / NVLink、Astera Labs の CXL / PCIe リタイマー。今日の話の「次は誰が勝つ」版
- HBM とメモリの壁 ── 「数センチ先 = 数分」の相手。今日の通信の話と対になる、もう一つのボトルネック
- 電気と光以外の手段 ── スピントロニクス(磁気)・超伝導・光コンピューティング。なぜ結局「電子と光子」に落ち着くのか