Claude が書いた記事

AI チップが熱い本当の理由は「計算」やなく「通信」 ── 銅の壁と、光への移行

GPU が熱いのも巨大化するのも、主犯は計算やなくデータ移動やった。銅線の物理的な限界と、チップの際から光で繋ぐ (CPO / シリコンフォトニクス) 話。

2026-06-07 18:51

俺の最初の疑問

AI クラスタの記事を読んでると「チップのすぐ近くから光ファイバーで繋ぐ」みたいな話がよく出てくる。最初に引っかかったのはここやった。

「マザーボードに光ファイバーを埋め込むってことか？」
「つまりマザーボード上の導線を短くしたい、もしくはなくしたいってことか？」
「シリコン上の通信そのものを光にはできへんのか？」

掘っていくうちに、もっと根っこの疑問に行き着いた ── 「GPU が発熱するのは、演算やなくて、チップ上に銅線を引きまくってるからちゃうんか？」。これが当たりやった。そこを軸にまとめ直す。

まず一言でいうと

AI チップ (GPU など) の性能と発熱を決めてる主役は、「計算」やなく「データ移動 (通信)」や。

チップの中でデータを 1 回動かすのに食うエネルギーは、そのデータで 1 回計算するエネルギーの数百〜数千倍。だから「速く動かす・低い電力で動かす」の戦いがインフラ全体のボトルネックになっていて、銅線がその限界に達したから、いまは「外に出る瞬間から光にする」方向に移ろうとしている。

何と比べるとわかるか

なぜ「移動」がそんなに効くのか。距離ごとの遅延 (レイテンシ) を、人間の時間感覚に引き伸ばすと一発でわかる。チップ内の 1 サイクルを「1 秒」とした例えがこれ。

どこへデータを取りに行くか	実際の時間	人間の感覚
チップ内の隣の演算器 (数ミリ)	約 0.5 ナノ秒	約 1 秒（隣の席に声をかける）
チップ外のメモリ (HBM / DRAM、数センチ)	約 50〜100 ナノ秒	約 2〜3 分（下の階の自販機へ行く）
ネットワーク経由で隣のサーバー	約 1〜5 マイクロ秒	約 1〜3 時間（電車で隣県のオフィスへ）

AI の計算は「前の結果をすぐ次に使う」を何兆回も繰り返す。途中で 1 回でもネットワークに出ると、計算コアは「隣県から書類が届くまで数時間ボーッと待つ」状態になる。これがレイテンシの壁。

データの取得先による遅延の階層を人間の時間感覚で示した図。チップ内は1秒、メモリは数分、ネットワークは数時間。 — 同じ「データを取りに行く」でも、距離が一段上がるごとに桁が変わる

何が問題なのか

銅の壁 ── 線を引くだけで熱くなる

銅線に信号を流すのは、ただ電気が通り抜けることやない。微細な世界では、銅線とまわりの間に勝手にコンデンサのような構造（寄生容量）ができる。信号を 1 にする = 充電、0 にする = 放電。データを送るとは、この充電と放電を毎秒何十億回 (GHz) 繰り返すこと。この「溜めては捨てる」自体が熱（ジュール熱）を生む。銅線が長いほど、捨てる電気が増えて熱くなる。

計算はサボれる、通信はサボれない

GPU の中の演算コアは、使ってないものは電源を落とせる（パワーゲーティング）。でもデータが流れてる通信路（バス）は、流れてる限り充放電を続けてサボれない。速度のためにバス幅を広げて銅線を敷き詰めるほど、そこが巨大な床暖房になる。

なら、なぜ銅線を敷き詰めたのか

ここが俺の腑に落ちたポイント。外のネットワークに出す遅延（さっきの「隣県 1〜3 時間」）が壊滅的すぎるから。「外に出すと数千倍遅い。なら本来は外に出すレベルの大量のコアとメモリを 1 枚の巨大なシリコンに全部乗せて、超高密度の銅線で強引に結べ」── これが GPU の巨大化と、内部に銅線を狂ったように敷き詰めた理由。爆熱でも、チップ内ならナノ秒で届くからコアを遊ばせずに済む。

その力技も限界に来た

レチクル限界：製造装置の都合で、1 枚のシリコンとして切り出せる大きさに上限（約 858 平方ミリ）がある。これ以上は物理的に詰め込めない。
熱で溶ける：銅線密度を上げると発熱がシリコンの許容を超え、空冷も水冷も追いつかない。

「外に出すと遅すぎる、でもチップ内にこれ以上は引けない」── このデッドロックを破るのが、銅から光への移行や。

図で見る

銅線は「マザーボードの上を電気でダラダラ走る」から熱とロスが出る。だったら電気で走る距離をチップのパッケージ内の数ミリに縮めて、外に出た瞬間から光にしてしまえ、というのが CPO (Co-Packaged Optics)。

従来の銅線配線と、CPOでパッケージの際から光ファイバーを引き出す構造の比較図。 — 左: 銅線をマザーボード上で長く走らせる（熱・ロス）。右: パッケージの際で光に変え、あとは光ファイバー

そして発熱の正体を並べるとこうなる。計算は安く、移動が高い。

計算のエネルギーは小さく、データ移動のエネルギーが数百〜数千倍大きいことを示す図。 — チップ内で「1 回計算」より「1 回移動」の方が数百〜数千倍のエネルギーを食う

混乱しやすいポイント

「GPU が熱い = 計算をフル回転してるから」ではない。 主犯はデータ移動（通信）。計算そのものは意外とエコ。
「光にできるなら、チップの中も全部光にすればいい」ではない。 2 つの壁がある。
- サイズの壁：通信に使う光には波長（約 1 マイクロメートル = 1000 ナノメートル）がある。光の通り道は波長より小さくできないので、ナノメートル単位の電気回路ほど細く詰め込めない。
- 材料の壁：シリコンは電気を流すのは得意やけど、自分でレーザー光を出すのが苦手（間接遷移半導体）。光る部品は別材料（インジウムリンなど）で作ってシリコンに貼り付ける必要がある。
だから現実は「全部いきなり光」やなく、まずデータが一番渋滞する大通り（チップ間 → コアとメモリの幹線）から順に光に置き換える。

たとえ話

銅線 = 床暖房。データが流れてる限り充放電し続けて、熱を放ち続ける。線を長く・太く敷くほど暖房面積が広がる。
光の波長多重 (WDM) = 同じ 1 本の道に、色違いの車を何千台も同時に流す。電気は「1 本の線 = 1 つの信号」（混ざるとショート）やけど、光は色（波長）が違えば同じ空間を同時に通ってもぶつからない。だから 1 本の通り道に何百〜何千のデータを詰め込めて、帯域が桁違いに増える。

出てきた言葉の変換表

出てきた言葉	つまり何の話？
CPO (Co-Packaged Optics)	チップのパッケージの際に光変換器を同居させ、そこから直接光ファイバーを引き出す方式。電気で走る距離を数ミリに縮める
シリコンフォトニクス (光電融合)	電子回路と光回路を同じシリコンに作り込む技術。CPO の先にある「チップ自体から光を出す」方向
寄生容量	銅線のまわりに勝手にできるコンデンサ的構造。これの充放電が発熱の正体
ジュール熱	抵抗に電気を流したときに出る熱。銅線が長いほど増える
レチクル限界	1 枚のシリコンとして作れる大きさの上限（約 858 平方ミリ）。チップ巨大化の天井
WDM (波長分割多重)	色（波長）の違う光を 1 本の道に同時に流す技。光が桁違いの帯域を出せる理由
リタイマー	なまった電気信号を途中で補正・増幅するチップ。銅線を延命する「今主流」の力技
HBM	GPU のすぐ脇に積む高帯域メモリ。「数センチ先 = 数分」の相手
パワーゲーティング	使ってない演算コアの電源を落とす省電力技。計算はサボれるが通信はサボれない

深掘りメニュー次におすすめのトピック

光接続の覇権争い ── 誰がこのボトルネックを獲るか。Broadcom のオープンなイーサネット vs NVIDIA の InfiniBand / NVLink、Astera Labs の CXL / PCIe リタイマー。今日の話の「次は誰が勝つ」版
HBM とメモリの壁 ── 「数センチ先 = 数分」の相手。今日の通信の話と対になる、もう一つのボトルネック
電気と光以外の手段 ── スピントロニクス（磁気）・超伝導・光コンピューティング。なぜ結局「電子と光子」に落ち着くのか