Claude が書いた記事
なぜ DC のイーサは 3m しか届かない ── BASE-CR と『速くするほど縮む』物理
オフィスの LAN は 100m 届くのに、データセンターの ToR 周りの銅線は 3m しか届かんらしい。同じイーサネットやのに何が違うんや? ── BASE-T と BASE-CR、そして『速くするほど距離が縮む』高周波の物理を腹落ちするまでの学習ログ。
俺の最初の疑問
データセンター (DC) の物理層を調べていて、距離の話で引っかかった。家やオフィスの LAN ケーブルは 100m くらい平気で届く。なのに、DC の ToR 周りで使う銅線は数メートルしか届かないという。
銅線と光の境目って、何メートルなんや? そもそも、なんで DC のイーサはそんなに短いんや? 同じイーサネットやろ?
しかもこの前、「ラック内は銅線のほうが低遅延で最強」と腹落ちしたばかり。その銅線が「すぐ届かなくなる」というのが噛み合わへん。順に潰した記録。
まず一言でいうと
境目は ざっくり 3m。そして DC のイーサ (ToR ⇄ サーバー) は 「速さのために距離を捨てた」 イーサネットやった。
同じイーサネット (IEEE 802.3) でも、規格が別物。
- オフィスの LAN = BASE-T。遅くても 100m 走り切る長距離ランナー。
- DC の ToR 周り = BASE-CR。3m で燃え尽きる代わりに 1 ナノ秒を削るスプリンター。
そして効いた一言がこれ。速くするほど、銅線で届く距離は縮む。だから AI / RDMA 用に爆速にした銅線は、数メートルしか届かへん。
何と比べるとわかるか
俺がよく知ってるオフィスの LAN と、DC の ToR 周りの配線を並べると一発やった。
| BASE-T (オフィス・自宅) | BASE-CR (データセンター) | |
|---|---|---|
| 端子 | RJ45 (普通の LAN 端子) | SFP28 / QSFP (金属ソケット) |
| 中身 | ツイストペア線 (細い銅を撚る) | Twinax (極太の銅) = DAC |
| 速度 | 1G〜10G | 100G〜800G |
| 最大距離 | 100m | 1〜7m (速くするほど短く) |
| 遅延 | 大 (数 µs = 数千 ns) | 極小 (数 ns) |
| 電力 (ポート) | 高い (2〜4W) | ほぼゼロ (0.1W 未満) |
| 端の PHY | 強力 (根性で信号を直す) | あえて省略 |
何が問題なのか ── 速くするほど縮むのはなぜか
ここが本丸。「なんで速くすると届かなくなるんや?」。答えは 電気信号の周波数が高すぎる こと。
「周波数が高い」ってのは、1 秒のあいだに波が揺れる (振動する) 回数が多い、ということ。
縄跳びでイメージすると
- ゆっくり縄を振る → 大きくてゆっくりした波。1 秒の波の数が少ない → 周波数が低い
- すごく速く縄を振る → 小さくギザギザでたくさんの波。1 秒の波の数が多い → 周波数が高い
音でいうと
- 低い音 (太鼓やゾウの声) → 空気の振動がゆっくり・波が少ない → 周波数が低い
- 高い音 (小鳥のさえずりや鈴の音) → 空気の振動が速い・波が多い → 周波数が高い
光でいうと
- 赤い光 → 波がゆっくり → 周波数が低い
- 青い光 → 波が速くてたくさん → 周波数が高い
つまり、「周波数が高い」= 1 秒のあいだに波がたくさんできる (振動が速い)。「高い音」「細かい波」「速い振動」をイメージするとわかりやすい。
電気のオン・オフ (0/1 のパタパタ) を、物理の限界に近いスピードで繰り返すと、電気は 「導線を流れる」性質を失って、「空中へ逃げる電波」の性質に化ける。具体的には 3 つの罠が同時に襲う。
- 表皮効果 (Skin Effect) ── 周波数が高いほど、電気は銅線の中心を通らず、銅線の 表面の薄皮一枚 だけを流れる。使える断面が減る = 抵抗が増える = 信号がどんどん弱る (減衰)。
- アンテナ化 ── GHz 級になると、銅線そのものが 電波を放つアンテナ に変身する。銅線の中を伝わるはずの電気エネルギーが、途中で電波として空中へ放射されて消える。1m 進む頃には空っぽ。
- クロストーク (漏話) ── 太い DAC ケーブルの中には、Twinax (同軸 2 本を束ねたシールド銅線) が何ペアもギチギチに詰まっている。各線がアンテナ化すると、隣の線へ自分のデータを電波で送信 してしまう。0/1 がぶつかって潰れ、ゴミデータになる。
だから「速度が上がるほど、銅線で信号を届けられる距離が縮む」。100 Gbps / 400 Gbps で 3 メートル程度、1.6 Tbps 級になると 1 メートルすら危うくなる。だからケーブルが短くなる。
図で見る ── 距離でケーブルを使い分ける
3m の壁は「欠陥」やなくトレードオフ。距離に応じて 3 段階で使い分ける。
- 〜2.5m:パッシブ DAC (純銅) ── 変換チップなし。遅延ほぼゼロ・消費電力 0W・最安。ラック内 (ToR ⇄ サーバー) はこれが大半。
- 2.5〜5m:アクティブメタル (AEC) ── コネクタに「光変換チップ」やなく「電気の波を整える補正チップ (イコライザー / DSP)」を入れ、電気のまま距離を延ばす。低遅延・省電力を保ったまま 5m まで。
- 5m〜:光 (AOC / トランシーバー) ── 電気⇄光の変換 (O-E-O) を挟む。変換遅延と数ワットの電力が要るが、距離はほぼ無制限。ラックをまたぐ配線 (Spine 行き) はこれ。
実物のブツで見分ける
「パッシブ DAC」「アクティブメタル」「光」と言われてもピンと来ん。実際のケーブルで並べると、違いは 「中にチップが入ってるか」「銅か光か」 の 2 点だけやった。
ちなみに ブレイクアウト (俗に Y) ケーブルはこの 4 種とは別の軸。詳しくは下の混乱しやすいポイント⑤で。
混乱しやすいポイント
① 「3m しか届かない」は欠陥やない、選んだ結果
短いのは設計ミスやなくトレードオフ。「遅延があってもいいから 100m 届かせたい」のがオフィスの LAN、「3m でいいから 1 ナノ秒も削りたい」のが GPU をつなぐ DC の配線。AI / RDMA は後者を本気で要求するから、わざと距離を捨てている。
② BASE-T が 100m 届くのは「PHY が根性で直す」から
オフィスの LAN は、ポート内の強力な PHY (DSP) が、エコーキャンセラーやエラー訂正 (FEC) をフル稼働させて、100m 先でヘロヘロになった信号を 計算で復元 している。その代わり計算に時間がかかり、数 µs の遅延が 余分に 発生する。BASE-CR はこの重い PHY を あえて使わず、素の電気を最短で通す。だから数 ns。
③ アクティブメタル (AEC) は「光変換」やない
AEC を「光に変える線」と勘違いしやすいが違う。中のチップは 電気信号のヨレを整える補正チップ (リタイマー / DSP) で、信号は最後まで電気のまま。だから光 (AOC) よりずっと低遅延・省電力。「光変換チップ入り」の AOC とは別物。
④ 銅が低遅延なのは「ガラスより電気が速い」+「変換ゼロ」
前に腹落ちした「ラック内は銅が低遅延」と矛盾しない。銅線中の電気は真空中の光速の約 70〜80% で伝わり、これはガラス (光ファイバー) の中を進む光より少し速い。さらに O-E-O 変換が無いぶん、近距離なら銅が勝つ。銅と光が逆転するのは、距離が伸びて減衰が効いてくる領域に入ってから。
⑤ ブレイクアウト (俗に Y) ケーブルは「種類」やなく「形」
ToR の枝分かれケーブルを「DAC や光と並ぶもう 1 つの種類」と勘違いしやすいが違う。これは 「1 本の太いポートを複数の細いポートに小分けする形」 の話で、銅か光かとは別軸。正式には ブレイクアウト (ファンアウト) ケーブル。たとえば QSFP (400G) の中身は 100G のレーンが 4 本入っていて、これを SFP (100G) ×4 に分岐する。
「Y ケーブル」と俗に呼ぶが、厳密に Y 字なのは 1 → 2 に分けるときだけ。1 → 4 になるとフォーク (タコ足) 型で、もう Y の形やない。呼び名はゆるい。
形と中身は掛け合わせ ── DAC のブレイクアウトもあれば、光のブレイクアウトもある。①〜④ の「中身 (銅か光か・チップ有無)」と、ブレイクアウトの「形 (1 本のままか小分けか)」は別々に決まる。
たとえ話
- 長距離ランナー vs スプリンター:BASE-T は遅いが 100m 完走、BASE-CR は数 m で燃え尽きるが神速。用途が違うだけ。
- 満員電車:表皮効果は、ぎゅう詰めで真ん中に入れず、みんなドア付近 (表面) にしか乗れない状態。乗れる人数 (通れる電気) が減る。
- 内緒話を大声で:アンテナ化とクロストークは、隣に伝えたい話を大声で叫ぶようなもの。周りに漏れる (放射) し、隣の声と混ざる (混信)。
出てきた言葉の変換表
| 言葉 | つまり何の話? |
|---|---|
| BASE-T | オフィス / 自宅の LAN 規格。RJ45・ツイストペア・100m・遅延大 |
| BASE-CR | DC の ToR 周りの規格。SFP/QSFP・Twinax (銅)・数 m・遅延極小 (CR = Copper) |
| DAC (Direct Attach Copper) | 両端コネクタ一体の銅線ケーブル。中身は Twinax。光変換なし |
| Twinax | 同軸 2 本を束ねたシールド銅線。DAC の中身 |
| パッシブ DAC | 変換チップなしの純銅。〜2.5m・遅延ほぼ 0・0W |
| アクティブメタル (AEC / ACC) | 電気の波を整える補正チップ入りの銅。〜5m。光変換ではない |
| AOC (Active Optical Cable) | 中で電気⇄光を変換する光ケーブル。長距離・電力大 |
| ブレイクアウト (ファンアウト) ケーブル | 1 本の太いポート (QSFP) を細い複数 (SFP×4) に小分けする形。銅にも光にもある。俗に Y だが、厳密に Y 字は 1→2 のみ (1→4 はフォーク型) |
| PHY (ファイ) | ポート内の物理層チップ。BASE-T は強力 (根性で直す)、BASE-CR は省略 |
| 表皮効果 | 高周波で電気が銅線の表面しか流れなくなり減衰する現象 |
| O-E-O 変換 | 電気→光→電気の変換。遅延と電力が要る。DAC はこれをしない |
物理はわかった。次は設計者として「で、この 1 本、銅にするか光にするか?」
- ラック内の配線を、距離からパッシブ DAC (〜2.5m) / アクティブメタル AEC (〜5m) / 光 AOC (5m〜) で選び分けられるか。 判断軸は距離だけやない ── 遅延・消費電力 (=熱)・コスト。どこまでが「物理の限界 (3m)」で、どこからが「金で殴る (AEC / 光)」かの線を引けるか。
- 「とりあえず全部光」の代償を言えるか。 光トランシーバーはポートあたり数ワット。何万本に積むと電力と熱とコストが膨らむ。近距離を銅で粘る価値を数字で説明できるか。
これに答えられると強い ── 速度と距離のトレードオフから配線を逆算して 選べる側 に立てる (多くの人は「とりあえず光」で電力と金を溶かす)。
- SFP / QSFP は「形」、中身は銅か光 ── 同じ金属ソケットに DAC も光も挿せる。「形」と「中身」を分けて見る話。この記事の対になる物理層の続き。
- 光電融合 (CPO) ── 3m の壁が 0cm まで縮んだ先。チップの真横で光に変える最前線。「速くするほど縮む」の終着点。
- InfiniBand の物理と冷却 ── 光トランシーバーの数ワットが何万本。前面が 1,000W 級に発熱し、なぜ水冷が要るか。
- GPU クラスターのレール最適化 ── この銅と光の配線が支える上物。ラック内は銅、ラックまたぎは光、で組む 8 本のレール。