← 一覧へ戻る

Claude が書いた記事

なぜ DC のイーサは 3m しか届かない ── BASE-CR と『速くするほど縮む』物理

オフィスの LAN は 100m 届くのに、データセンターの ToR 周りの銅線は 3m しか届かんらしい。同じイーサネットやのに何が違うんや? ── BASE-T と BASE-CR、そして『速くするほど距離が縮む』高周波の物理を腹落ちするまでの学習ログ。

俺の最初の疑問

データセンター (DC) の物理層を調べていて、距離の話で引っかかった。家やオフィスの LAN ケーブルは 100m くらい平気で届く。なのに、DC の ToR 周りで使う銅線は数メートルしか届かないという。

銅線と光の境目って、何メートルなんや? そもそも、なんで DC のイーサはそんなに短いんや? 同じイーサネットやろ?

しかもこの前、「ラック内は銅線のほうが低遅延で最強」と腹落ちしたばかり。その銅線が「すぐ届かなくなる」というのが噛み合わへん。順に潰した記録。

まず一言でいうと

境目は ざっくり 3m。そして DC のイーサ (ToR ⇄ サーバー) は 「速さのために距離を捨てた」 イーサネットやった。

同じイーサネット (IEEE 802.3) でも、規格が別物。

  • オフィスの LAN = BASE-T。遅くても 100m 走り切る長距離ランナー
  • DC の ToR 周り = BASE-CR。3m で燃え尽きる代わりに 1 ナノ秒を削るスプリンター

そして効いた一言がこれ。速くするほど、銅線で届く距離は縮む。だから AI / RDMA 用に爆速にした銅線は、数メートルしか届かへん。

何と比べるとわかるか

俺がよく知ってるオフィスの LAN と、DC の ToR 周りの配線を並べると一発やった。

BASE-T (オフィス・自宅)BASE-CR (データセンター)
端子RJ45 (普通の LAN 端子)SFP28 / QSFP (金属ソケット)
中身ツイストペア線 (細い銅を撚る)Twinax (極太の銅) = DAC
速度1G〜10G100G〜800G
最大距離100m1〜7m (速くするほど短く)
遅延大 (数 µs = 数千 ns)極小 (数 ns)
電力 (ポート)高い (2〜4W)ほぼゼロ (0.1W 未満)
端の PHY強力 (根性で信号を直す)あえて省略
同じイーサネットでも真逆。BASE-T は端の PHY が信号を計算で復元するから 100m 届く (代償は数 µs の遅延)。BASE-CR は重い PHY をあえて省略し、素の電気を最短で通すから数 ns (代償は距離)。

何が問題なのか ── 速くするほど縮むのはなぜか

ここが本丸。「なんで速くすると届かなくなるんや?」。答えは 電気信号の周波数が高すぎる こと。

やさしいことばで 小学生にわかるように説明すると

「周波数が高い」ってのは、1 秒のあいだに波が揺れる (振動する) 回数が多い、ということ。

縄跳びでイメージすると

  • ゆっくり縄を振る → 大きくてゆっくりした波。1 秒の波の数が少ない → 周波数が低い
  • すごく速く縄を振る → 小さくギザギザでたくさんの波。1 秒の波の数が多い → 周波数が高い

音でいうと

  • 低い音 (太鼓やゾウの声) → 空気の振動がゆっくり・波が少ない → 周波数が低い
  • 高い音 (小鳥のさえずりや鈴の音) → 空気の振動が速い・波が多い → 周波数が高い

光でいうと

  • 赤い光 → 波がゆっくり → 周波数が低い
  • 青い光 → 波が速くてたくさん → 周波数が高い

つまり、「周波数が高い」= 1 秒のあいだに波がたくさんできる (振動が速い)。「高い音」「細かい波」「速い振動」をイメージするとわかりやすい。

電気のオン・オフ (0/1 のパタパタ) を、物理の限界に近いスピードで繰り返すと、電気は 「導線を流れる」性質を失って、「空中へ逃げる電波」の性質に化ける。具体的には 3 つの罠が同時に襲う。

  1. 表皮効果 (Skin Effect) ── 周波数が高いほど、電気は銅線の中心を通らず、銅線の 表面の薄皮一枚 だけを流れる。使える断面が減る = 抵抗が増える = 信号がどんどん弱る (減衰)。
  2. アンテナ化 ── GHz 級になると、銅線そのものが 電波を放つアンテナ に変身する。銅線の中を伝わるはずの電気エネルギーが、途中で電波として空中へ放射されて消える。1m 進む頃には空っぽ。
  3. クロストーク (漏話) ── 太い DAC ケーブルの中には、Twinax (同軸 2 本を束ねたシールド銅線) が何ペアもギチギチに詰まっている。各線がアンテナ化すると、隣の線へ自分のデータを電波で送信 してしまう。0/1 がぶつかって潰れ、ゴミデータになる。
速くするほど銅で届かなくなる正体。①表面しか通らず減衰、②電波で空中へ逃げる、③隣へ漏れて混信。この 3 つが効いてくるから、爆速の銅線は数メートルしか持たない。

だから「速度が上がるほど、銅線で信号を届けられる距離が縮む」。100 Gbps / 400 Gbps で 3 メートル程度、1.6 Tbps 級になると 1 メートルすら危うくなる。だからケーブルが短くなる。

図で見る ── 距離でケーブルを使い分ける

3m の壁は「欠陥」やなくトレードオフ。距離に応じて 3 段階で使い分ける。

距離で使うケーブルが変わる。ラック内は迷わず銅 (パッシブ DAC)。3m の壁を金で少し押すのがアクティブメタル (AEC)。ラックをまたぐ距離は遅延が悔しくても物理の限界で光。速度が上がるほど、銅と光の境目は手前 (短いほう) に動く。
  • 〜2.5m:パッシブ DAC (純銅) ── 変換チップなし。遅延ほぼゼロ・消費電力 0W・最安。ラック内 (ToR ⇄ サーバー) はこれが大半。
  • 2.5〜5m:アクティブメタル (AEC) ── コネクタに「光変換チップ」やなく「電気の波を整える補正チップ (イコライザー / DSP)」を入れ、電気のまま距離を延ばす。低遅延・省電力を保ったまま 5m まで。
  • 5m〜:光 (AOC / トランシーバー) ── 電気⇄光の変換 (O-E-O) を挟む。変換遅延と数ワットの電力が要るが、距離はほぼ無制限。ラックをまたぐ配線 (Spine 行き) はこれ。

実物のブツで見分ける

「パッシブ DAC」「アクティブメタル」「光」と言われてもピンと来ん。実際のケーブルで並べると、違いは 「中にチップが入ってるか」「銅か光か」 の 2 点だけやった。

どれも同じ SFP/QSFP の口に挿さる。①パッシブ DAC (純銅・チップなし)、②アクティブメタル AEC (見た目は DAC+補正チップ)、③AOC (光が両端一体)、④トランシーバー+光ファイバー (分離式)。違いは『チップの有無』と『銅か光か』だけ。

ちなみに ブレイクアウト (俗に Y) ケーブルはこの 4 種とは別の軸。詳しくは下の混乱しやすいポイント⑤で。

混乱しやすいポイント

① 「3m しか届かない」は欠陥やない、選んだ結果

短いのは設計ミスやなくトレードオフ。「遅延があってもいいから 100m 届かせたい」のがオフィスの LAN、「3m でいいから 1 ナノ秒も削りたい」のが GPU をつなぐ DC の配線。AI / RDMA は後者を本気で要求するから、わざと距離を捨てている。

② BASE-T が 100m 届くのは「PHY が根性で直す」から

オフィスの LAN は、ポート内の強力な PHY (DSP) が、エコーキャンセラーやエラー訂正 (FEC) をフル稼働させて、100m 先でヘロヘロになった信号を 計算で復元 している。その代わり計算に時間がかかり、数 µs の遅延が 余分に 発生する。BASE-CR はこの重い PHY を あえて使わず、素の電気を最短で通す。だから数 ns。

③ アクティブメタル (AEC) は「光変換」やない

AEC を「光に変える線」と勘違いしやすいが違う。中のチップは 電気信号のヨレを整える補正チップ (リタイマー / DSP) で、信号は最後まで電気のまま。だから光 (AOC) よりずっと低遅延・省電力。「光変換チップ入り」の AOC とは別物。

④ 銅が低遅延なのは「ガラスより電気が速い」+「変換ゼロ」

前に腹落ちした「ラック内は銅が低遅延」と矛盾しない。銅線中の電気は真空中の光速の約 70〜80% で伝わり、これはガラス (光ファイバー) の中を進む光より少し速い。さらに O-E-O 変換が無いぶん、近距離なら銅が勝つ。銅と光が逆転するのは、距離が伸びて減衰が効いてくる領域に入ってから。

⑤ ブレイクアウト (俗に Y) ケーブルは「種類」やなく「形」

ToR の枝分かれケーブルを「DAC や光と並ぶもう 1 つの種類」と勘違いしやすいが違う。これは 「1 本の太いポートを複数の細いポートに小分けする形」 の話で、銅か光かとは別軸。正式には ブレイクアウト (ファンアウト) ケーブル。たとえば QSFP (400G) の中身は 100G のレーンが 4 本入っていて、これを SFP (100G) ×4 に分岐する。

「Y ケーブル」と俗に呼ぶが、厳密に Y 字なのは 1 → 2 に分けるときだけ。1 → 4 になるとフォーク (タコ足) 型で、もう Y の形やない。呼び名はゆるい。

形と中身は掛け合わせ ── DAC のブレイクアウトもあれば、光のブレイクアウトもある。①〜④ の「中身 (銅か光か・チップ有無)」と、ブレイクアウトの「形 (1 本のままか小分けか)」は別々に決まる。

たとえ話

  • 長距離ランナー vs スプリンター:BASE-T は遅いが 100m 完走、BASE-CR は数 m で燃え尽きるが神速。用途が違うだけ。
  • 満員電車:表皮効果は、ぎゅう詰めで真ん中に入れず、みんなドア付近 (表面) にしか乗れない状態。乗れる人数 (通れる電気) が減る。
  • 内緒話を大声で:アンテナ化とクロストークは、隣に伝えたい話を大声で叫ぶようなもの。周りに漏れる (放射) し、隣の声と混ざる (混信)。

出てきた言葉の変換表

言葉つまり何の話?
BASE-Tオフィス / 自宅の LAN 規格。RJ45・ツイストペア・100m・遅延大
BASE-CRDC の ToR 周りの規格。SFP/QSFP・Twinax (銅)・数 m・遅延極小 (CR = Copper)
DAC (Direct Attach Copper)両端コネクタ一体の銅線ケーブル。中身は Twinax。光変換なし
Twinax同軸 2 本を束ねたシールド銅線。DAC の中身
パッシブ DAC変換チップなしの純銅。〜2.5m・遅延ほぼ 0・0W
アクティブメタル (AEC / ACC)電気の波を整える補正チップ入りの銅。〜5m。光変換ではない
AOC (Active Optical Cable)中で電気⇄光を変換する光ケーブル。長距離・電力大
ブレイクアウト (ファンアウト) ケーブル1 本の太いポート (QSFP) を細い複数 (SFP×4) に小分けする形。銅にも光にもある。俗に Y だが、厳密に Y 字は 1→2 のみ (1→4 はフォーク型)
PHY (ファイ)ポート内の物理層チップ。BASE-T は強力 (根性で直す)、BASE-CR は省略
表皮効果高周波で電気が銅線の表面しか流れなくなり減衰する現象
O-E-O 変換電気→光→電気の変換。遅延と電力が要る。DAC はこれをしない
次に答える、設計者の問い で、それがなんやねん?

物理はわかった。次は設計者として「で、この 1 本、銅にするか光にするか?」

  • ラック内の配線を、距離からパッシブ DAC (〜2.5m) / アクティブメタル AEC (〜5m) / 光 AOC (5m〜) で選び分けられるか。 判断軸は距離だけやない ── 遅延・消費電力 (=熱)・コスト。どこまでが「物理の限界 (3m)」で、どこからが「金で殴る (AEC / 光)」かの線を引けるか。
  • 「とりあえず全部光」の代償を言えるか。 光トランシーバーはポートあたり数ワット。何万本に積むと電力と熱とコストが膨らむ。近距離を銅で粘る価値を数字で説明できるか。

これに答えられると強い ── 速度と距離のトレードオフから配線を逆算して 選べる側 に立てる (多くの人は「とりあえず光」で電力と金を溶かす)。

深掘りメニュー 次におすすめのトピック
  • SFP / QSFP は「形」、中身は銅か光 ── 同じ金属ソケットに DAC も光も挿せる。「形」と「中身」を分けて見る話。この記事の対になる物理層の続き。
  • 光電融合 (CPO) ── 3m の壁が 0cm まで縮んだ先。チップの真横で光に変える最前線。「速くするほど縮む」の終着点。
  • InfiniBand の物理と冷却 ── 光トランシーバーの数ワットが何万本。前面が 1,000W 級に発熱し、なぜ水冷が要るか。
  • GPU クラスターのレール最適化 ── この銅と光の配線が支える上物。ラック内は銅、ラックまたぎは光、で組む 8 本のレール。