2026년 3월 4일 수요일

생각정리 191(* OCS)


Broadcom의 “구리 유지” 발언이 갸우뚱했던 이유, 그리고 OCS 스터디 정리


아침에 브로드컴(Broadcom) 어닝콜을 정리하다가 한 지점에서 갸우뚱하게 되었다. 회사는 다음과 같이 말한다.

“We are uniquely positioned to enable these customers to stay on direct attached copper through our 200G service.”

 

“In 2028, our XPU customers will likely continue to stay on direct attached copper, and this is a huge advantage as the alternative of going to optical is more expensive and requires significantly more power.”


요지는 명확하다. 브로드컴은 **200G 솔루션을 통해 고객이 Direct Attached Copper(DAC)**를 유지할 수 있게 해주는 것이 자사만의 강점이라고 주장한다. 더 나아가 2028년에도 XPU 고객은 구리를 계속 쓸 가능성이 크다고 말한다. 그리고 광(Optical)으로 전환하는 대안은 더 비싸고 전력 소모도 크게 늘어난다고 덧붙인다.


그런데 이 톤은 4Q25 이전, 한 분기 전과 비교하면 사뭇 다른 느낌이다. 당시 회사의 뉘앙스는 보다 절제되어 있었다. 즉 **“scale-up은 가능한 한 랙 안에서 copper로 오래 가려는 시도가 있다”**는 관측을 전제로 하되, **“최후의 순간에야 silicon photonics로 간다”**는 식으로 광 전환의 불가피성 자체는 열어두는 방향이었다.


이 차이는 “구리의 절대우위”를 주장하느냐의 문제가 아니다. 핵심은 적용 구간과 시간표이다. 랙/섀시 내부처럼 (1) 매우 짧은 리치, (2) 극단적으로 높은 집적, (3) 단순성과 비용이 최우선인 구간에서는 구리가 여전히 가장 싸고 단순한 해법으로 남아 있을 수 있다. 이때 중요한 표현은 **“아직은(not anytime soon)”**이다. 방향성(광 전환)을 부정하기보다, 전환 타이밍을 늦게 본다는 의미에 가깝다.


하지만 같은 시점, 엔비디아(NVIDIA)는 구리에서 광으로의 전환을 오히려 서두르는 방향에 더 가깝게 보인다. 핵심 기업과의 전략적 파트너십을 통해 공급망을 선점하고, 차세대 아키텍처로의 전환을 앞당기려는 움직임이 관측된다.

https://nvidianews.nvidia.com/news/nvidia-and-coherent-announce-strategic-partnership-to-develop-optics-technology-to-scale-next-generation-data-center-architecture


이 지점에서 내 해석은 다음과 같다. Agent AI 확산이 촉발할 다음 변곡점을 감안하면, 엔비디아의 진화 방향이 브로드컴이 제시하는 “구리 유지”의 톤보다 현실성이 높아 보인다. 반대로 브로드컴의 발언은, Agent AI가 가져올 구조 변화의 타이밍보다 몇 걸음 뒤에 머물러 있는 것 아닌가라는 생각을 들게 한다.


그리고 이 문제의식은 자연스럽게 한 주제로 연결된다. 이전 글에서 광학 인터커넥트를 다루면서도 충분히 풀지 못했던 주제, 바로 **OCS(Optical Circuit Switch)**이다. 이번 글은 OCS를 “한 번에 이해”할 수 있도록 전문용어를 최대한 줄이고, 필요한 개념만 단계적으로 쌓는 방식으로 정리한다. 목표는 세 가지이다.

  • OCS가 무엇인지

  • 스파인(Spine) 스위치를 일부라도 대체할 수 있다고 말하는지

  • 왜 다음 단계가 **DCI(데이터센터-데이터센터 연결)**로 확장되기 쉬운지


1) 먼저 용어를 가장 쉬운 말로 정리한다


패킷(packet)


인터넷에서 데이터는 한 번에 큰 덩어리로 이동하지 않고, 보통 작은 조각으로 잘라 이동한다. 이 작은 조각 하나가 패킷이다.

긴 문서를 우편으로 보낼 때 여러 봉투로 나눠 보내는 것과 유사하다. 봉투 하나가 패킷이다. 패킷에는 “어디로 가야 하는지” 같은 주소 정보가 담긴다.


스위치(switch)


스위치는 쉽게 말해 갈림길 안내원이다. 패킷이 들어오면 주소를 읽고, 어느 경로로 내보낼지 결정한다.


큐(Queue)와 큐잉(Queueing)


큐는 줄 서는 것
이고, 큐잉은 줄이 생겨 기다리는 현상이다. 톨게이트에 차가 몰리면 줄이 생기듯, 네트워크에서도 트래픽이 몰리면 스위치 내부에 대기 줄이 생긴다. 이때 지연(latency) 이 커지고, 지연이 들쭉날쭉해질 수도 있다.


광(Optical) / 전기(Electrical)


데이터는 전기 신호로도, 빛 신호로도 전달된다. 일반적으로 빛은 고속·장거리 전송에 유리하고, 전기는 **근거리·처리(연산/스위칭)**에 유리하다.


여기서 중요한 포인트가 있다. 많은 네트워크 장비는 “빛으로 오던 신호를 스위치에서 전기로 바꿔 처리하고, 다시 빛으로 바꿔 내보내는” 구조를 가진다. 이 과정의 빛↔전기 변환(O/E/O)전력 소모와 발열을 크게 만든다.


2) OCS를 한 문장으로 설명하면 무엇인가


OCS(Optical Circuit Switch)는 ‘빛이 지나가는 길(광 경로)을 통째로 연결해주는 교환기’이다.


일반 스위치는 패킷을 하나하나 읽고(주소 확인), 그때그때 어느 길로 보낼지 결정한다. 반면 OCS는 패킷을 세밀하게 읽기보다, 아예 A와 B 사이를 일정 시간 ‘광의 전용 통로’로 연결해버린다.


비유로 보면 차이가 더 선명해진다.

  • 일반 스위치: 택배 허브이다. 들어오는 상자를 하나씩 스캔해 목적지별로 분류한다.

  • OCS: “A 공장 ↔ B 창고” 사이에 전용 고속도로를 일정 시간 열어주는 방식이다. 고속도로가 열려 있는 동안은 차(데이터)가 그냥 쭉 지나간다.


즉, 일반 스위치는 “매 순간, 매 조각 데이터를 판단”하는 장치이고, OCS는 “연결 자체를 바꿔서 통로를 고정”하는 장치이다.


3) 스파인 스위치는 무엇이고 왜 중요한가


대규모 데이터센터 네트워크는 단순화하면 2~3층 구조로 이해할 수 있다.

  • 랙(rack): 서버나 GPU가 꽂혀 있는 단위 묶음이다.

  • 리프(leaf) / ToR(Top-of-Rack): 랙 근처에서 트래픽을 모아주는 1차 구간이다(동네 길에 해당한다).

  • 스파인(spine): 여러 랙을 서로 연결해주는 중심 백본 구간이다(고속도로 교차로에 해당한다).


AI 클러스터처럼 규모가 커질수록 랙-랙 간 이동량이 폭발한다. 그 결과 스파인 장비는 더 커지고 더 비싸지며, 전력과 발열 부담도 급격히 커진다. 결국 스파인은 성능이 아니라 전력·열·TCO 문제로 병목이 되기 쉬운 지점이다.


4) 왜 OCS가 스파인을 ‘대체’할 수 있다고 말하는가


핵심은 다음 한 문장으로 압축된다.


AI 트래픽은 특정 구간에서 ‘큰 데이터가 특정 상대에게 오래 흘러가는 패턴’을 만들기 때문에, 패킷을 계속 분류하는 방식보다 ‘전용 통로’를 만들어 흘려보내는 방식이 유리해질 수 있다.

이를 조금 더 구조적으로 풀면 다음과 같다.

(1) 기존 스파인 스위치의 본질은 ‘분류 작업’이다


트래픽이 몰리면 스위치는 패킷마다 주소를 읽고 분류한다. 이 분류 작업이 커질수록,

  • 전력이 증가하고

  • 발열이 늘며

  • 큐잉이 발생해 지연이 커지고

  • 규모 확장 시 비용(TCO) 이 급격히 상승한다.


(2) AI에서는 ‘전용 통로’가 성립하는 상황이 자주 나온다

예를 들어 대규모 학습/추론에서 GPU들이 동기화하거나 대규모 텐서/그래프를 교환하는 구간은, 한동안 특정 랙-특정 랙 사이에 트래픽이 집중되는 형태를 만들기 쉽다.

  • A랙 ↔ B랙이 한동안 큰 데이터를 계속 교환하고

  • C랙 ↔ D랙도 비슷한 흐름을 유지하는 식이다.


이때는 패킷을 매번 읽고 분류하기보다,

  • A↔B 전용 통로, C↔D 전용 통로를 열어두고

  • 그 통로로 데이터를 그냥 흘려보내는 편이
    전력과 비용 관점에서 유리해질 수 있다.


(3) OCS는 ‘분류’를 줄이고 ‘전력/열’을 낮추는 쪽으로 기울 수 있다

OCS는 패킷을 세밀하게 읽고 판단하는 부담을 줄이고, 연결을 구성해 통째로 흘려보내는 방식이다. 결과적으로 스위치의 복잡한 전기적 처리 부담이 감소한다.


다만 여기서 중요한 주의가 있다.

“스파인 스위치가 완전히 사라진다”로 단정하면 위험하다.

현실적으로는 일부 트래픽은 OCS가 처리하고, 나머지는 기존 스파인/패킷 스위치가 처리하는 하이브리드 구조가 더 자연스럽다. 즉, “대체”는 “전면 교체”가 아니라 부분 대체/역할 재배치에 가깝다.


5) 왜 ‘전력’과 ‘TCO’가 계속 핵심이 되는가


AI 데이터센터의 병목은 점점 연산칩 자체보다는 전력·열·설비 한계로 이동하고 있다. 스파인 스위치는 패킷을 읽고 분류하는 고성능 전기 처리 장치이므로, 성능이 올라갈수록 전력 소모가 커지기 쉽다.


반면 OCS는 분류 부담을 낮추는 방향이므로,

  • 스케일업(더 큰 클러스터)에서 늘어나는 스파인 구간 부담을

  • 전력과 TCO 관점에서 일부 상쇄할 수 있다는 논리가 성립한다.


이 맥락에서 보면, “스파인은 트래픽 기반이고 OCS로 가능”이라는 논지는 결국 스파인 구간의 역할이 ‘정교한 분류’보다 ‘대용량 통로’에 가까워지는 순간이 생긴다는 전제 위에 서 있다.


6) 왜 다음 단계가 DCI로 확장되기 쉬운가


DCI는 데이터센터와 데이터센터를 연결하는 것이다. 여기서도 직관은 크게 다르지 않다.

(1) 내부에서 ‘전용 통로’가 의미가 커지면, 외부 연결에서도 같은 고민이 반복된다


클러스터가 커질수록 한 건물/한 센터에 다 넣기 어려워진다. 전력·냉각·부지·운영의 제약 때문에 여러 건물이나 여러 캠퍼스로 분산된다. 그러면 자연스럽게 센터-센터 사이에 큰 데이터 이동이 늘어난다.


AI 트래픽의 성격(큰 덩어리 이동, 일정 시간 지속되는 흐름)은 바깥에서도 반복되기 때문에, 내부에서 강화된 “전용 통로” 논리가 외부로도 확장되기 쉽다.


(2) 거리가 늘어날수록 전기보다 빛이 유리해진다


거리가 길어질수록 전기는 손실과 제약이 커지고, 대용량일수록 광 기반이 유리해진다. 결국 데이터센터 밖 연결은 광 중심으로 갈 가능성이 높다.


(3) 다만, OCS가 곧바로 ‘장거리 전송’ 그 자체는 아니다


여기서 오해하면 안 된다. DCI는 스위치만으로 되는 것이 아니라 장거리 전송을 위한 별도 기술과 장비가 필요하다. 그럼에도 “가능한 한 광 도메인으로 유지해 전력/비용을 낮추려는 방향”은 내부에서 외부로 이어지기 쉽다. 따라서 OCS는 DCI를 대체한다기보다, DCI로 확장되는 과정에서 결합 요소로 채택될 가능성이 커지는 것으로 이해하는 편이 정확하다.


7) 한 줄 결론


“OCS가 향후 엔비디아의 랙-랙 연결에서 스파인 스위치를 대체하느냐”라는 질문에 대해, 결론은 다음과 같이 정리할 수 있다.


일부 트래픽/일부 구간에서 대체(또는 상당 부분 역할 이전)될 가능성이 커지는 방향이라고 이해하는 것이 합리적이다.


특히 큰 데이터 흐름이 일정 시간 지속되는 패턴이 강화될수록, “분류형(패킷 스위치)” 대비 “전용 통로형(OCS)”의 전력·TCO 경제성은 개선될 수 있다. 그리고 클러스터가 더 커져 여러 센터로 분산될수록, 동일한 논리가 DCI에서도 반복되며 확장될 여지가 커진다.


부록: 컨센서스 정합 기준 FY2026~FY2028E 요약표 (US$ mn)


Lumentum (FY2026~FY2028E) 실적 요약표 (US$ mn)

(US$ mn)FY2026E     FY2027E     FY2028E

총매출

2,907

4,656

5,912
Components 소계1,7002,4803,000
ㆍScale-out lasers(EML/CW, 800G~1.6T 등)9001,1501,250
ㆍCPO/ELS lasers(UHP 레이저/ELS 콘텐츠 확장)3308801,300
ㆍTelco/Other components470450450
Systems 소계1,2072,1762,912
ㆍCloud Transceivers1,0001,4501,650
ㆍOCS150650750
ㆍOther Systems(Optical Scale-up 포함)5776512
영업이익7691,5751,843


Coherent (FY2026~FY2028E) 실적 요약표 (US$ mn)

(US$ mn)          FY2026E     FY2027E      FY2028E

총매출

6,926

8,606

10,139
Data Center & Communications 소계5,0606,7108,130
ㆍPluggable Transceivers(800G/1.6T)2,9503,4503,700
ㆍCPO(Scale-up 중심)6501,5502,650
ㆍOCS(LC 기반)2808501,250
ㆍDCI/Scale-across & Telco components1,180860530
Industrial 소계1,8661,8962,009
ㆍSemicap520650820
ㆍIndustrial lasers/others1,3461,2461,189
영업이익1,4161,9552,472




=끝

댓글 없음:

댓글 쓰기