※ 본 상품은 영문 자료로 한글과 영문 목차에 불일치하는 내용이 있을 경우 영문을 우선합니다. 정확한 검토를 위해 영문 목차를 참고해주시기 바랍니다.
AI 트래픽은 기존 네트워크가 가정해 온 클라우드 및 기업 트래픽과는 크게 다릅니다. 랙당 페타비트급 대역폭으로 운영되는 트레이닝 클러스터, 무손실 프로토콜, 마이크로초 단위의 동기화는 인프라에 새로운 도전이 되고 있습니다. 하이퍼스케일러들은 이 문제를 해결하기 위해 올해에만 6,000억 달러 이상의 설비투자를 진행하고 있습니다.
이 보고서에서는 OFC 2026에서 발표된 Meta, KDDI, China Mobile, Samsung, TSMC 등의 30편의 논문을 바탕으로 현재 AI 네트워크 구축의 실태, 아키텍처의 미래상, 공급망에서 가장 리스크가 높은 영역에 대해 기술면 기술 측면에서 밝힙니다.
주요 결론:
- AI 트래픽은 기존 트래픽과 성격이 다릅니다. 랙당 페타비트급 대역폭 요구사항, 무손실 프로토콜, 마이크로초 단위의 동기화 제약이 있는 트레이닝 클러스터는 기존 네트워크가 전송을 가정한 확률적, 지터 내성 트래픽과 거의 공통점이 없습니다.
- 업계는 어떤 의미에서 '눈 가리고 아웅'하는 식으로 진행되고 있다고 할 수 있습니다. AI 트래픽의 양, 패턴, 성장에 대한 포괄적인 공개 조사는 존재하지 않습니다. 노키아, 에릭슨 등이 부분적인 분석을 하고 있지만, 하이퍼스케일러는 트래픽 데이터를 공유하지 않습니다. 올해 6,000억 달러 이상의 설비투자를 계획하고 있는 업계에 있으며, 이는 계획 수립에 있으며, 중요한 과제입니다.
- 코패키지 광학(CPO)은 신뢰성의 한계점을 넘어섰습니다. 메타의 CPO 스위치에 대한 3,600만 장치 시간에 대한 현장 평가는 CPO 스위치의 시장 가능성을 강력하게 지원합니다. 스케일업 계층에서 리타이밍 지원 플러그인 모듈의 교체는 더 이상 '발생 여부'가 아닌 '발생 시기'의 문제가 되고 있습니다.
- '스케일 크로스'가 다음 프론티어입니다. 전력 제약으로 인해 GPU 클러스터는 여러 시설이나 캠퍼스에 분산 배치할 수밖에 없는 상황입니다. KDDI는 30km에 걸친 분산 훈련에서도 단일 사이트 클러스터와 동등한 AI 처리 완료 시간을 달성할 수 있음을 확인했습니다. Microsoft는 AI 연결을 위해 15,000km의 중공 코어 파이버를 배포한다고 발표했습니다.
- 광통신의 밸류체인은 전환점을 맞이하고 있습니다. 하이퍼스케일러가 TSMC와 삼성의 플랫폼을 활용하여 실리콘 포토닉스 설계를 자체 제작하는 가운데, 상호 연결의 가치는 개별 모듈 공급업체에서 파운드리, 파운드리, 칩렛 공급업체, 하이퍼스케일러로 이동하고 있습니다. 파운드리 공정 설계 키트(PDK) 전략이 없는 벤더는 총 생산량이 정점에 도달하는 시점에 대상 시장이 축소되는 상황에 직면하게 됩니다.
언급된 조직
- 1FINITY Inc.
- Alcatel Submarine Networks
- Alibaba Cloud
- Alphabet(Google Cloud Platform)
- Amazon(Amazon Web Services, AWS)
- AMD
- Ampere
- Anthropic(Claude)
- ARM
- AttoTude Inc.
- Berxel Photonics Co. Ltd.(선전, 중국)
- Broadcom
- ByteDance
- Centre Tecnologic de Telecomunicacions de Catalunya(CTTC-CERCA)(스페인)
- China Mobile Research Institute(베이징, 중국)
- Chinese University of Hong Kong
- Ciena
- Cornell University
- Corning Inc.
- DeepSeek
- Ericsson
- Flexcompute Inc.
- Furukawa Electric Co., Ltd.
- Huazhong Univ. of Science and Technology(우한, 중국)
- Hubei Optical Fundamental Research Center
- II-VI/Coherent
- Innolight
- Intel
- iPronics
- Jinyinhu Laboratory
- KDDI Research, Inc.
- Lumentum
- Lumiphase AG
- McGill University
- Meta Platforms
- Microsoft(Azure)
- Mistral
- Nagoya University(나고야, 일본)
- National Institute of Advanced Industrial Science and Technology(AIST)(일본)
- Nokia Bell Labs
- Nokia Corporation
- NVIDIA
- NYSERNet
- OpenAI(ChatGPT)
- Photonics Electronics Technology Research Association(PETRA)(도쿄, 일본)
- Photonics-Electronics Integration Research Center(쓰쿠바, 일본)
- Politecnico di Torino(토리노, 이탈리아)
- Ruijie(푸저우, 중국)
- Samsung Electronics Co., Ltd.
- State Key Lab of Information Photonics and Optical Communications, BUPT(베이징, 중국)
- State Key Laboratory of Photonics and Communications, Peking University(베이징, 중국)
- Taiwan Semiconductor Manufacturing Company(TSMC)(신주, 대만)
- Toyota Technological Institute
- Tsinghua-Berkeley Shenzhen Institute
- University of California, Santa Barbara
- Wuhan Changjin Photonics Technology Co.
- Wuhan Research Institute of Posts and Telecommunications
- Yonsei University(한국)
목차
- 요약
- AI 트래픽의 기초
- 하이퍼스케일 투자가 급증하는 상황에서 AI 트래픽을 이해하는 것은 매우 중요
- AI 트래픽 유형: 개요
- AI 트래픽 측정 및 예측의 과제
- 트래픽 방향 및 분석 결과: 스케일업/스케일아웃/스케일어크로스
- 스케일업: 클러스터 내부 트래픽
- 스케일 아웃: 데이터센터 패브릭 내의 트래픽
- 스케일어크로스: 데이터센터 간 AI 트래픽
- 하이퍼스케일 시장에 미치는 영향
- 스케일업
- 스케일 아웃
- 스케일아크로스
- 트랜스오션
- 진입 사업자에 대한 제안
- 광학 부품 및 트랜시버 벤더 대상
- 코히어런트 통신 분야 벤더 대상
- InfiniBand 및 이더넷 스위치/NIC 공급업체 대상
- AI 인프라를 구축하는 데이터센터 사업자 대상
- 분산형 교육 인프라를 계획하는 사업자 대상
- 지역 및 도시 네트워크에서 AI 트래픽을 취급하는 통신사업자를 위한 솔루션
- 해저 케이블 자산을 보유한 통신사업자를 위한 솔루션
- 결론
- 부록 1 : OFC 페이퍼의 세부 사항
- 부록 2: 보고서 및 출판사 정보
KSA 26.05.20