|
시장보고서
상품코드
2043020
AI 메모리 장벽 극복 : 스토리지 레이어 재할당 및 HBF 분석Crossing AI Memory Wall: Storage Layer Reallocation and HBF Analysis |
||||||
AI 추론에서 MoE 아키텍처와 장문 컨텍스트 처리로 인해 모델 가중치와 KV 캐시에 대한 메모리 용량 요구 사항이 급격히 증가하여 병목 현상이 '연산 능력 부족'에서 '메모리 용량 제한'으로 전환되고 있습니다. 웜 데이터의 양이 빠르게 증가함에 따라 스토리지 레이어 구조의 재구축이 진행되어 HBM이 핫 데이터를, HBF가 웜 데이터를 담당함으로써 비용 대비 성능을 최적화할 수 있게 됩니다. 그러나 HBF의 상용화를 위해서는 고도의 패키징 공정과 낸드플래시 고유의 특성과 관련된 과제를 극복해야 합니다.
In AI inference, MoE architectures and long-context processing have sharply increased memory-capacity requirements for model weights and KV cache, shifting the bottleneck from insufficient compute to limited memory capacity. As warm data grows rapidly, this will drive a restructuring of the storage hierarchy, where HBM will handle hot data, while HBF will carry warm data to optimize cost–performance. However, commercialization of HBF still needs to overcome challenges in advanced packaging processes and the inherent characteristics of NAND flash.