2026년 5월 31일 일요일

생각정리 269 (* AI Components Up-cycle -2)

오늘 시장은 전자·반도체 관련 레버리지 ETF로 수급이 쏠리는 가운데, 중소형주와 일부 ETF에는 매도 압력이 커지며 하락 종목 수가 늘어나는 모습이다.

그러나 단기 수급과 같은 외적 변수는 잠시 뒤로 두고, 다시 본질적인 변화에 집중해보고자 한다.  

이번 리서치 기록의 핵심은 Agentic AI가 기업의 업무 방식, 컴퓨팅 인프라, 그리고 하드웨어 밸류체인에 어떤 구조적 변화를 가져올 것인가
에 있다.

생각정리 182 (* MoltBot, Agent AI, Agent PC)

Agentic AI 시대, AI PC는 왜 다시 중요해지는가


GPU 메모리 위에 CPU 메모리와 전력관리 부품 수요가 얹히는 새로운 하드웨어 사이클


생성형 AI의 첫 번째 국면은 “누가 더 좋은 모델을 쓰는가”의 경쟁이었다. 기업들은 GPT, Claude, Gemini 같은 대형 언어모델을 업무에 붙이기 시작했고, 직원들은 질문을 입력하고 답변을 받는 방식으로 AI를 사용했다. 이 단계에서는 AI 사용량이 비교적 예측 가능했다. 사람이 질문해야 토큰이 발생했고, 비용도 사용량에 비례해 관리할 수 있었다.

하지만 Agentic AI 시대에는 비용 구조가 달라진다. Agentic AI는 사용자가 한 번 질문하면 그 뒤에서 AI가 스스로 계획을 세우고, 파일을 찾고, 데이터베이스를 조회하고, 코드를 실행하고, 외부 도구를 호출하고, 결과를 검증한 뒤 다시 작업을 반복한다. 사용자가 직접 입력하는 질문 수보다, agent가 백그라운드에서 반복 호출하는 토큰량이 비용을 결정하는 구조로 바뀐다.

이 지점에서 기업의 고민은 분명해진다. 모든 요청을 항상 최고급 frontier model에 보내면 품질은 높아지지만, cloud token OPEX는 빠르게 증가한다. 특히 여러 agent가 동시에 돌아가는 업무환경에서는 토큰 사용량이 선형적으로 늘지 않는다. Agentic AI가 도입될수록 기업은 단순히 “AI를 더 많이 쓰는 방법”보다 “AI를 감당 가능한 비용으로 계속 쓰는 방법”을 고민하게 된다.


토큰비용이 인건비보다 비쌀 때, "AI 내러티브"는 문제에 직면합니다—월스트리트CN


https://t.me/cahier_de_market

토큰 사용량이 2023년에는 commit 수가 3억 건이었고,
2024년에는 4억 건,
2025년에는 5억 건
 
그런데 2026년 들어 첫 몇 달 만에 이 수치가 거의 3배로 급증

따라서 기업은 점차 세 가지 방식으로 AI 비용을 나누게 될 가능성이 높다. 반복적이고 민감도가 낮은 작업은 로컬 AI PC에서 처리하고, 사내 데이터와 연결되는 업무는 enterprise AI server에서 수행하며, 정말 어려운 판단이나 범용 reasoning이 필요한 작업만 cloud frontier model에 넘기는 구조다.

이 변화의 핵심은 Hybrid Edge AI PC다. AI PC는 단순한 새 노트북이 아니라, cloud token 비용의 예측 가능성을 높이고 최고급 대형 LLM 호출량을 줄이는 enterprise cost-control hardware가 된다. 앞으로 NVIDIA N1X, DGX Spark, Dell Deskside Agentic AI, Vera Rubin 기반 AI Factory를 하나의 흐름으로 봐야 하는 이유가 여기에 있다.



1. COMPUTEX 2026이 보여주는 AI PC 시대의 개막


이번 COMPUTEX 2026은 AI PC 시대의 개막을 상징적으로 보여주는 이벤트가 될 가능성이 높다. PC 행사는 과거처럼 노트북, 메인보드, 그래픽카드 중심의 전시에 머물지 않고, AI가 어디에서 실행되고 어떻게 배치되는지를 보여주는 무대로 바뀌고 있다.

Intel, AMD, Qualcomm, Arm은 모두 AI PC를 다음 PC 사이클의 핵심으로 보고 있다. CPU 성능 경쟁에 NPU, GPU, on-device AI 성능이 더해지면서 PC의 정의 자체가 달라지고 있다. 앞으로의 PC는 단순히 문서 작성과 웹브라우징을 처리하는 기기가 아니라, 사용자의 업무 문맥을 이해하고 반복 작업을 대신 수행하는 local AI endpoint에 가까워진다.

그중에서도 이번 사이클에서 가장 주목되는 변화는 NVIDIA의 PC 시장 진입 가능성이다. NVIDIA, Microsoft, Arm은 COMPUTEX를 앞두고 “a new era of PC”라는 메시지를 공개했고, 이는 NVIDIA의 ARM 기반 N1·N1X 노트북 프로세서 공개 가능성과 연결돼 해석되고 있다.


https://wallstreetcn.com/articles/3773517#from=ios


https://wallstreetcn.com/articles/3773517#from=ios


https://wallstreetcn.com/articles/3773517#from=ios

NVIDIA가 Windows on Arm 생태계에 본격 진입한다면, AI PC 시장은 Intel·AMD·Qualcomm 중심의 CPU 경쟁을 넘어 NVIDIA CUDA 생태계와 로컬 AI 추론 능력이 결합되는 새로운 국면으로 넘어갈 수 있다. 기존 PC가 CPU 중심의 업무 장치였다면, 다음 AI PC는 CPU, GPU, NPU, local memory가 결합된 개인용 agent 실행 장치에 가까워진다.




2. NVIDIA N1X가 중요한 이유: AI PC가 로컬 추론 장치로 바뀐다


현재까지 알려진 N1 및 N1X 사양은 공식 발표 전 유출 정보이므로 확정 사양으로 보기는 어렵다. 다만 보도 기준으로 보면 방향성은 분명하다. N1X는 20개 CPU 코어와 48개 SM, 6,144개 CUDA 코어를 갖춘 GPU 구성이 언급됐고, 이는 DGX Spark에 사용된 GB10 Superchip과 유사한 구조로 해석된다.

여기서 중요한 부분은 CPU 코어 수나 CUDA 코어 수 자체보다 로컬 AI 실행 환경이 일반 Windows PC로 내려올 수 있다는 점이다. DGX Spark는 개발자용 Ubuntu 기반 AI 장비에 가까웠다. 반면 N1X가 Windows on Arm 노트북으로 등장한다면, NVIDIA의 AI 컴퓨팅 구조가 일반 업무용 PC 안으로 들어오게 된다.

AI PC의 역할도 달라진다. 기존 PC는 사람이 앱을 실행하는 도구였다. AI PC는 사람이 요청하기 전에 agent가 문서, 이메일, 코드, 회의록, 브라우저, 사내 시스템을 오가며 작업을 수행하는 장치로 바뀐다. 사용자는 “이 자료 정리해줘”, “지난 회의 내용 기반으로 보고서 초안 만들어줘”, “이 코드 오류 찾아줘”라고 말하지만, 내부에서는 여러 개의 AI 작업이 동시에 돌아간다.

이 모든 작업을 cloud LLM으로 보내면 비용과 보안 문제가 커진다. 그래서 반복적이고 개인화된 업무는 로컬 AI PC에서 처리하고, 고난도 판단은 cloud 또는 사내 AI server에 넘기는 구조가 필요해진다. N1X가 의미 있는 이유는 바로 이 로컬 agent 실행 계층을 강화할 수 있기 때문이다.




3. DGX Spark가 보여준 한계와 N1X 이후의 보완 방향


NVIDIA DGX Spark는 개인용 AI 슈퍼컴퓨터라는 개념을 대중화한 장비다. DGX Spark는 대용량 unified memory와 높은 AI 연산 성능을 바탕으로 개인·팀 단위에서 대형 모델을 실험할 수 있는 환경을 제시했다.

하지만 초기 DGX Spark에 대한 기대는 실제 사용환경에서 일부 조정될 필요가 있었다. 대형 모델을 로컬에서 돌릴 수 있다는 점은 강력했지만, 실제 token throughput은 모델 크기, memory bandwidth, KV cache, 추론 엔진 최적화에 크게 좌우됐다. 특히 GB10 계열의 LPDDR5X 통합 메모리는 대용량 모델을 한 장비 안에 올리는 데 유리하지만, HBM 기반 데이터센터 GPU처럼 매우 높은 대역폭을 제공하는 구조와는 다르다.

이 한계는 DGX Spark의 의미를 약화시키기보다, 역할을 더 명확하게 만든다. DGX Spark는 모든 대형 모델을 단독으로 완벽하게 처리하는 장비라기보다, 개인과 팀 단위에서 agent를 실험하고, 로컬 RAG를 만들고, 사내 데이터 기반 prototype을 검증하는 장비에 가깝다.

N1X는 이 흐름을 더 넓은 PC 시장으로 확장할 수 있다. DGX Spark가 개발자와 연구자에게 AI 실험 환경을 제공했다면, N1X 기반 AI PC는 일반 업무자에게 local AI agent 실행 환경을 제공한다. 즉 과거 DGX Spark의 한계는 “개인 장비 하나로 모든 AI를 처리한다”는 기대에서 나왔고, N1X 이후의 보완 방향은 “개인 장비와 기업 서버가 역할을 나눠 처리한다”는 구조에서 나온다.






4. 30B 미만은 AI PC, 30B 이상은 기업용 AI 서버로 가는 하이브리드 구조


Agentic AI가 본격 도입되면 기업 업무환경은 세 계층으로 나뉠 가능성이 높다.

첫 번째 계층은 AI PC다. 여기서는 30B 미만의 sLLM이나 업무 특화 모델이 주로 쓰일 수 있다. 개인 문서 검색, 회의 요약, 이메일 초안, 코드 보조, 사내 규정 질의, 로컬 파일 정리 같은 작업이 여기에 해당한다. 이 작업들은 반복 빈도가 높고, 민감한 개인·업무 데이터가 포함될 가능성이 크다. 따라서 cloud frontier model에 매번 보내기보다, 로컬에서 처리하는 편이 비용과 보안 측면에서 유리하다.

두 번째 계층은 개인용 AI 슈퍼컴퓨터 또는 deskside AI 장비다. DGX Spark, Dell Pro Max GB10 같은 장비가 여기에 해당한다. 이 계층은 개인 PC보다 무겁고, 데이터센터보다는 가까운 작업을 담당한다. 예를 들어 팀 단위 RAG, 30B~200B급 모델 테스트, 코드베이스 분석, 내부 데이터 기반 agent 개발, fine-tuning prototype이 이 계층에서 수행될 수 있다.

세 번째 계층은 enterprise AI server와 AI data center다. 30B 이상 대형 모델, 장기 context, 다중 agent orchestration, 대규모 RAG, 기업 데이터베이스 질의, 고신뢰 의사결정 지원은 이 계층으로 올라간다. NVIDIA Vera Rubin NVL72와 같은 rack-scale AI system은 이 흐름을 상징한다. GPU뿐 아니라 Vera CPU, 대용량 CPU memory, 고속 네트워크, DPU를 함께 묶어 agentic AI와 대규모 reasoning workload를 처리하는 구조다.

결국 앞으로의 기업 AI 환경은 하나의 모델, 하나의 서버, 하나의 cloud로 끝나지 않는다. AI PC가 앞단에서 반복 업무를 처리하고, deskside AI가 팀 단위 실험과 중간 규모 모델을 담당하며, enterprise AI server와 AI data center가 대형 모델과 장기 context를 처리하는 계층형 구조로 진화한다.




5. AI 메모리는 하나가 아니다: HBM, GDDR, CPU memory가 함께 커진다


여기서 중요한 포인트가 있다. 지금까지 AI 메모리 이야기는 주로 HBM 중심으로 진행됐다. 데이터센터 AI accelerator는 GPU 옆에 HBM을 붙여 대형 모델의 파라미터와 KV cache를 빠르게 처리한다. HBM은 AI 서버에서 여전히 가장 중요한 memory 병목이다.

하지만 모든 GPU memory가 HBM은 아니다. 일반 PC, 워크스테이션, 게이밍 노트북, creator PC에 들어가는 discrete GPU는 대개 GPU 옆에 GDDR 계열 VRAM을 둔다. 즉 AI PC와 workstation 환경에서는 CPU memory와 GPU memory가 따로 존재할 수 있다. CPU 옆에는 DDR5 또는 LPDDR5X 같은 system memory가 붙고, discrete GPU 옆에는 GDDR6·GDDR7 같은 VRAM이 붙는다.

반면 데이터센터 AI accelerator에서는 GPU 옆에 HBM이 붙고, 서버 CPU 옆에는 DDR5 RDIMM, MRDIMM, CXL memory 같은 CPU-attached memory가 붙는다. DGX Spark나 N1X처럼 unified memory 구조를 쓰는 경우도 있다. 이 경우 CPU와 GPU가 하나의 LPDDR5X memory pool을 공유한다.

따라서 앞으로의 AI memory 수요를 볼 때는 세 가지를 구분해야 한다. 첫째, 데이터센터 GPU 옆 HBM이다. 둘째, PC와 워크스테이션의 discrete GPU 옆 GDDR이다. 셋째, CPU 주변의 DDR5, LPDDR, RDIMM, MRDIMM, CXL memory다.

핵심은 CPU memory 수요가 GPU memory 수요를 대체하는 구조가 아니라, GPU memory 수요 위에 추가로 얹히는 구조라는 점이며 Agentic ai 시대에는 CPU memory 중요성이 더욱 부각될 것이라는 것이다.

즉, AI PC와 workstation에서는 GDDR 기반 GPU VRAM 수요가 유지되면서, 로컬 agent 실행을 위한 system DRAM 또는 LPDDR 용량도 함께 커진다.





6. Agentic AI가 CPU를 다시 중요하게 만드는 이유


기존 LLM 사용 방식에서는 GPU가 대부분의 주목을 받았다. 모델 파라미터를 읽고, 행렬 연산을 수행하고, 토큰을 생성하는 과정에서 GPU와 HBM이 핵심 병목이었기 때문이다. 이 구조에서는 “더 많은 GPU, 더 빠른 HBM”이 성능 개선의 중심이었다.

Agentic AI에서는 GPU가 여전히 중요하지만, CPU의 역할이 커진다. agent는 단순히 답변만 생성하지 않는다. 작업을 쪼개고, 여러 도구를 호출하고, 파일을 읽고, 코드를 실행하고, 결과를 비교하고, 실패하면 다시 시도한다. 이 모든 흐름을 조율하는 계층이 CPU다.

AI 서버에서 CPU는 더 이상 GPU를 깨우는 host processor에 머물지 않는다. agent workflow를 실제로 움직이는 orchestration engine에 가까워진다. CPU는 tool call, file I/O, network I/O, security policy, scheduling, sandbox execution, agent state management를 처리한다. Agentic AI 도입이 확대될수록 GPU 병목에 CPU 병목이 추가되는 구조가 된다.

대형 모델 추론에는 여전히 GPU memory가 필요하다. 다만 Agentic AI가 업무 전반에 들어오면, CPU와 CPU-attached memory가 처리해야 하는 context, tool output, file I/O, network I/O, 보안 정책, scheduling workload가 함께 늘어난다.





7. CPU-attached memory는 Agentic AI의 작업 공간이 된다


CPU가 중요해지면 자연스럽게 CPU-attached memory도 중요해진다. 여기서 CPU-attached memory는 CPU 옆에 붙어 CPU가 직접 접근하는 DRAM, LPDDR, DDR5 RDIMM, MRDIMM, CXL memory 등을 의미한다.

Agentic AI는 한 번의 답변으로 끝나지 않는다. 여러 단계의 작업 기록, 검색된 문서, tool output, 코드 실행 결과, 사용자별 context, 장기 memory를 계속 참조한다. GPU HBM은 active inference와 hot KV cache를 처리하지만, 모든 데이터를 HBM 안에 계속 둘 수는 없다. HBM은 빠르지만 비싸고, 용량도 제한적이다.

여기서 메모리 계층이 나뉜다. 가장 뜨거운 데이터는 GPU memory에 머문다. 데이터센터 GPU에서는 HBM, PC·워크스테이션 discrete GPU에서는 GDDR VRAM이 이 역할을 맡는다. 반면 agent state, warm context, tool output, system process, 문서 검색 결과는 CPU-attached memory에 머문다. 더 긴 기록과 대규모 문서는 CXL memory, NVMe, shared storage, context memory tier로 내려간다.

이 구조를 이해하면 AI memory 수요의 방향이 명확해진다. GPU memory 수요는 계속 증가한다. 동시에 Agentic AI가 확산될수록 CPU memory 수요도 추가로 증가한다. 기존 생성형 AI 사이클이 HBM 중심이었다면, 다음 Agentic AI 사이클은 HBM과 GDDR 위에 CPU-attached memory 수요가 겹쳐지는 구조가 될 가능성이 높다.

AI PC에서도 같은 논리가 적용된다. discrete GPU가 있는 AI PC는 GPU 옆 GDDR VRAM으로 로컬 AI와 그래픽 workload를 처리하고, CPU 옆 DDR5·LPDDR memory로 agent orchestration과 앱·파일·브라우저·보안 프로세스를 처리한다. 통합 SoC형 AI PC는 하나의 LPDDR memory pool을 CPU와 GPU가 공유한다. 두 구조 모두 공통적으로 메모리 용량과 대역폭의 중요도가 올라간다.

기업용 AI 서버에서는 이 현상이 더 강하게 나타난다. GPU HBM은 대형 모델 inference를 담당하고, CPU DDR5·MRDIMM·CXL memory는 agent state와 long-context workflow를 받쳐준다. Vera Rubin NVL72 같은 rack-scale 구조가 GPU뿐 아니라 Vera CPU와 CPU memory 계층을 함께 강조하는 이유도 여기에 있다.




8. 메모리 컨트롤러와 RCD: 보이지 않지만 병목을 줄이는 부품


CPU-attached memory가 중요해지면, 그 사이를 연결하는 부품도 중요해진다. 대표적인 것이 메모리 컨트롤러와 RCD다.

메모리 컨트롤러는 CPU가 DRAM과 데이터를 주고받도록 관리하는 관문이다. CPU 코어가 많아지고, agentic workload가 병렬로 늘어나면, 메모리 컨트롤러는 더 많은 요청을 더 빠르게 처리해야 한다. 단순히 데이터를 많이 읽는 문제가 아니다. 여러 agent의 요청이 동시에 들어오고, tool call 결과와 context가 섞이며, latency와 bandwidth 요구가 계속 바뀐다.

서버 DDR5 RDIMM에서는 RCD, 즉 Registering Clock Driver가 핵심 역할을 한다. RCD는 host memory controller와 DRAM 칩 사이에서 command, address, clock 신호를 분배하고 안정화한다. CPU가 더 많은 DRAM 칩과 더 큰 용량의 모듈을 안정적으로 구동하려면, 신호 무결성과 타이밍 관리가 중요하다. RCD는 이 역할을 수행하면서 서버 메모리의 고용량화와 고속화를 가능하게 한다.

Agentic AI 서버에서는 메모리 용량과 속도가 동시에 필요하다. 더 많은 사용자의 context를 담아야 하고, 더 많은 agent state를 유지해야 하며, 더 많은 tool output을 처리해야 한다. 이 과정에서 RDIMM의 고속화와 고용량화가 중요해지고, 이를 안정적으로 구동하는 RCD의 가치도 높아진다.

더 나아가 MRDIMM에서는 MRCD와 MDB 같은 인터페이스 칩이 중요해진다. MRDIMM은 서버 CPU가 더 넓은 메모리 대역폭을 확보하기 위한 방향 중 하나다. AI·HPC·Agentic AI workload가 CPU memory bandwidth를 더 요구할수록 MRDIMM과 관련 인터페이스 칩의 중요성도 커질 수 있다.



9. PMIC, MLCC, ABF substrate로 이어지는 CPU 주변 부품 사이클


CPU와 CPU-attached memory의 중요성이 올라가면 전력 관리 부품과 기판도 함께 중요해진다. Agentic AI workload는 부하가 일정하지 않다. 모델 추론, 파일 검색, 코드 실행, tool call, 네트워크 통신, 보안 검증이 짧은 주기로 반복된다. 이런 환경에서는 CPU, 메모리, SSD, NIC, DPU의 전력 부하가 빠르게 변한다.

이때 PMIC의 역할이 커진다. PMIC는 각 부품에 필요한 전력을 효율적으로 공급하고 전압을 안정화하는 부품이다. 중요한 변화는 DDR4에서 DDR5로 넘어오면서 전력 관리 구조 자체가 달라졌다는 점이다. 과거 DDR4에서는 메모리 모듈에 필요한 전력 관리 기능이 주로 메인보드 또는 CPU 주변 전원부에 위치했다. 반면 DDR5부터는 PMIC가 DIMM 모듈 위에 직접 탑재된다. 즉 전력 관리 기능이 보드 레벨에서 모듈 레벨로 이동한 것이다.


DDR4에서는 메모리 전압을 조정하는 VR 기능이 주로 메인보드 전원부에 있었다. 메인보드가 12V를 1.2V로 낮춘 뒤 DIMM에 공급하는 구조였다. 반면 DDR5부터는 DIMM이 12V를 직접 받고, 모듈 위에 탑재된 PMIC가 이를 1.1V 등 필요한 전압으로 변환한다. 즉 전력 관리 기능이 보드 레벨에서 모듈 레벨로 이동한 것이다.


이 변화는 부품 수요의 성격을 바꾼다. DDR4에서는 메인보드 전원부가 여러 메모리 모듈에 전력을 공급하는 구조였다면, DDR5에서는 모듈 자체가 전력 변환과 전압 안정화 기능을 더 많이 담당한다. 그 결과 메모리 모듈 하나당 PMIC, MLCC, 인덕터 등 전력관리 부품의 탑재 가치가 높아진다. 메모리 용량이 커지고 채널 수가 늘어날수록, 단순 DRAM 칩 수요뿐 아니라 모듈 주변 전력관리 부품의 BoM도 함께 증가할 수 있다.

수혜 강도도 이 지점에서 달라진다. DDR4에서 DDR5로 바뀌는 변화는 단순히 DRAM 세대가 바뀌는 문제가 아니다. 전력 관리 기능이 모듈 내부로 이동하면서, PMIC는 선택적 주변 부품이 아니라 DDR5 모듈의 핵심 부품으로 자리 잡는다. 서버용 DDR5 RDIMM과 고용량 DIMM에서는 안정성, 전력 효율, 발열 관리가 더 중요하기 때문에 PMIC의 사양도 높아질 수 있다. 이는 전력관리 부품의 수량 증가뿐 아니라 단가 상승 여지까지 만들어내는 변화다.

MLCC도 같은 맥락에서 중요하다. MLCC는 전자회로에서 전압을 안정화하고 노이즈를 줄이는 대표 수동소자다. DDR5 DIMM에 PMIC가 올라오면, 그 주변에는 전압 변동을 줄이고 전원 품질을 안정화하기 위한 MLCC와 인덕터가 함께 필요해진다. 특히 AI 서버처럼 고속 메모리와 높은 전력 밀도를 요구하는 시스템에서는 작은 전압 흔들림도 신호 품질과 안정성에 영향을 줄 수 있다. 따라서 고성능 MLCC, 파워 인덕터, 전원 안정화 부품의 중요도는 함께 높아진다.

ABF substrate는 더 하부의 핵심 인프라다. ABF는 고성능 반도체 패키지 기판에 쓰이는 절연 재료다. CPU, GPU, AI accelerator, networking ASIC처럼 입출력 밀도가 높고 전력 소모가 큰 칩은 고성능 패키지 기판이 필요하다. Agentic AI 시스템은 단일 칩 성능만으로 발전하지 않는다. CPU, GPU, memory controller, DPU, NIC, storage controller, high-speed interconnect가 하나의 시스템으로 묶인다. 이 칩들을 고밀도로 연결하고, 신호 무결성과 전력 전달 능력을 유지하려면 ABF substrate의 중요성은 더 커질 수밖에 없다.

Morgan Stanley

결국 CPU 주변 부품 사이클은 단순히 “전력 부품이 조금 더 필요하다”는 수준이 아니다. Agentic AI가 CPU와 CPU-attached memory 사용량을 늘리고, DDR5 전환이 전력 관리 기능을 메모리 모듈 안으로 이동시키며, 서버 메모리 고용량화가 RCD·PMIC·MLCC·인덕터·ABF substrate의 중요도를 동시에 높이는 구조다. 이는 GPU와 HBM 중심의 AI 밸류체인 위에, CPU memory와 전력관리 수동소자 사이클이 추가로 형성될 수 있음을 의미한다.




10. 결론: AI PC는 PC 교체 사이클을 넘어 token OPEX 절감 장치가 된다


Agentic AI 시대의 핵심 변화는 모델 성능 향상만으로 설명하기 어렵다. 비용 구조, 업무 방식, 컴퓨팅 배치, 메모리 계층, 전력 관리 부품 수요가 동시에 바뀐다.

기업은 앞으로 모든 작업을 cloud frontier model에 보내지 않을 가능성이 높다. 반복적이고 개인정보·사내정보가 많은 업무는 AI PC에서 처리하고, 팀 단위 실험과 중간 규모 모델은 deskside AI 장비에서 수행하며, 대형 모델과 장기 context는 enterprise AI server와 AI data center로 올리는 방식이 더 현실적이다.

이 구조에서 AI PC의 의미는 단순한 PC 교체 수요를 넘어선다. AI PC는 cloud token OPEX를 줄이고, 보안 민감 데이터를 로컬에서 처리하며, agentic workflow의 앞단을 담당하는 enterprise cost-control hardware가 된다.

동시에 하드웨어 밸류체인도 넓어진다. 지난 AI 인프라 사이클의 중심이 GPU와 HBM이었다면, Agentic AI 사이클에서는 HBM, GDDR, CPU-attached memory가 함께 중요해진다. 데이터센터 GPU 옆 HBM 수요는 계속 커지고, AI PC·워크스테이션의 discrete GPU 옆 GDDR 수요도 유지된다. 여기에 CPU가 agent orchestration을 담당하면서 DDR5, LPDDR, MRDIMM, CXL memory 같은 CPU memory 수요가 추가로 얹힌다.

또 하나의 중요한 변화는 전력 관리 구조다. DDR5 전환 이후 PMIC가 메모리 모듈 위로 올라오면서, 메모리 모듈은 단순 DRAM 집합체가 아니라 전력 변환과 안정화 기능을 포함한 고부가 부품 플랫폼으로 바뀌고 있다. 이 변화는 PMIC, MLCC, 인덕터, RCD, MRCD, ABF substrate까지 이어지는 CPU 주변 부품 수요를 자극할 수 있다.

NVIDIA N1X, DGX Spark, Dell Deskside Agentic AI, Vera Rubin 기반 AI Factory는 서로 다른 제품군처럼 보이지만, 실제로는 하나의 흐름 안에 있다. AI를 cloud에서만 쓰던 시대에서, AI가 PC·서버·데이터센터 전반에 분산 배치되는 시대로 넘어가는 변화다.

그래서 이번 AI PC 사이클은 과거의 노트북 교체 사이클과 성격이 다르다. 앞으로의 AI PC는 더 빠른 PC를 넘어, 기업이 Agentic AI를 감당 가능한 비용으로 운영하기 위한 가장 앞단의 인프라가 될 가능성이 높다. 그리고 그 변화는 GPU와 HBM만이 아니라, GDDR, CPU memory, RCD, PMIC, MLCC, 인덕터, ABF substrate까지 이어지는 새로운 부품 사이클로 확장될 수 있다.


골드만 삭스, "AI 병목 현상"에 합류: MLCC가 새로운 저장소로 자리 잡았으며 AI 서버에서 "세 번째로 큰 비용 항목"이 되었습니다 - 월스트리트CN


골드만 삭스, "AI 병목 현상"에 합류: MLCC가 새로운 저장소로 자리 잡았으며 AI 서버에서 "세 번째로 큰 비용 항목"이 되었습니다 - 월스트리트CN




=끝.

2026년 5월 28일 목요일

생각정리 268 (* AI Components Up-cycle -1)

AI 수요의 확산 범위가 빠르게 넓어지고 있다. 초기 수요가 AI 학습용 데이터센터와 고성능 GPU 인프라에 집중됐다면, 최근에는 추론 수요 확대와 Agentic AI 확산을 계기로 수요의 저변이 AI 데이터센터를 넘어 전통 데이터센터, 엔터프라이즈 서버, PC·데스크톱, 나아가 엣지 디바이스까지 확장되는 흐름이 나타나고 있다.

이 변화는 단순히 일부 고성능 반도체 수요 증가에 그치지 않는다. AI 워크로드가 다양한 IT 기기로 분산될수록 전원 관리, 신호 안정화, 고속 연산 보조, 열·전력 효율 개선을 위한 전자전기 부품 수요도 함께 증가한다.

최근 MLCC를 포함한 수동소자와 주요 전자부품에서 가격 인상 움직임이 다방면으로 확인되는 배경 역시 이러한 구조적 변화와 맞닿아 있다.

따라서 이번 글에서는 AI 추론 및 Agentic AI 확산이 어떻게 전체 IT Set 수요를 다시 끌어올리고 있는지, 그리고 이 과정에서 MLCC를 비롯한 수동소자·전자부품 업황 개선이 어떤 경로로 나타나는지를 점검하고자 한다.


Closed-loop Agentic AI가 수동소자 구조적 업사이클을 만드는 경로

1. 핵심 결론


이번 수동소자 사이클은 단순한 스마트폰·PC 재고 보충 사이클이 아니라, AI 연산 구조 변화에서 출발하는 고부가 부품 업사이클로 봐야 한다. 핵심 출발점은 AI 모델 수요 자체보다 토큰 처리량의 폭증이다.

MiniMax 사례에서 확인되듯이 모델 단가가 내려가고 코딩 에이전트, 업무 생산성 에이전트, 멀티모달 생성이 확산되면 토큰 사용량은 선형적으로 늘지 않고 계단식으로 증가한다. MiniMax도 M2 시리즈의 토큰 사용량 급증을 일회성이 아니라 장기 추세의 시작으로 봤고, 향후 성장 동력으로 코딩, 업무 생산성, 멀티모달 콘텐츠 생성을 제시했다.

minimax


화타이증권
https://t.me/HANAchina
미국 대비 압도적으로 저렴한 중국 토큰 단가

https://t.me/free_life59


https://t.me/free_life59

여기에 closed-loop agentic AI가 붙으면 연산량은 한 단계 더 커진다. 기존 AI가 문서 작성, 요약, 질의응답 중심이었다면, agentic AI는 업무를 계획하고 실행하고 결과를 관찰한 뒤 다시 추론하고 재시도한다. Michael Dell은 기존 AI가 20~30% 생산성 개선을 제공했다면, agentic AI는 워크플로를 계획·실행·피드백 반영하는 닫힌 루프를 통해 20~30배 생산성 개선까지 만들 수 있다고 설명했다. 동시에 에이전트를 메모리, 자격증명, 접근권한, 실행능력을 가진 “digital workers”로 정의했다. (crn.com)


이 변화는 중앙 AI 데이터센터만으로 흡수하기 어렵다. AI-ready 데이터센터는 계속 커지겠지만, 반복 추론, 민감 데이터, 저지연 워크로드는 온프레미스, 프라이빗 클라우드, 엣지 서버, AI PC로 내려갈 가능성이 높다.

Deloitte도 기업 AI 인프라가 public cloud, private infrastructure, edge computing으로 나뉘는 3-tier hybrid model로 이동하고 있다고 설명한다. (deloitte.com)



결국 수동소자 관점의 결론은 명확하다. 중앙 AI 데이터센터는 더 커지고, 추론은 더 분산된다. 이 병렬 확장이 AI 서버, CPU 서버, 스토리지, 네트워크 장비, 전력 인프라, AI PC, 워크스테이션, 로봇·산업용 엣지 디바이스의 전자부품 탑재량과 사양을 동시에 끌어올린다.


2. Closed-loop agentic AI는 왜 연산량을 폭증시키는가


기존 챗봇은 대체로 1회 입력 → 1회 응답 구조였다. 반면 closed-loop agentic AI는 계획 수립 → 도구 호출 → 결과 관찰 → 재추론 → 검증 → 재시도 → 실행의 반복 구조다.

이 구조에서는 업무 한 건당 모델 호출 수, 토큰 수, 메모리 사용량, 데이터 검색량, 스토리지 접근량이 동시에 증가한다. 단순 답변형 AI는 출력 후 작업이 끝나지만, closed-loop agent는 결과가 틀리거나 불충분하면 다시 계획하고, 다른 도구를 호출하고, 새로운 데이터를 가져오고, 다시 검증한다.

이 과정에서 연산 병목은 GPU에만 생기지 않는다. GPU/NPU는 추론을 처리하지만, CPU는 상태 관리, 입출력, 분기 처리, 재시도, 메모리 호출을 담당한다. 스토리지는 RAG와 비정형 데이터 접근을 지원하고, 네트워크는 에이전트 간 통신과 데이터 이동을 처리한다.

arXiv 연구도 reasoning·agentic workflow가 token demand를 증가시켜 추론 에너지와 용량 계획의 중요성을 높인다고 설명한다. 특히 test-time scaling에서 토큰이 15배 늘면 쿼리당 에너지가 약 13배 증가할 수 있다는 추정도 제시된다. (arxiv.org)

MiniMax의 컨콜 정리도 같은 방향이다. 회사는 L4 수준의 AI를 동료 수준 지능, L5를 조직 수준 지능에 가까운 단계로 설명했고, 코딩보다 더 큰 시장으로 데이터 분석, 금융 모델링, 프레젠테이션 작성 등 업무 생산성 영역을 제시했다. 또한 내부적으로 에이전트 인턴이 소프트웨어 개발, 데이터 분석, 운영관리, 채용, 영업·마케팅 등 다양한 업무에 활용되고 있으며, 이 과정이 업무 흐름 단축과 모델 R&D 방향 개선의 피드백 루프로 작동한다고 정리되어 있다.


https://openrouter.ai/apps/openclaw


즉 agentic AI가 closed-loop로 발전할수록 AI는 “응답하는 도구”에서 “업무를 지속 수행하는 디지털 근로자”로 바뀐다. 이 변화가 토큰 사용량과 추론 인프라 수요를 구조적으로 키운다.


3. 보안 개념도 사람 계정에서 비인간 작업자 관리로 확장된다


Agentic AI가 closed-loop로 가면 보안의 범위도 바뀐다. 기존 보안은 사람 계정, 기기, 애플리케이션 접근을 보호하는 것이 중심이었다. 그러나 에이전트가 디지털 근로자로 작동하면, 기업은 사람뿐 아니라 비인간 작업자, 즉 AI 에이전트의 권한과 행동도 관리해야 한다.

에이전트는 단순 챗봇이 아니라 메모리, 권한, 접근 권한, 실행 능력을 가진 업무 주체가 된다. 따라서 어떤 데이터에 접근할 수 있는지, 어떤 시스템을 실행할 수 있는지, 어떤 결정을 자동화할 수 있는지, 실패 시 어떤 루프로 재시도하는지를 통제해야 한다.

Dell도 agentic AI 플랫폼을 “governed, on-prem digital workforce”로 정의하고, 기업이 AI 에이전트를 데이터 가까이에서 통제 가능한 방식으로 설계·배포·운영·관리해야 한다고 설명한다. Dell의 설명에서 중요한 부분은 agentic workload가 compute, storage, networking, orchestration, security 전체 스택을 압박한다는 점이다. (dell.com)


Dell

이 지점은 온프레미스 AI 수요와 직접 연결된다. 에이전트가 기업 내부 데이터, 고객정보, 생산 시스템, 금융 데이터, 의료 데이터, 공공 데이터에 접근해야 한다면, 모든 연산을 퍼블릭 클라우드에만 의존하기 어렵다. AI를 데이터가 있는 곳으로 가져오는 구조가 더 자연스럽다. (*온프레미스)


4. Conventional data center만으로는 한계가 생긴다


AI 수요가 늘어날수록 대형 AI 데이터센터 투자는 계속 확대될 수밖에 없다. 다만 기존 conventional data center만으로는 AI 워크로드를 충분히 수용하기 어렵다. 기존 데이터센터는 일반 서버, 공랭 방식, 낮은 랙 전력밀도, 상대적으로 단순한 네트워크 구조를 전제로 설계된 경우가 많기 때문이다. 반면 AI 훈련과 추론은 훨씬 높은 전력밀도, 냉각 성능, 네트워크 처리능력, 메모리 대역폭을 요구한다.

McKinsey는 AI 훈련 워크로드가 랙당 100~200kW 이상의 전력밀도를 요구할 수 있으며, 추론 워크로드 역시 30~150kW 수준의 랙 전력밀도를 필요로 한다고 설명한다. 또한 2030년에는 inference가 AI 데이터센터 내에서 training을 넘어 가장 큰 워크로드가 될 것으로 전망한다. 이는 AI 인프라 투자의 중심이 초기 학습용 클러스터에서 대규모·상시적 추론 인프라로 확장되고 있음을 의미한다. (McKinsey)


전력망 역시 핵심 병목으로 부상하고 있다. McKinsey의 데이터센터 수요 모델에 따르면 글로벌 데이터센터 수요는 2025년 82.3GW에서 2030년 219.0GW로 확대될 수 있다. 이 가운데 AI inference 수요는 2025년 20.9GW에서 2030년 93.3GW로 증가하는 구조다. AI 수요가 단순히 GPU 서버 증설의 문제가 아니라 전력, 냉각, 배전, 네트워크, 공간 설계 전반의 재구성을 요구하는 단계로 진입하고 있는 것이다. (McKinsey)

따라서 AI 수요에 대한 해법은 “중앙 AI 데이터센터를 더 많이 짓는 것”에만 머물기 어렵다. 보다 현실적인 방향은 AI-ready DC, 분산형 추론 DC, 온프레미스 AI factory, 엣지 AI가 병렬적으로 확대되는 구조다. 중앙 AI 데이터센터는 frontier model training과 대규모 범용 추론을 담당하고, 반복적·민감·저지연 추론은 기업 내부 인프라와 엣지로 내려가는 방식이다.

이번 CY1Q26 컨콜에서 Nvidia가 Datacenter 사업을 하이퍼스케일러향 수요정부·기업 등 AI Factory 수요로 구분해 설명한 점도 이 흐름과 맞닿아 있다. Nvidia는 기존 하이퍼스케일러 중심의 AI 인프라 투자 외에도, 앞으로는 정부기관과 민간기업이 자체적으로 AI Factory를 구축하는 수요가 더 중요해질 수 있음을 시사했다. 이는 AI 인프라의 수요처가 소수의 대형 클라우드 사업자에서 산업별 기업, 공공기관, 지역 단위 데이터센터로 확산되는 방향을 보여준다.

NVIDIA


이러한 변화는 앞서 언급한 Agentic AI의 closed-loop 기능 도입에 따른 토큰 수요 폭증과도 연결된다. Agentic AI는 단발성 질의응답에 그치지 않고, 계획 수립, 도구 호출, 실행, 검증, 재시도 과정을 반복한다. 이 과정에서 추론 호출 횟수와 토큰 사용량은 기하급수적으로 늘어날 수 있다.

결국 추론 수요는 중앙 클라우드에만 집중되기보다, 기업 내부와 현장 가까운 곳으로 분산될 가능성이 높다.

이 구조는 수동소자 수요의 저변을 넓히는 요인이다. AI-ready DC와 AI Factory가 확산될수록 고전력 전원공급, 전력변환, 신호 안정화, 열 관리, 고속 네트워크 장비에 필요한 MLCC, 인덕터, 저항, 커패시터 등 수동소자의 탑재량이 늘어난다.

AI 인프라 투자가 중앙 집중형 데이터센터에서 분산형 AI Factory와 엣지 인프라로 확장될수록, 수동소자 수요도 더 넓은 산업 기반 위에서 구조적으로 증가할 가능성이 높다.


5. 온프레미스로 수요가 확산되는 이유


온프레미스 확산은 단순히 클라우드 용량이 부족해서 발생하는 변화가 아니다. 핵심은 비용, 데이터 주권, 지연시간, 보안, 회복탄력성이다.

Deloitte는 continuous, high-volume inference가 빈번한 API 호출과 사용량 증가를 만들며 기업의 AI 비용을 예측하기 어렵게 만든다고 설명한다. 또한 데이터 주권, 지연시간, IP 보호, 시스템 회복탄력성이 기업의 인프라 의사결정을 바꾸고 있다고 분석한다. (deloitte.com)

기업 입장에서는 RAG, 내부문서 검색, 고객정보 처리, 제조공정 제어, 금융·의료·공공 데이터처럼 외부 클라우드로 보내기 어려운 워크로드가 많다. 이 경우 “데이터를 클라우드로 보내는 것”보다 AI를 데이터가 있는 곳으로 가져오는 구조가 더 합리적이다.

HPE의 최근 어닝콜 정리도 이 흐름을 확인시켜준다. HPE는 FY2026 1분기 주문이 매출보다 빠르게 증가한 배경으로 AI 도입 확대, 온프레미스 인프라 현대화, 부품 부족과 가격 상승 전 선발주를 제시했다. HPE는 데이터센터 스위칭 주문이 정상화 기준 mid-40% 증가했고, 라우팅 주문도 mid-20% 증가했으며, AI 네트워킹 누적 수주 목표를 17억~19억 달러로 상향했다.

HPE

이는 온프레미스 AI가 단순 서버 한 대의 문제가 아니라 서버, 스토리지, 네트워크, 전력, 냉각, 보안, 관리 소프트웨어를 함께 요구하는 인프라 현대화 사이클이라는 뜻이다.


6. 엣지 AI 디바이스로 수요가 내려가는 구조


엣지는 frontier model 전체를 대체하지 않는다. 대신 작은 모델, 로컬 추론, 센서 데이터 전처리, 저지연 의사결정, 개인정보 보호형 기능을 맡는다.

McKinsey는 inference workload가 training과 달리 개별 작업 단위로 쪼개기 쉽고, 실시간·저지연 처리가 중요해지면서 더 작고 모듈화된 분산 데이터센터가 필요해질 수 있다고 본다. 또한 inference의 상당 부분이 edge로 이동해 지연시간과 대역폭 부담을 줄일 수 있다고 설명한다. (mckinsey.com)

AI PC도 같은 흐름이다. Gartner는 2026년 AI PC 출하량이 1.43억 대에 이르고, 전체 PC 시장의 55% 수준까지 올라갈 것으로 전망한다. 또한 2026년 말까지 소프트웨어 벤더의 40%가 PC에서 직접 구동되는 AI 기능 투자를 우선시하고, 복수의 SLM이 PC에서 로컬 구동될 것으로 본다. (gartner.com)


IDC도 2025년 글로벌 edge computing 지출을 약 2,610억 달러로 보고, 2028년에는 3,800억 달러에 이를 것으로 전망한다. 특히 AI, IoT, AR, VR, 드론, 로보틱스 관련 use case가 edge 투자를 견인하는 구조다. (my.idc.com)


따라서 AI 연산은 중앙 집중에서 분산형으로 단순 이동하는 것이 아니라, 중앙 집중과 분산 추론이 동시에 커지는 방향으로 간다. 중앙 AI 서버뿐 아니라 엣지 서버, 산업용 게이트웨이, AI PC, 워크스테이션, 로봇, 스마트글래스에도 고성능 전원부와 고밀도 PCB가 필요해진다.


7. 워크로드별 연산 배치와 수동소자 수요



핵심은 대형 AI DC와 온프레미스·엣지가 대체 관계가 아니라 동반 성장 관계라는 점이다. 이 구조에서는 수동소자 업체의 수요 기반이 단일 세트 수요에서 다층적 인프라 수요로 넓어진다.


8. Dell과 HPE가 보여주는 하드웨어 확산 신호


Dell

Dell은 FY2027 1분기에 AI 서버 주문 244억 달러, AI 서버 매출 161억 달러, AI 서버 백로그 513억 달러를 기록했다. 동시에 전통 서버·네트워킹 매출도 85억 달러로 전년 대비 92% 증가했다. Dell은 AI 서버 수요가 neocloud, sovereign AI, enterprise 고객군에서 모두 증가하고 있으며, 메모리 공급이 가장 큰 병목이라고 설명했다.

더 중요한 것은 agentic AI가 전통 CPU 서버 수요까지 만든다는 코멘트다. Dell은 에이전트가 실제 작업을 수행하려면 CPU가 상태 관리, 입출력, 분기, 재시도, 메모리 호출을 처리해야 하므로 CPU 서버 수요를 확대한다고 설명했다.


HPE

HPE는 AI 데이터센터와 기존 데이터센터 현대화 수요가 동시에 강하다고 밝혔다. 데이터센터 스위칭, 라우팅, AI 네트워킹 수주가 강했고, 서버 주문도 AI 인프라 확대와 기존 시스템 현대화, 공급난 우려에 따른 선주문이 반영됐다.

이 두 회사의 코멘트를 합치면 AI 인프라는 GPU 서버에서 끝나지 않는다. CPU 서버, 스토리지, 네트워크, 전력 인프라, 온프레미스 시스템, PC까지 확산되는 구조다.


HP
AI 추론 및 agentic 수요가 인프라를 넘어서 엣지 device까지 번지면, 
가장 직접적인 수혜는 HP이지 않을까?




9. Lenovo와 HP가 보여주는 엣지 AI 수요


Lenovo

Lenovo의 핵심 메시지는 Hybrid AI다. AI가 클라우드에만 집중되지 않고 개인 디바이스, 기업 내부 인프라, 프라이빗 클라우드, 서비스형 인프라로 분산된다는 관점이다. Lenovo는 PC, 워크스테이션, 스마트폰, 태블릿, 서버, 스토리지, 서비스형 인프라를 모두 갖고 있어, AI 수요가 디바이스와 인프라 양쪽으로 확산되는 구조를 보여준다.

HP는 엣지 AI 쪽 신호를 더 직접적으로 보여준다. HP는 AI 워크로드가 클라우드에서 엣지 디바이스로 이동하는 구조적 변화에 주목하고 있고, AI PC 출하 비중이 빠르게 상승하고 있다고 설명했다. 동시에 메모리·스토리지 비용 상승이 하반기 마진 부담 요인으로 제시됐다.

AI PC와 워크스테이션은 클라우드 AI를 대체하기보다는 보완한다. 짧은 지연시간, 개인정보 보호, 로컬 파일 접근, 회의·문서·코딩·디자인 작업의 상시 AI 지원은 로컬 디바이스에서 처리될 여지가 크다. 이 경우 NPU, CPU, GPU, 고용량 메모리, 고속 SSD, 고전력 전원부, 고밀도 PCB가 필요해진다.


10. MiniMax가 보여주는 토큰 경제의 방향



minimax


MiniMax의 컨콜 정리에서 중요한 포인트는 “모델 단가 하락에도 토큰 수요가 폭증한다”는 점이다. 회사는 2026년 2월 기준 M2 텍스트 모델 시리즈의 백만 토큰당 추론 비용이 2025년 12월 대비 50% 이상 하락했고, Hailuo 영상 생성 모델의 추론 지연 시간도 30% 이상 감소했다고 설명했다. 동시에 2026년 성장축으로 L4~L5 수준의 프로그래밍 지능, 업무 생산성 에이전트, 멀티모달 콘텐츠 생성을 제시했다.

MiniMax가 제시한 플랫폼 가치 공식도 수동소자 사이클과 연결된다.

AI platform value = intelligence density × token throughput

모델의 지능 수준이 높아지고 대규모 토큰 처리 역량이 결합될수록 플랫폼 가치가 커진다는 논리다. 이 공식은 곧 인프라 수요의 공식이기도 하다. 토큰 처리량이 늘수록 GPU, CPU, 메모리, 스토리지, 네트워크, 전력부품, 냉각부품 수요가 커진다.


11. 수동소자 사이클은 왜 구조화되는가


이번 수동소자 사이클은 과거의 범용 MLCC 쇼티지와 성격이 다르다. 과거에는 스마트폰, PC, 가전, 자동차 전장화가 동시에 재고를 끌어올리며 범용품까지 가격이 급등했다.

이번에는 AI 서버, AI 네트워크, 데이터센터 전력 인프라, 고성능 스토리지, AI PC, 워크스테이션, 전장 ADAS·xEV, 로봇·산업용 엣지가 고부가 제품부터 타이트하게 만들고 있다.

AI 서버와 네트워크 장비는 전력 밀도와 신호 속도가 높다. GPU·CPU·HBM·고속 네트워크 ASIC이 동시에 작동하면 순간 전류 변동, 전압 강하, 고주파 노이즈, 발열 대응이 중요해진다. 이때 MLCC, 파워 인덕터, 폴리머·탄탈 커패시터, 알루미늄 전해·필름 커패시터, 저항, 센서, 고다층 PCB, FC-BGA가 필요하다.

삼성전기

삼성전기 정리에서도 이 흐름이 확인된다. AI 서버용 MLCC와 FC-BGA 수요가 강하고, 두 제품 모두 수급이 타이트해지고 있으며, 고부가 제품 비중 확대와 가격 협의가 동시에 진행되고 있다고 정리되어 있다. 삼성전기는 AI 서버용 MLCC에서 100μF 이상 초고용량 제품, 125도 고온품 등 최첨단 제품 수요가 확대되고 있으며, 고객사와 장기공급계약 협의도 진행 중이라고 설명했다.

또한 AI 서버용 MLCC와 고부가 FC-BGA 수요가 기존 예상보다 빠르게 증가하면서 투자 규모가 전년 대비 2배 이상 증가할 전망이라는 점도 중요하다. 이는 공급업체들이 이번 수요를 일시적 재고 보충보다 구조적 성장으로 보고 있다는 신호다.


12. 수동소자 업체별 코멘트와 사이클 해석




Taiyo yuden


TDK


Murata


Yageo


Kyocera


Kyocera
*Components Businesses: Core Components Business + Electronic Components Business


Kyocera
*Components Businesses: Core Components Business + Electronic Components Business

Kyocera
*Components Businesses: Core Components Business + Electronic Components Business

Kyocera는 순수 수동소자 업체로 분류되지는 않지만, 최근 어닝콜을 통해 고부가 수동소자 및 첨단 반도체 부품 영역에 대한 성장 의지를 분명히 드러냈다.

회사는 FY2026 기준 semiconductor business 내 advanced semiconductor 관련 매출 비중이 약 40%였으며, 이를 FY2031에는 약 55%까지 확대하고 관련 매출을 2.8배 성장시키겠다고 밝혔다.

성장축은 SPE용 fine ceramic components, 차세대 electrostatic chuck, AI용 network package, ceramic core substrate, AI 서버 및 데이터센터향 MLCC와 polymer tantalum capacitor로 제시됐다.

이는 Kyocera의 Components 사업이 단순한 범용 부품 회복에 의존하기보다, AI 데이터센터와 advanced semiconductor 투자 확대에 직접 연결되는 고부가 부품 포트폴리오로 전환되고 있음을 의미한다. CY2028 이후에는 AI 데이터센터, advanced semiconductor, SPE 부품, MLCC·탄탈 캐패시터, Solutions 고부가 제품이 중장기 성장의 핵심 축으로 작용할 가능성이 높다.

이 흐름은 주요 수동소자 업체들에서 공통적으로 확인되는 업황 개선 신호와도 맞닿아 있다. B/B Ratio 상승, 가동률 개선, ASP 하락 둔화 또는 가격 인상 협의, 고부가 제품 믹스 개선, CAPEX 확대가 동시에 나타나고 있기 때문이다.

이러한 변화는 수동소자 업황이 재고조정 이후의 단순한 경기적 회복을 넘어, AI 서버·전장·advanced semiconductor 수요를 기반으로 한 구조적 업사이클 초입에 진입하고 있음을 뒷받침한다.



13. 가격 인상 사이클의 논리


가격 인상은 단순히 원재료 가격이 올랐기 때문에 가능한 것이 아니다. 고객이 공급 안정성을 더 중시하는 환경에서만 가격 전가가 가능하다. 지금은 AI 서버, 데이터센터 네트워크, 온프레미스 인프라, AI PC, 전장, 로봇 등 여러 수요처가 동시에 고부가 부품을 요구하고 있다.

HPE는 DRAM·NAND 가격 상승이 심각하고 높은 가격 수준이 2027년까지 이어질 가능성을 보고 있으며, 이에 대응해 장기 계약, 가격 인상, 견적 유효기간 단축, 출하 전 원가 상승 시 재가격 조정까지 시행하고 있다고 정리되어 있다. Dell도 AI 수요가 공급을 계속 초과하고 있으며 메모리가 가장 큰 제약 요인이라고 설명했다.

수동소자에서도 같은 흐름이 나타난다. TAIYO YUDEN은 가격 하락 속도 둔화를 언급했고, YAGEO는 가격 인상 효과의 초기 반영을 설명했으며, 삼성전기는 MLCC와 FC-BGA 모두에서 가격 협의를 진행 중이다. 삼성전기 자료에서는 2Q26 MLCC 수요가 전 응용처에서 성장하고, AI 서버·데이터센터 전력 인프라용 고부가·고신뢰성 제품 수요가 확대되며, MLCC 가격도 AI 서버향 수요와 원자재 상승을 반영해 전략적으로 대응할 계획이라고 정리되어 있다.

따라서 이번 사이클은 다음 순서로 전개될 가능성이 높다.



14. 부품별 수혜 경로



삼성전기 자료에서도 서버·AI용 기판은 대면적화, 고다층화, 멀티코어, 임베딩 기술 요구가 확대되고 있어 제품 고부가화와 캐파 잠식이 동시에 진행되고 있다고 정리되어 있다.


15. 최종 투자 관점


이번 수동소자 업사이클의 가장 앞단에는 토큰 사용량이 있다. MiniMax 사례처럼 모델 단가가 낮아지고, agentic AI가 업무 생산성·코딩·멀티모달 콘텐츠로 확산되면 토큰 처리량은 계속 늘어난다. 여기에 closed-loop 구조가 붙으면 AI는 한 번 답하고 끝나는 도구에서 벗어나, 계획하고 실행하고 관찰하고 재시도하는 디지털 근로자로 바뀐다.

이 변화는 연산량을 폭발적으로 늘리고, 기존 conventional data center만으로는 충분히 흡수하기 어렵다. 그래서 중앙 AI 데이터센터는 더 커지고, 동시에 추론은 온프레미스, private AI infrastructure, edge server, AI PC, 워크스테이션으로 분산된다.

이 경로는 결국 하드웨어 수요를 다층적으로 만든다. AI 서버만 늘어나는 것이 아니라, CPU 서버, 스토리지, 네트워킹, 전력 인프라, 냉각, 보안, AI PC, 로봇, 산업용 엣지 장비까지 수요가 확산된다. 이 모든 장비는 과거보다 더 높은 전력 밀도, 더 빠른 신호 속도, 더 큰 메모리 용량, 더 복잡한 전원관리 회로를 요구한다.

따라서 이번 사이클의 수혜는 범용 수동소자 전체보다 AI 서버·데이터센터 네트워크·온프레미스 서버·AI PC·엣지 AI 장비에 들어가는 고전력·고속·고신뢰성 수동소자에 집중될 가능성이 높다. TAIYO YUDEN, YAGEO, Murata, TDK, 삼성전기의 최근 코멘트는 이미 이 방향을 뒷받침하고 있다.

한 줄로 정리하면, closed-loop agentic AI는 토큰과 추론 연산량을 구조적으로 키우고, AI 데이터센터 병목은 연산을 온프레미스와 엣지로 분산시키며, 이 과정에서 고부가 MLCC·인덕터·커패시터·PCB·FC-BGA 수요와 가격 협상력이 동시에 강화되는 구조적 업사이클이 형성되고 있다.

전체 논리를 다시 정리하면, 핵심은 **“토큰 사용량 폭증 → closed-loop agentic AI → 추론 연산의 구조적 증가 → AI 데이터센터 병목 → 온프레미스·엣지 분산 → 서버·네트워크·스토리지·AI PC·워크스테이션 수요 확대 → 고부가 수동소자 업사이클”**이다.

=끝