오늘 시장은 전자·반도체 관련 레버리지 ETF로 수급이 쏠리는 가운데, 중소형주와 일부 ETF에는 매도 압력이 커지며 하락 종목 수가 늘어나는 모습이다.
그러나 단기 수급과 같은 외적 변수는 잠시 뒤로 두고, 다시 본질적인 변화에 집중해보고자 한다.
이번 리서치 기록의 핵심은 Agentic AI가 기업의 업무 방식, 컴퓨팅 인프라, 그리고 하드웨어 밸류체인에 어떤 구조적 변화를 가져올 것인가에 있다.
생각정리 182 (* MoltBot, Agent AI, Agent PC)
Agentic AI 시대, AI PC는 왜 다시 중요해지는가
GPU 메모리 위에 CPU 메모리와 전력관리 부품 수요가 얹히는 새로운 하드웨어 사이클
생성형 AI의 첫 번째 국면은 “누가 더 좋은 모델을 쓰는가”의 경쟁이었다. 기업들은 GPT, Claude, Gemini 같은 대형 언어모델을 업무에 붙이기 시작했고, 직원들은 질문을 입력하고 답변을 받는 방식으로 AI를 사용했다. 이 단계에서는 AI 사용량이 비교적 예측 가능했다. 사람이 질문해야 토큰이 발생했고, 비용도 사용량에 비례해 관리할 수 있었다.
하지만 Agentic AI 시대에는 비용 구조가 달라진다. Agentic AI는 사용자가 한 번 질문하면 그 뒤에서 AI가 스스로 계획을 세우고, 파일을 찾고, 데이터베이스를 조회하고, 코드를 실행하고, 외부 도구를 호출하고, 결과를 검증한 뒤 다시 작업을 반복한다. 사용자가 직접 입력하는 질문 수보다, agent가 백그라운드에서 반복 호출하는 토큰량이 비용을 결정하는 구조로 바뀐다.
이 지점에서 기업의 고민은 분명해진다. 모든 요청을 항상 최고급 frontier model에 보내면 품질은 높아지지만, cloud token OPEX는 빠르게 증가한다. 특히 여러 agent가 동시에 돌아가는 업무환경에서는 토큰 사용량이 선형적으로 늘지 않는다. Agentic AI가 도입될수록 기업은 단순히 “AI를 더 많이 쓰는 방법”보다 “AI를 감당 가능한 비용으로 계속 쓰는 방법”을 고민하게 된다.
| 토큰비용이 인건비보다 비쌀 때, "AI 내러티브"는 문제에 직면합니다—월스트리트CN |
| https://t.me/cahier_de_market 토큰 사용량이 2023년에는 commit 수가 3억 건이었고, 2024년에는 4억 건, 2025년에는 5억 건 그런데 2026년 들어 첫 몇 달 만에 이 수치가 거의 3배로 급증 |
따라서 기업은 점차 세 가지 방식으로 AI 비용을 나누게 될 가능성이 높다. 반복적이고 민감도가 낮은 작업은 로컬 AI PC에서 처리하고, 사내 데이터와 연결되는 업무는 enterprise AI server에서 수행하며, 정말 어려운 판단이나 범용 reasoning이 필요한 작업만 cloud frontier model에 넘기는 구조다.
이 변화의 핵심은 Hybrid Edge AI PC다. AI PC는 단순한 새 노트북이 아니라, cloud token 비용의 예측 가능성을 높이고 최고급 대형 LLM 호출량을 줄이는 enterprise cost-control hardware가 된다. 앞으로 NVIDIA N1X, DGX Spark, Dell Deskside Agentic AI, Vera Rubin 기반 AI Factory를 하나의 흐름으로 봐야 하는 이유가 여기에 있다.
1. COMPUTEX 2026이 보여주는 AI PC 시대의 개막
이번 COMPUTEX 2026은 AI PC 시대의 개막을 상징적으로 보여주는 이벤트가 될 가능성이 높다. PC 행사는 과거처럼 노트북, 메인보드, 그래픽카드 중심의 전시에 머물지 않고, AI가 어디에서 실행되고 어떻게 배치되는지를 보여주는 무대로 바뀌고 있다.
Intel, AMD, Qualcomm, Arm은 모두 AI PC를 다음 PC 사이클의 핵심으로 보고 있다. CPU 성능 경쟁에 NPU, GPU, on-device AI 성능이 더해지면서 PC의 정의 자체가 달라지고 있다. 앞으로의 PC는 단순히 문서 작성과 웹브라우징을 처리하는 기기가 아니라, 사용자의 업무 문맥을 이해하고 반복 작업을 대신 수행하는 local AI endpoint에 가까워진다.
그중에서도 이번 사이클에서 가장 주목되는 변화는 NVIDIA의 PC 시장 진입 가능성이다. NVIDIA, Microsoft, Arm은 COMPUTEX를 앞두고 “a new era of PC”라는 메시지를 공개했고, 이는 NVIDIA의 ARM 기반 N1·N1X 노트북 프로세서 공개 가능성과 연결돼 해석되고 있다.
| https://wallstreetcn.com/articles/3773517#from=ios |
| https://wallstreetcn.com/articles/3773517#from=ios |
| https://wallstreetcn.com/articles/3773517#from=ios |
NVIDIA가 Windows on Arm 생태계에 본격 진입한다면, AI PC 시장은 Intel·AMD·Qualcomm 중심의 CPU 경쟁을 넘어 NVIDIA CUDA 생태계와 로컬 AI 추론 능력이 결합되는 새로운 국면으로 넘어갈 수 있다. 기존 PC가 CPU 중심의 업무 장치였다면, 다음 AI PC는 CPU, GPU, NPU, local memory가 결합된 개인용 agent 실행 장치에 가까워진다.
2. NVIDIA N1X가 중요한 이유: AI PC가 로컬 추론 장치로 바뀐다
현재까지 알려진 N1 및 N1X 사양은 공식 발표 전 유출 정보이므로 확정 사양으로 보기는 어렵다. 다만 보도 기준으로 보면 방향성은 분명하다. N1X는 20개 CPU 코어와 48개 SM, 6,144개 CUDA 코어를 갖춘 GPU 구성이 언급됐고, 이는 DGX Spark에 사용된 GB10 Superchip과 유사한 구조로 해석된다.
여기서 중요한 부분은 CPU 코어 수나 CUDA 코어 수 자체보다 로컬 AI 실행 환경이 일반 Windows PC로 내려올 수 있다는 점이다. DGX Spark는 개발자용 Ubuntu 기반 AI 장비에 가까웠다. 반면 N1X가 Windows on Arm 노트북으로 등장한다면, NVIDIA의 AI 컴퓨팅 구조가 일반 업무용 PC 안으로 들어오게 된다.
AI PC의 역할도 달라진다. 기존 PC는 사람이 앱을 실행하는 도구였다. AI PC는 사람이 요청하기 전에 agent가 문서, 이메일, 코드, 회의록, 브라우저, 사내 시스템을 오가며 작업을 수행하는 장치로 바뀐다. 사용자는 “이 자료 정리해줘”, “지난 회의 내용 기반으로 보고서 초안 만들어줘”, “이 코드 오류 찾아줘”라고 말하지만, 내부에서는 여러 개의 AI 작업이 동시에 돌아간다.
이 모든 작업을 cloud LLM으로 보내면 비용과 보안 문제가 커진다. 그래서 반복적이고 개인화된 업무는 로컬 AI PC에서 처리하고, 고난도 판단은 cloud 또는 사내 AI server에 넘기는 구조가 필요해진다. N1X가 의미 있는 이유는 바로 이 로컬 agent 실행 계층을 강화할 수 있기 때문이다.
3. DGX Spark가 보여준 한계와 N1X 이후의 보완 방향
NVIDIA DGX Spark는 개인용 AI 슈퍼컴퓨터라는 개념을 대중화한 장비다. DGX Spark는 대용량 unified memory와 높은 AI 연산 성능을 바탕으로 개인·팀 단위에서 대형 모델을 실험할 수 있는 환경을 제시했다.
하지만 초기 DGX Spark에 대한 기대는 실제 사용환경에서 일부 조정될 필요가 있었다. 대형 모델을 로컬에서 돌릴 수 있다는 점은 강력했지만, 실제 token throughput은 모델 크기, memory bandwidth, KV cache, 추론 엔진 최적화에 크게 좌우됐다. 특히 GB10 계열의 LPDDR5X 통합 메모리는 대용량 모델을 한 장비 안에 올리는 데 유리하지만, HBM 기반 데이터센터 GPU처럼 매우 높은 대역폭을 제공하는 구조와는 다르다.
이 한계는 DGX Spark의 의미를 약화시키기보다, 역할을 더 명확하게 만든다. DGX Spark는 모든 대형 모델을 단독으로 완벽하게 처리하는 장비라기보다, 개인과 팀 단위에서 agent를 실험하고, 로컬 RAG를 만들고, 사내 데이터 기반 prototype을 검증하는 장비에 가깝다.
N1X는 이 흐름을 더 넓은 PC 시장으로 확장할 수 있다. DGX Spark가 개발자와 연구자에게 AI 실험 환경을 제공했다면, N1X 기반 AI PC는 일반 업무자에게 local AI agent 실행 환경을 제공한다. 즉 과거 DGX Spark의 한계는 “개인 장비 하나로 모든 AI를 처리한다”는 기대에서 나왔고, N1X 이후의 보완 방향은 “개인 장비와 기업 서버가 역할을 나눠 처리한다”는 구조에서 나온다.
4. 30B 미만은 AI PC, 30B 이상은 기업용 AI 서버로 가는 하이브리드 구조
Agentic AI가 본격 도입되면 기업 업무환경은 세 계층으로 나뉠 가능성이 높다.
첫 번째 계층은 AI PC다. 여기서는 30B 미만의 sLLM이나 업무 특화 모델이 주로 쓰일 수 있다. 개인 문서 검색, 회의 요약, 이메일 초안, 코드 보조, 사내 규정 질의, 로컬 파일 정리 같은 작업이 여기에 해당한다. 이 작업들은 반복 빈도가 높고, 민감한 개인·업무 데이터가 포함될 가능성이 크다. 따라서 cloud frontier model에 매번 보내기보다, 로컬에서 처리하는 편이 비용과 보안 측면에서 유리하다.
두 번째 계층은 개인용 AI 슈퍼컴퓨터 또는 deskside AI 장비다. DGX Spark, Dell Pro Max GB10 같은 장비가 여기에 해당한다. 이 계층은 개인 PC보다 무겁고, 데이터센터보다는 가까운 작업을 담당한다. 예를 들어 팀 단위 RAG, 30B~200B급 모델 테스트, 코드베이스 분석, 내부 데이터 기반 agent 개발, fine-tuning prototype이 이 계층에서 수행될 수 있다.
세 번째 계층은 enterprise AI server와 AI data center다. 30B 이상 대형 모델, 장기 context, 다중 agent orchestration, 대규모 RAG, 기업 데이터베이스 질의, 고신뢰 의사결정 지원은 이 계층으로 올라간다. NVIDIA Vera Rubin NVL72와 같은 rack-scale AI system은 이 흐름을 상징한다. GPU뿐 아니라 Vera CPU, 대용량 CPU memory, 고속 네트워크, DPU를 함께 묶어 agentic AI와 대규모 reasoning workload를 처리하는 구조다.
결국 앞으로의 기업 AI 환경은 하나의 모델, 하나의 서버, 하나의 cloud로 끝나지 않는다. AI PC가 앞단에서 반복 업무를 처리하고, deskside AI가 팀 단위 실험과 중간 규모 모델을 담당하며, enterprise AI server와 AI data center가 대형 모델과 장기 context를 처리하는 계층형 구조로 진화한다.
5. AI 메모리는 하나가 아니다: HBM, GDDR, CPU memory가 함께 커진다
여기서 중요한 포인트가 있다. 지금까지 AI 메모리 이야기는 주로 HBM 중심으로 진행됐다. 데이터센터 AI accelerator는 GPU 옆에 HBM을 붙여 대형 모델의 파라미터와 KV cache를 빠르게 처리한다. HBM은 AI 서버에서 여전히 가장 중요한 memory 병목이다.
하지만 모든 GPU memory가 HBM은 아니다. 일반 PC, 워크스테이션, 게이밍 노트북, creator PC에 들어가는 discrete GPU는 대개 GPU 옆에 GDDR 계열 VRAM을 둔다. 즉 AI PC와 workstation 환경에서는 CPU memory와 GPU memory가 따로 존재할 수 있다. CPU 옆에는 DDR5 또는 LPDDR5X 같은 system memory가 붙고, discrete GPU 옆에는 GDDR6·GDDR7 같은 VRAM이 붙는다.
반면 데이터센터 AI accelerator에서는 GPU 옆에 HBM이 붙고, 서버 CPU 옆에는 DDR5 RDIMM, MRDIMM, CXL memory 같은 CPU-attached memory가 붙는다. DGX Spark나 N1X처럼 unified memory 구조를 쓰는 경우도 있다. 이 경우 CPU와 GPU가 하나의 LPDDR5X memory pool을 공유한다.
따라서 앞으로의 AI memory 수요를 볼 때는 세 가지를 구분해야 한다. 첫째, 데이터센터 GPU 옆 HBM이다. 둘째, PC와 워크스테이션의 discrete GPU 옆 GDDR이다. 셋째, CPU 주변의 DDR5, LPDDR, RDIMM, MRDIMM, CXL memory다.
핵심은 CPU memory 수요가 GPU memory 수요를 대체하는 구조가 아니라, GPU memory 수요 위에 추가로 얹히는 구조라는 점이며 Agentic ai 시대에는 CPU memory 중요성이 더욱 부각될 것이라는 것이다.
즉, AI PC와 workstation에서는 GDDR 기반 GPU VRAM 수요가 유지되면서, 로컬 agent 실행을 위한 system DRAM 또는 LPDDR 용량도 함께 커진다.
6. Agentic AI가 CPU를 다시 중요하게 만드는 이유
기존 LLM 사용 방식에서는 GPU가 대부분의 주목을 받았다. 모델 파라미터를 읽고, 행렬 연산을 수행하고, 토큰을 생성하는 과정에서 GPU와 HBM이 핵심 병목이었기 때문이다. 이 구조에서는 “더 많은 GPU, 더 빠른 HBM”이 성능 개선의 중심이었다.
Agentic AI에서는 GPU가 여전히 중요하지만, CPU의 역할이 커진다. agent는 단순히 답변만 생성하지 않는다. 작업을 쪼개고, 여러 도구를 호출하고, 파일을 읽고, 코드를 실행하고, 결과를 비교하고, 실패하면 다시 시도한다. 이 모든 흐름을 조율하는 계층이 CPU다.
AI 서버에서 CPU는 더 이상 GPU를 깨우는 host processor에 머물지 않는다. agent workflow를 실제로 움직이는 orchestration engine에 가까워진다. CPU는 tool call, file I/O, network I/O, security policy, scheduling, sandbox execution, agent state management를 처리한다. Agentic AI 도입이 확대될수록 GPU 병목에 CPU 병목이 추가되는 구조가 된다.
대형 모델 추론에는 여전히 GPU memory가 필요하다. 다만 Agentic AI가 업무 전반에 들어오면, CPU와 CPU-attached memory가 처리해야 하는 context, tool output, file I/O, network I/O, 보안 정책, scheduling workload가 함께 늘어난다.
7. CPU-attached memory는 Agentic AI의 작업 공간이 된다
CPU가 중요해지면 자연스럽게 CPU-attached memory도 중요해진다. 여기서 CPU-attached memory는 CPU 옆에 붙어 CPU가 직접 접근하는 DRAM, LPDDR, DDR5 RDIMM, MRDIMM, CXL memory 등을 의미한다.
Agentic AI는 한 번의 답변으로 끝나지 않는다. 여러 단계의 작업 기록, 검색된 문서, tool output, 코드 실행 결과, 사용자별 context, 장기 memory를 계속 참조한다. GPU HBM은 active inference와 hot KV cache를 처리하지만, 모든 데이터를 HBM 안에 계속 둘 수는 없다. HBM은 빠르지만 비싸고, 용량도 제한적이다.
여기서 메모리 계층이 나뉜다. 가장 뜨거운 데이터는 GPU memory에 머문다. 데이터센터 GPU에서는 HBM, PC·워크스테이션 discrete GPU에서는 GDDR VRAM이 이 역할을 맡는다. 반면 agent state, warm context, tool output, system process, 문서 검색 결과는 CPU-attached memory에 머문다. 더 긴 기록과 대규모 문서는 CXL memory, NVMe, shared storage, context memory tier로 내려간다.
이 구조를 이해하면 AI memory 수요의 방향이 명확해진다. GPU memory 수요는 계속 증가한다. 동시에 Agentic AI가 확산될수록 CPU memory 수요도 추가로 증가한다. 기존 생성형 AI 사이클이 HBM 중심이었다면, 다음 Agentic AI 사이클은 HBM과 GDDR 위에 CPU-attached memory 수요가 겹쳐지는 구조가 될 가능성이 높다.
AI PC에서도 같은 논리가 적용된다. discrete GPU가 있는 AI PC는 GPU 옆 GDDR VRAM으로 로컬 AI와 그래픽 workload를 처리하고, CPU 옆 DDR5·LPDDR memory로 agent orchestration과 앱·파일·브라우저·보안 프로세스를 처리한다. 통합 SoC형 AI PC는 하나의 LPDDR memory pool을 CPU와 GPU가 공유한다. 두 구조 모두 공통적으로 메모리 용량과 대역폭의 중요도가 올라간다.
기업용 AI 서버에서는 이 현상이 더 강하게 나타난다. GPU HBM은 대형 모델 inference를 담당하고, CPU DDR5·MRDIMM·CXL memory는 agent state와 long-context workflow를 받쳐준다. Vera Rubin NVL72 같은 rack-scale 구조가 GPU뿐 아니라 Vera CPU와 CPU memory 계층을 함께 강조하는 이유도 여기에 있다.
8. 메모리 컨트롤러와 RCD: 보이지 않지만 병목을 줄이는 부품
CPU-attached memory가 중요해지면, 그 사이를 연결하는 부품도 중요해진다. 대표적인 것이 메모리 컨트롤러와 RCD다.
메모리 컨트롤러는 CPU가 DRAM과 데이터를 주고받도록 관리하는 관문이다. CPU 코어가 많아지고, agentic workload가 병렬로 늘어나면, 메모리 컨트롤러는 더 많은 요청을 더 빠르게 처리해야 한다. 단순히 데이터를 많이 읽는 문제가 아니다. 여러 agent의 요청이 동시에 들어오고, tool call 결과와 context가 섞이며, latency와 bandwidth 요구가 계속 바뀐다.
서버 DDR5 RDIMM에서는 RCD, 즉 Registering Clock Driver가 핵심 역할을 한다. RCD는 host memory controller와 DRAM 칩 사이에서 command, address, clock 신호를 분배하고 안정화한다. CPU가 더 많은 DRAM 칩과 더 큰 용량의 모듈을 안정적으로 구동하려면, 신호 무결성과 타이밍 관리가 중요하다. RCD는 이 역할을 수행하면서 서버 메모리의 고용량화와 고속화를 가능하게 한다.
Agentic AI 서버에서는 메모리 용량과 속도가 동시에 필요하다. 더 많은 사용자의 context를 담아야 하고, 더 많은 agent state를 유지해야 하며, 더 많은 tool output을 처리해야 한다. 이 과정에서 RDIMM의 고속화와 고용량화가 중요해지고, 이를 안정적으로 구동하는 RCD의 가치도 높아진다.
더 나아가 MRDIMM에서는 MRCD와 MDB 같은 인터페이스 칩이 중요해진다. MRDIMM은 서버 CPU가 더 넓은 메모리 대역폭을 확보하기 위한 방향 중 하나다. AI·HPC·Agentic AI workload가 CPU memory bandwidth를 더 요구할수록 MRDIMM과 관련 인터페이스 칩의 중요성도 커질 수 있다.
9. PMIC, MLCC, ABF substrate로 이어지는 CPU 주변 부품 사이클
CPU와 CPU-attached memory의 중요성이 올라가면 전력 관리 부품과 기판도 함께 중요해진다. Agentic AI workload는 부하가 일정하지 않다. 모델 추론, 파일 검색, 코드 실행, tool call, 네트워크 통신, 보안 검증이 짧은 주기로 반복된다. 이런 환경에서는 CPU, 메모리, SSD, NIC, DPU의 전력 부하가 빠르게 변한다.
이때 PMIC의 역할이 커진다. PMIC는 각 부품에 필요한 전력을 효율적으로 공급하고 전압을 안정화하는 부품이다. 중요한 변화는 DDR4에서 DDR5로 넘어오면서 전력 관리 구조 자체가 달라졌다는 점이다. 과거 DDR4에서는 메모리 모듈에 필요한 전력 관리 기능이 주로 메인보드 또는 CPU 주변 전원부에 위치했다. 반면 DDR5부터는 PMIC가 DIMM 모듈 위에 직접 탑재된다. 즉 전력 관리 기능이 보드 레벨에서 모듈 레벨로 이동한 것이다.
DDR4에서는 메모리 전압을 조정하는 VR 기능이 주로 메인보드 전원부에 있었다. 메인보드가 12V를 1.2V로 낮춘 뒤 DIMM에 공급하는 구조였다. 반면 DDR5부터는 DIMM이 12V를 직접 받고, 모듈 위에 탑재된 PMIC가 이를 1.1V 등 필요한 전압으로 변환한다. 즉 전력 관리 기능이 보드 레벨에서 모듈 레벨로 이동한 것이다.
이 변화는 부품 수요의 성격을 바꾼다. DDR4에서는 메인보드 전원부가 여러 메모리 모듈에 전력을 공급하는 구조였다면, DDR5에서는 모듈 자체가 전력 변환과 전압 안정화 기능을 더 많이 담당한다. 그 결과 메모리 모듈 하나당 PMIC, MLCC, 인덕터 등 전력관리 부품의 탑재 가치가 높아진다. 메모리 용량이 커지고 채널 수가 늘어날수록, 단순 DRAM 칩 수요뿐 아니라 모듈 주변 전력관리 부품의 BoM도 함께 증가할 수 있다.
수혜 강도도 이 지점에서 달라진다. DDR4에서 DDR5로 바뀌는 변화는 단순히 DRAM 세대가 바뀌는 문제가 아니다. 전력 관리 기능이 모듈 내부로 이동하면서, PMIC는 선택적 주변 부품이 아니라 DDR5 모듈의 핵심 부품으로 자리 잡는다. 서버용 DDR5 RDIMM과 고용량 DIMM에서는 안정성, 전력 효율, 발열 관리가 더 중요하기 때문에 PMIC의 사양도 높아질 수 있다. 이는 전력관리 부품의 수량 증가뿐 아니라 단가 상승 여지까지 만들어내는 변화다.
MLCC도 같은 맥락에서 중요하다. MLCC는 전자회로에서 전압을 안정화하고 노이즈를 줄이는 대표 수동소자다. DDR5 DIMM에 PMIC가 올라오면, 그 주변에는 전압 변동을 줄이고 전원 품질을 안정화하기 위한 MLCC와 인덕터가 함께 필요해진다. 특히 AI 서버처럼 고속 메모리와 높은 전력 밀도를 요구하는 시스템에서는 작은 전압 흔들림도 신호 품질과 안정성에 영향을 줄 수 있다. 따라서 고성능 MLCC, 파워 인덕터, 전원 안정화 부품의 중요도는 함께 높아진다.
ABF substrate는 더 하부의 핵심 인프라다. ABF는 고성능 반도체 패키지 기판에 쓰이는 절연 재료다. CPU, GPU, AI accelerator, networking ASIC처럼 입출력 밀도가 높고 전력 소모가 큰 칩은 고성능 패키지 기판이 필요하다. Agentic AI 시스템은 단일 칩 성능만으로 발전하지 않는다. CPU, GPU, memory controller, DPU, NIC, storage controller, high-speed interconnect가 하나의 시스템으로 묶인다. 이 칩들을 고밀도로 연결하고, 신호 무결성과 전력 전달 능력을 유지하려면 ABF substrate의 중요성은 더 커질 수밖에 없다.
| Morgan Stanley |
결국 CPU 주변 부품 사이클은 단순히 “전력 부품이 조금 더 필요하다”는 수준이 아니다. Agentic AI가 CPU와 CPU-attached memory 사용량을 늘리고, DDR5 전환이 전력 관리 기능을 메모리 모듈 안으로 이동시키며, 서버 메모리 고용량화가 RCD·PMIC·MLCC·인덕터·ABF substrate의 중요도를 동시에 높이는 구조다. 이는 GPU와 HBM 중심의 AI 밸류체인 위에, CPU memory와 전력관리 수동소자 사이클이 추가로 형성될 수 있음을 의미한다.
10. 결론: AI PC는 PC 교체 사이클을 넘어 token OPEX 절감 장치가 된다
Agentic AI 시대의 핵심 변화는 모델 성능 향상만으로 설명하기 어렵다. 비용 구조, 업무 방식, 컴퓨팅 배치, 메모리 계층, 전력 관리 부품 수요가 동시에 바뀐다.
기업은 앞으로 모든 작업을 cloud frontier model에 보내지 않을 가능성이 높다. 반복적이고 개인정보·사내정보가 많은 업무는 AI PC에서 처리하고, 팀 단위 실험과 중간 규모 모델은 deskside AI 장비에서 수행하며, 대형 모델과 장기 context는 enterprise AI server와 AI data center로 올리는 방식이 더 현실적이다.
이 구조에서 AI PC의 의미는 단순한 PC 교체 수요를 넘어선다. AI PC는 cloud token OPEX를 줄이고, 보안 민감 데이터를 로컬에서 처리하며, agentic workflow의 앞단을 담당하는 enterprise cost-control hardware가 된다.
동시에 하드웨어 밸류체인도 넓어진다. 지난 AI 인프라 사이클의 중심이 GPU와 HBM이었다면, Agentic AI 사이클에서는 HBM, GDDR, CPU-attached memory가 함께 중요해진다. 데이터센터 GPU 옆 HBM 수요는 계속 커지고, AI PC·워크스테이션의 discrete GPU 옆 GDDR 수요도 유지된다. 여기에 CPU가 agent orchestration을 담당하면서 DDR5, LPDDR, MRDIMM, CXL memory 같은 CPU memory 수요가 추가로 얹힌다.
또 하나의 중요한 변화는 전력 관리 구조다. DDR5 전환 이후 PMIC가 메모리 모듈 위로 올라오면서, 메모리 모듈은 단순 DRAM 집합체가 아니라 전력 변환과 안정화 기능을 포함한 고부가 부품 플랫폼으로 바뀌고 있다. 이 변화는 PMIC, MLCC, 인덕터, RCD, MRCD, ABF substrate까지 이어지는 CPU 주변 부품 수요를 자극할 수 있다.
NVIDIA N1X, DGX Spark, Dell Deskside Agentic AI, Vera Rubin 기반 AI Factory는 서로 다른 제품군처럼 보이지만, 실제로는 하나의 흐름 안에 있다. AI를 cloud에서만 쓰던 시대에서, AI가 PC·서버·데이터센터 전반에 분산 배치되는 시대로 넘어가는 변화다.
그래서 이번 AI PC 사이클은 과거의 노트북 교체 사이클과 성격이 다르다. 앞으로의 AI PC는 더 빠른 PC를 넘어, 기업이 Agentic AI를 감당 가능한 비용으로 운영하기 위한 가장 앞단의 인프라가 될 가능성이 높다. 그리고 그 변화는 GPU와 HBM만이 아니라, GDDR, CPU memory, RCD, PMIC, MLCC, 인덕터, ABF substrate까지 이어지는 새로운 부품 사이클로 확장될 수 있다.
| 골드만 삭스, "AI 병목 현상"에 합류: MLCC가 새로운 저장소로 자리 잡았으며 AI 서버에서 "세 번째로 큰 비용 항목"이 되었습니다 - 월스트리트CN |
| 골드만 삭스, "AI 병목 현상"에 합류: MLCC가 새로운 저장소로 자리 잡았으며 AI 서버에서 "세 번째로 큰 비용 항목"이 되었습니다 - 월스트리트CN |
=끝.
댓글 없음:
댓글 쓰기