2026년 6월 15일 월요일

생각정리 282 (* HDD)

HDD 산업은 AI 데이터 저장 수요 확대와 제한적인 공급 증설이 맞물리며 다시 업사이클의 변곡점에 진입하고 있는듯 싶다. 

개인적으로 SSD의 성능 우위와 고성장성을 근거로 HDD 산업을 구조적으로 열위에 있는 레거시 산업으로 보는 시각이 강했었다.

생각정리 189 ( *HDDeSSD)

그러나 AI 도입 확대에 따른 data retention 강화, Video AI와 자율주행 등 데이터 생성형 워크로드 확산, 그리고 과점화된 HDD 공급 구조를 함께 보면 HDD의 역할은 다시 평가될 필요가 있다고 생각된다. 

HDD는 SSD와 단순히 대체 관계에 놓인 저장장치라기보다, 대규모 cold data와 warm data를 장기간 보관하는 핵심 인프라 자산에 가까워진다.

특히 AI가 더 많은 데이터를 더 오래 저장하고, 동시에 새로운 데이터를 지속적으로 생성하는 국면에서는 HDD의 경제성과 저장 밀도, 공급 제약에 따른 가격 결정력이 동시에 부각될 수 있다.

이에 따라 이번 리서치 기록은 HDD 업황이 다시 구조적 호황으로 전환될 가능성을 점검하고, Seagate를 중심으로 수요 증가, 공급 부족, 가격 인상, 이익 레버리지의 연결 구조를 정리하기 위한 목적이다.

#요약


첫째, AI 도입 기업의 data retention 강화 흐름이다.


Seagate 조사에 따르면 AI 도입 기업의 90%는 더 긴 데이터 보존 기간이 AI 결과의 품질을 높이는 요인이라고 봤다. 또한 AI 사용 기업의 88%는 trustworthy AI 구현을 위해 더 많은 데이터를 더 오래 저장해야 한다고 답했다. 클라우드 스토리지를 주로 사용하는 응답자의 61%는 향후 3년간 클라우드 저장용량이 100% 이상 증가할 것으로 예상했다. 이는 AI 확산이 단순 연산 수요를 넘어 장기 데이터 보관 수요까지 구조적으로 확대시키고 있음을 보여주는 흐름이다. 


둘째, AI가 데이터를 소비하는 단계를 넘어 스스로 데이터를 생성하는 단계로 진입하고 있다는 점이다.


Seagate CFO는 Morgan Stanley 컨퍼런스에서 AI, 특히 Video AI가 저장 수요를 예상보다 빠르게 끌어올리고 있다고 설명했다. 자율주행과 같은 애플리케이션 역시 대규모 데이터를 지속적으로 생성하며 저장 수요 증가에 기여하고 있다. 이는 AI 워크로드가 기존 데이터를 학습·분석하는 데 그치지 않고, 새로운 데이터를 대량으로 만들어내는 방향으로 확장되고 있음을 의미한다. 


셋째, HDD 공급이 수요만큼 빠르게 늘기 어려운 과점 산업 구조이다.


Morgan Stanley는 HDD 수요가 연 40~50% 증가하는 반면 공급 증가율은 30~35% 수준에 그칠 것으로 분석했다. 이에 따라 공급 부족은 단기에 해소되기보다 장기간 이어질 가능성이 높다. 특히 nearline HDD 가격은 현재 TB당 14달러대에서 2027~2028년 25~30달러 수준까지 상승할 수 있다고 제시했다. 이는 AI 데이터 저장 수요 확대와 제한적인 공급 증가가 결합되면서 HDD 업체의 가격 결정력이 강화되는 국면임을 시사한다. 


2026.06.16 Seagate Technology


2026.05.18 Seagate Technology


AI가 데이터를 먹고 다시 데이터를 만드는 시대: HDD 슈퍼사이클의 구조적 배경


부제: Frontier LLM, Agentic AI, Physical AI가 만드는 저장 수요 폭증과 Seagate·Western Digital의 재평가


AI 기술이 다음 단계로 넘어가면서 시장이 새롭게 주목해야 할 병목은 저장장치다.

AI는 단순히 연산만 많이 쓰는 기술이 아니다. AI는 데이터를 학습하고, 데이터를 생성하며, 생성한 데이터를 다시 저장하고, 그 데이터를 다시 다음 학습과 추론에 활용하는 기술이다. 이 구조가 본격화될수록 AI 인프라의 핵심 질문은 “얼마나 빨리 계산할 수 있는가”에서 “얼마나 많은 데이터를 오래 보관할 수 있는가”로 확장된다.

이 변화의 중심에 HDD, 특히 클라우드 데이터센터에 들어가는 nearline HDD가 있다. Seagate와 Western Digital이 최근 AI 인프라 투자에서 재평가받는 이유도 여기에 있다.


1. AI 수요는 이제 compute에서 storage로 확산되고 있다


AI 투자 사이클의 1차 수혜는 GPU와 HBM이었다. 이는 AI가 더 많은 연산을 필요로 했기 때문이다. 대형 언어모델을 학습시키고, 수많은 사용자의 추론 요청을 처리하려면 더 많은 GPU와 고대역폭 메모리가 필요했다.

그러나 AI가 기업 업무와 클라우드 서비스 안으로 깊게 들어오면서 새로운 수요가 나타나고 있다. 바로 데이터 보존 수요다.

기업은 AI를 더 잘 활용하기 위해 데이터를 쉽게 삭제하지 않기 시작했다. 과거에는 오래된 데이터가 비용이었다. 지금은 오래된 데이터도 모델 학습, RAG 검색, 품질 검증, 보안 감사, 규제 대응에 활용될 수 있는 자산이 됐다.

Seagate가 강조하는 핵심도 여기에 있다. AI를 도입한 기업들은 더 많은 데이터를 더 오래 보관할수록 AI 결과의 품질이 좋아진다고 본다. 또한 trustworthy AI를 구현하려면 어떤 데이터로 판단했는지, 어떤 결과가 나왔는지, 어떤 과정을 거쳤는지를 추적할 수 있어야 한다. 결국 AI 확산은 단순한 연산 수요 증가에 그치지 않고, data retention, 즉 데이터 장기 보존 수요를 구조적으로 끌어올린다.

이 변화는 HDD 업체에 직접적인 수요 상방 압력으로 작용한다. 장기간 보관해야 하는 대규모 데이터는 모두 SSD에 저장하기 어렵다. 비용, 전력, 확장성 측면에서 클라우드 데이터센터는 여전히 nearline HDD를 핵심 저장 계층으로 사용한다. 따라서 AI가 기업 데이터 보존 기간을 늘릴수록 HDD 수요도 함께 증가한다.


2. AI는 데이터를 소비하는 단계를 넘어 데이터를 직접 생산한다


AI 확산 초기에는 “기업이 이미 보유한 데이터를 AI에 활용한다”는 관점이 중요했다. 그러나 지금은 한 단계 더 나아가고 있다. AI 자체가 새로운 데이터를 만들어내기 시작했다.

LLM은 답변만 만드는 것이 아니다. 프롬프트, 응답, 대화 이력, 검색 결과, 코드, 요약문, 평가 결과를 계속 남긴다. 여기에 agentic AI가 결합되면 데이터 생성량은 더 커진다.

Agentic AI는 목표를 세우고, 작업을 나누고, 검색하고, 도구를 호출하고, 코드를 실행하고, 실패하면 수정하고, 다시 결과를 평가한다. 하나의 최종 결과물 뒤에는 수많은 중간 산출물이 존재한다.

예를 들어 코딩 agent는 코드 초안, 수정 이력, 오류 로그, 테스트 결과를 만든다. 연구 agent는 실험 계획, 학습 로그, 평가 결과, 모델 checkpoint, 실패한 실험 기록을 남긴다. 업무 자동화 agent는 검색 결과, 문서 초안, API 호출 기록, 실행 내역을 남긴다.

이 데이터들은 단순한 부산물이 아니다. 다음 작업의 context가 되고, 모델 평가 데이터가 되며, RAG 검색 데이터가 되고, compliance와 감사의 근거가 된다. 결국 AI는 데이터를 먹고, 데이터를 만들고, 그 데이터를 다시 다음 AI 작업에 투입하는 폐쇄루프를 형성한다.

이 지점이 HDD 수요의 핵심이다. AI가 더 많이 쓰일수록 생성 데이터가 늘어나고, 생성 데이터가 늘어날수록 더 오래 보관해야 할 이유가 커진다. 데이터 보존이 늘어나면 다시 AI의 성능 개선과 서비스 고도화에 활용된다. 이 반복 구조가 AI 시대의 저장장치 수요를 구조적으로 끌어올린다.


3. Frontier LLM은 인간 개입을 줄이며 AI R&D 자동화 단계로 간다


초기 LLM은 사용자가 질문하면 답변을 만들어주는 도구에 가까웠다. 그러나 frontier LLM은 이미 그 역할을 넘어가고 있다. 최신 AI는 코드를 작성하고, 데이터를 정리하고, 실험을 설계하고, 결과를 평가하며, 다시 개선안을 제시한다.

여기서 투자자가 주목해야 할 관점은 AI가 스스로 작업하고, 결과를 평가하고, 다시 개선하는 폐쇄루프다.

이 흐름은 recursive self-improvement, 즉 재귀적 자기개선으로 이어질 수 있다. AI가 더 나은 코드를 만들고, 더 나은 실험을 설계하고, 더 나은 모델을 만드는 데 관여하기 시작하면, AI 개발 속도는 인간 연구자의 작업 시간에만 묶이지 않는다. 인간은 모든 과정을 직접 수행하기보다 목표를 설정하고, 결과를 검증하고, 방향을 조정하는 역할로 이동한다.

이 변화는 AI 산업의 경쟁 구도를 바꾼다. 앞선 frontier LLM 기업은 더 강한 모델을 보유하는 데 그치지 않고, 그 모델을 이용해 내부 연구개발 생산성을 다시 끌어올릴 수 있다. 강한 AI가 더 강한 AI 개발을 돕고, 그 결과 다시 더 강한 AI가 만들어지는 구조가 생긴다.

이 과정에서는 막대한 저장 수요가 발생한다. AI R&D 자동화는 수많은 실험, 평가, 코드 변경, 데이터셋 생성, 모델 checkpoint 저장을 동반한다. 실패한 실험도 버려지기 어렵다. 왜 실패했는지, 어떤 조건에서 성능이 개선됐는지, 어떤 데이터가 효과적이었는지가 다음 연구의 자산이 되기 때문이다.

따라서 frontier LLM의 발전은 단순히 더 많은 GPU를 요구하는 데서 끝나지 않는다. 더 많은 연구 데이터, 더 많은 실험 로그, 더 많은 모델 산출물, 더 긴 데이터 보존 기간을 요구한다.


4. Google DeepMind의 AGI에서 ASI로 가는 네 가지 경로


Google DeepMind가 발표한 「From AGI to ASI」 논문은 이 흐름을 더 큰 틀에서 설명한다. 논문은 AGI, 즉 인간 수준의 범용인공지능에 도달한 이후 AI가 ASI, 즉 초인공지능으로 발전하는 경로를 네 가지로 제시한다.

첫째는 스케일링이다. 더 많은 연산력, 더 큰 모델, 더 많은 데이터를 투입해 AI 성능을 끌어올리는 방식이다. 지금까지 AI 산업이 가장 익숙하게 사용해온 방식이며, GPU, HBM, 데이터센터 투자의 핵심 배경이다.

둘째는 알고리즘 패러다임 전환이다. 현재의 트랜스포머 기반 모델을 넘어 새로운 구조, 새로운 학습 방식, 더 효율적인 하드웨어가 등장할 수 있다. 스파이킹 뉴런, 뉴로모픽 하드웨어, 새로운 형태의 모델 아키텍처가 여기에 해당한다.

셋째는 AI의 재귀적 자기개선이다. AI가 AI 연구를 돕고, 이후에는 AI가 스스로 더 나은 AI를 만드는 과정에 깊이 관여하는 방식이다. 이 경로가 현실화되면 AI 발전은 단순한 선형 개선보다 훨씬 가파른 속도로 진행될 수 있다.

넷째는 다중 에이전트와 집단지능이다. 하나의 거대한 AI 모델이 모든 문제를 해결하는 대신, 수많은 AI 에이전트가 서로 협업하고 경쟁하며 집단적으로 문제를 해결하는 방식이다. 수만 명의 전문가가 동시에 연구하는 것처럼, 수많은 AI 에이전트가 24시간 병렬로 일하는 구조에 가깝다.

중요한 점은 이 네 가지 경로가 서로 대체 관계로만 움직이지 않는다는 점이다. 실제 AI 산업에서는 스케일링, 알고리즘 전환, 자기개선, 다중 에이전트화가 동시에 진행될 가능성이 높다. 이 조합은 더 많은 연산력뿐 아니라 더 많은 데이터, 더 긴 데이터 보존, 더 큰 저장 인프라를 요구한다.


5. Physical AI가 열리면 저장 수요의 단위가 달라진다


Agentic AI 다음 단계는 physical AI다. Physical AI는 로봇, 자율주행차, 드론, 산업 자동화 장비처럼 현실 세계에서 움직이는 AI를 의미한다.

이 단계에서 저장 수요는 텍스트 중심 AI와 비교하기 어려울 정도로 커진다. 로봇과 자율주행차는 카메라 영상, 라이다, 레이더, 센서, 위치 정보, 제어 로그를 계속 생성한다. 공장 자동화 장비는 생산 공정 데이터, 불량 감지 영상, 설비 상태 데이터를 실시간으로 남긴다.

특히 자율주행과 로봇 데이터는 쉽게 삭제하기 어렵다. 안전성 검증, 사고 분석, 규제 대응, 보험, 모델 재학습에 필요하기 때문이다. 기업 입장에서는 데이터를 삭제하는 것보다 보관하는 편이 장기적으로 더 가치 있을 수 있다.

이 흐름은 Seagate CFO가 언급한 robotics와 autonomous driving의 데이터 생성 논리와 연결된다. 자율주행 차량과 로봇은 인간보다 훨씬 빠른 속도로 현실 세계 데이터를 생성한다. 그리고 이 데이터는 단순 사용 기록이 아니라 안전과 규제, 모델 개선에 필요한 핵심 자산이 된다.

따라서 AI의 발전 경로가 text AI → agentic AI → physical AI로 이어질수록 저장 수요의 기울기는 더 가팔라진다. 텍스트 로그가 쌓이는 단계에서 영상, 센서, 시뮬레이션, 로봇 행동 데이터가 쌓이는 단계로 넘어가면 필요한 저장용량은 완전히 다른 차원으로 커진다.

https://www.pi.website/research/memory

https://www.pi.website/research/memory



6. 왜 SSD가 아니라 HDD인가: AI 데이터센터의 장기 기억장치


AI 인프라에서 모든 저장장치가 같은 역할을 하는 것은 아니다. 학습과 추론 중 즉시 접근해야 하는 데이터에는 HBM, DRAM, NVMe SSD가 필요하다. 빠른 속도가 중요하기 때문이다.

반면 장기 보관 데이터, 원천 데이터, 백업 데이터, 재학습용 데이터, compliance 데이터, 대규모 데이터레이크에는 HDD가 가장 경제적이다. HDD는 SSD보다 속도는 느리지만, 대용량 데이터를 낮은 비용으로 오래 보관하는 데 강점이 있다.

AI 시대에는 데이터의 대부분이 실시간 처리 대상만으로 구성되지 않는다. 학습에 쓴 원천 데이터, 과거 inference 로그, synthetic data, 영상 데이터, 로봇 센서 데이터, 실험 결과처럼 장기간 보관해야 하는 데이터가 계속 쌓인다. 이 영역에서 hyperscaler가 가장 중요하게 보는 것은 속도보다 TB당 비용, 전력 효율, 대규모 확장성이다.

HDD 기업들이 AI 확산을 구조적 수요 상방 요인으로 보는 이유도 여기에 있다. AI는 데이터를 더 많이 만들 뿐 아니라, 데이터를 더 오래 보관하게 만든다. 그리고 장기 보존 데이터의 최종 저장 계층에서는 HDD가 여전히 가장 경제적인 선택지다.

GPU가 AI의 연산 엔진이라면, HDD는 AI가 만든 데이터를 축적하는 장기 기억장치에 가깝다.


7. HDD 산업은 수요 폭증과 제한된 공급이 동시에 나타난다


HDD 투자 매력이 커지는 이유는 수요만 증가하기 때문이 아니다. 공급이 빠르게 늘기 어렵다는 점이 더 중요하다.

HDD 시장은 Seagate와 Western Digital을 중심으로 과점화되어 있다. 과거 PC HDD 시장이 축소되면서 업체들은 무리한 설비 확장을 줄였고, 시장은 클라우드 데이터센터 중심으로 재편됐다. 이제 수요는 AI와 hyperscaler 중심으로 다시 커지고 있지만, 공급업체들은 과거처럼 신규 공장을 공격적으로 짓지 않고 있다.


또한 고용량 nearline HDD는 단순히 돈을 투입한다고 바로 생산량이 늘어나는 제품이 아니다. HAMR 같은 차세대 저장 기술은 긴 인증 과정과 높은 제조 난도가 필요하다. 고객사인 대형 클라우드 업체들도 안정성 검증을 오래 진행한다.

이 구조에서는 수요가 빠르게 늘어도 공급이 즉시 따라오기 어렵다. AI inference, agentic workload, cloud data retention, physical AI 데이터가 모두 저장 수요를 끌어올리는 가운데 공급 증가율이 제한된다면, 가격 결정권은 자연스럽게 공급자에게 넘어간다.

Morgan Stanley 조사도 이 흐름을 뒷받침한다. HDD 수요는 연 40~50% 증가하는 반면 공급은 30~35% 증가에 그치고, 공급 부족은 2028년까지 이어질 가능성이 제기된다. nearline HDD 가격 역시 현재 TB당 14달러대에서 2027~2028년 25~30달러까지 상승할 수 있다는 전망이 나온다.


8. Seagate와 Western Digital의 이익 레버리지


HDD 가격이 오르면 Seagate와 Western Digital의 이익은 강하게 반응할 수 있다. 특히 현재 사이클은 단순히 물량을 많이 팔아 이익이 늘어나는 구조가 아니다. 제한된 공급 속에서 TB당 가격이 올라가고, 고용량 제품 믹스가 개선되며, 추가 가격 인상분이 높은 비율로 이익에 반영되는 구조다.

HDD 업체가 대규모 신규 설비를 급하게 늘리지 않는다면 고정비 부담은 제한된다. 반면 클라우드 고객의 수요가 계속 강하면 가격은 더 안정적으로 올라갈 수 있다. 이 경우 매출 증가보다 영업이익 증가가 더 크게 나타나는 operating leverage가 발생한다.

Seagate와 Western Digital의 투자 논리는 여기서 만들어진다. AI가 더 많은 데이터를 만들고, 기업이 데이터를 더 오래 보관하며, 클라우드 데이터센터가 nearline HDD를 대량으로 확보해야 한다면 HDD 가격은 구조적으로 지지된다. 가격이 오르면 EPS 추정치가 빠르게 상향될 수 있고, 시장은 이들을 과거의 경기민감 부품주가 아니라 AI 데이터 인프라 과점 기업으로 재평가할 수 있다.


9. AI 저장 수요는 일시적 테마가 아니라 기술 진화의 결과다


이번 HDD 사이클을 단순히 AI 테마에 편승한 단기 수급으로만 보기 어렵다. 근본 배경은 AI 기술의 발전 방향 자체에 있다.

Frontier LLM은 인간 개입을 줄이며 연구, 코딩, 평가, 개선 과정을 자동화하고 있다. Google DeepMind가 제시한 AGI에서 ASI로의 경로 역시 스케일링, 알고리즘 전환, 자기개선, 다중 에이전트화를 동시에 강조한다. 이 모든 경로는 더 많은 연산력뿐 아니라 더 많은 데이터, 더 긴 데이터 보존, 더 큰 저장 인프라를 필요로 한다.

여기에 agentic AI가 확산되면 AI는 업무 수행 과정에서 중간 산출물을 계속 만든다. physical AI가 확산되면 현실 세계의 영상과 센서 데이터가 폭발적으로 쌓인다. 이렇게 쌓인 데이터는 다시 모델 개선, 서비스 고도화, 안전성 검증, 규제 대응에 활용된다.

결국 AI는 연산 수요와 저장 수요를 동시에 키우는 기술이다. 지금까지 시장이 GPU와 HBM을 중심으로 AI capex를 이해했다면, 앞으로는 AI가 만들어내는 데이터의 장기 보존 수요도 함께 봐야 한다.


결론: HDD는 AI 데이터 폐쇄루프의 장기 기억장치다


AI 산업의 다음 투자 포인트는 단순히 더 빠른 칩에만 있지 않다. AI가 더 똑똑해질수록 더 많은 데이터를 필요로 하고, 더 많은 데이터를 생성하며, 그 데이터를 다시 저장해 다음 성능 개선에 활용한다. 이 구조가 바로 AI 데이터 폐쇄루프다.

이 폐쇄루프는 frontier LLM의 AI R&D 자동화에서 시작해 agentic AI의 업무 실행 데이터로 확장되고, 이후 physical AI의 영상·센서 데이터로 폭발한다. 데이터가 많아질수록 기업은 삭제보다 보존을 선택하게 되고, 장기 보존 수요가 커질수록 nearline HDD의 전략적 가치는 높아진다.

따라서 Seagate와 Western Digital의 투자 논리는 단순한 HDD 가격 상승이 아니다. 본질은 AI compute capex 이후 storage capex가 본격적으로 열리는 구조적 변화다. GPU와 HBM이 AI 시대의 연산 인프라였다면, HDD는 AI 시대의 데이터 기억장치다.

이 관점에서 HDD 상위 두 업체는 더 이상 과거 PC 부품 사이클에 묶인 기업으로만 볼 수 없다. AI가 스스로 데이터를 만들고, 저장하고, 다시 활용하는 시대가 열릴수록 Seagate와 Western Digital은 AI 데이터센터의 핵심 저장 인프라 기업으로 재평가될 가능성이 높다.


참고 링크

  • Google DeepMind, From AGI to ASI: AGI 이후 ASI로 가는 경로를 scaling AGI, AI paradigm shifts, recursive improvement, large-scale multi-agent collectives로 제시합니다. (Google DeepMind)

  • Seagate, AI-Driven Data Creation to Spur Next-Wave Cloud Storage Growth: AI 도입 기업의 data retention 확대와 클라우드 저장용량 증가 전망을 담은 공식 서베이입니다. (Seagate Investors)

  • Seagate CFO Morgan Stanley Conference: AI, 특히 Video AI와 자율주행이 저장 수요를 가속하고 있다는 회사 측 설명입니다. (Investing.com)

  • Morgan Stanley / Barron’s: HDD 수요 40~50% 성장, 공급 30~35% 성장, 2028년까지 공급 부족, TB당 25~30달러 가격 목표를 다룹니다. (Barron's)

  • Western Digital 2026년 HDD 공급 매진 관련 보도: 클라우드·AI 인프라 수요가 장기 공급계약으로 HDD 물량을 흡수하고 있다는 점을 보여줍니다. (tomshardware.com)


=끝

(스페이스X 왜 계속오르지..?)

댓글 없음:

댓글 쓰기