2026년 1월 1일 목요일

생각정리 153 (* 고려아연, Korea Zinc)

RA 시절 내 사수의 주력 섹터는 철강·비철금속이었다.

그때 자주 들었던 말이, 예전의 POSCO는 지금의 SEC, SKH에 맞먹는 “시장 존재감”을 가졌다는, 이른바 호랑이 담배 피우던 시절 이야기였다.

나는 사수를 크게 도와드리진 못했지만, 짧은 RA 기간 동안 유독 눈에 들어왔던 회사가 있었다. 바로 고려아연이다.


1. 왜 하필 고려아연이었는가


제련업은 구조적으로 분석 난이도가 매우 높다.
정광 매입 구조, Payable 조건, 각종 계약 조항들이 복잡하게 얽혀 있고, 무엇보다 그 세부 구조가 공개정보만으로는 거의 보이지 않는다.

동시에 제련사는 매일 움직이는 메탈 가격(Metal commodity),
크게 출렁이는 원/달러 환율,
글로벌 경기와 연동되는 수요 사이클까지 함께 봐야 한다.

즉, 공개된 분기·연간 보고서만으로 버텀업 이익 추정을 해보겠다고 달려들면, 사실상 “불가능에 가까운 게임”에 가깝다는 것이다.

그래서인지 한동안 나 역시 고려아연만 파고든 적이 있다.
그때의 나는 이 회사를 통해 투자수익률을 극대화하겠다는 실무적 욕심보다는,
**“버텀업 실력의 극한에 도전해 보겠다”**는 쪽에 더 가까웠던 것 같다.

지금 돌아보면, 그 시기에 고려아연에 매달리던 사람들은 대부분 비슷한 심리였을 것이다.
“이 난제를 풀 수 있다면, 어디서도 밀리지 않겠다”는.

(예전에 사수에게 고려아연 박사라고 놀림받던 기억이 떠오른다.)


2. 과거 내가 이해했던 고려아연의 본질: 자동 헷지 구조


당시 내가 정리한 고려아연의 핵심 이미지는 다음과 같았다.

  • “자동 헷지가 걸린 기업”

  • 메탈 가격이 경기와 함께 Up & Down을 반복

  • 반대로 달러 인덱스는 안전자산으로서 메탈과 역행

  • 결과적으로 메탈·환율이 서로 상쇄되어, 이익이 크게 늘지도 줄지도 않는 구조

즉, 메탈 가격이 사이클을 타긴 하지만,
환율이 반대 방향으로 움직여 이익이 상당 부분 방어되는 제련사라는 인식이었다.


그래서 고려아연은 “극단적 호황·극단적 불황에 덜 흔들리는데, 대신 폭발적인 레버리지는 제한적인 기업” 정도의 포지션으로 이해되었다.


3. 지금은 무엇이 달라졌는가: 메탈과 달러가 같은 방향으로 움직이는 구간


그런데 최근 몇 년간의 환경은 과거와 질적으로 다르다.

  • 저성장·고불확실성

  • 보호무역·탈중국

  • AI Capex 증가에 따른 메탈 수요 up-cycle

  • 재정적자 상시화에 따른 부채레버리지 


이 네 가지가 동시에 작동하면서,
달러에 상방 압력이 걸리는 국면과
메탈 가격이 사상 최고치(ATH) 경신을 향해 올라가는 구간
한꺼번에 등장하고 있다.


과거와 달리,

  • 달러 강세

  • 메탈 가격 강세


서로 상쇄가 아니라 **“동행”**하면서, 고려아연 입장에서는 말 그대로 순풍을 동시에 타는 구간이 열리고 있는 것이다.

여기에 더해,

  • 글로벌 메탈 제련사들의 파산·가동 중단,

  • 중국 희토류/메탈 공급망에 대한 서방의 배제 움직임 등도

중장기적으로 고려아연의 포지션을 상대적으로 강화시키는 요인으로 작용하고 있다.


4. 키 포인트: 은 가격이 고려아연에 미치는 영향


내가 특히 주목하는 지점은 **“은(silver)이 고려아연 이익 구조에서 차지하는 비중과 민감도”**이다.


과거에는 메탈·환율이 서로 상쇄되며 이익 변동성을 줄여주었다면,
지금은 은 가격이 구조적으로 이익 레버리지의 핵심 축으로 떠오를 수 있는 환경이 되고 있다고 판단한다.

그래서 아래에서는,
은 가격 상승 → 정광 매입원가(메탈 크레딧)도 함께 상승”하는 제련업 계약 구조를 전제로, 고려아연의 **은 가격 민감도(영업이익)**를

  • Payable(지급 금속) vs

  • Free metal(비지급 금속)


관점에서 잡아보고, 이어서 **2030 시나리오(은 170달러, 금 5,000달러, 구리 12,000달러)**를 같은 프레임으로 적용해, **2025 대비 2030년 영업이익 증가분(가격 요인만)**을 재계산한 결과를 정리한다.


5. 수치 가정과 결론 요약: 은 가격 민감도 베이스


5-1. 기본 가정(연간, 베이스 케이스)

  • 연간 판매량

    • 은: 2,010톤

    • 금: 8톤

    • 구리: 32,000톤

  • 2025년 기준 가격(베이스, 3Q25 QTD 가정)

    • 은: 39.38달러/oz

    • 금: 4,055달러/oz

    • 구리: 9,794달러/톤

  • 환율: 1,421원/달러

  • 영업이익 캡처율(가격 변화분 ΔPrice가 이익으로 남는 비율)

    • 은: 9.5% (본 분석의 Base 가정)

    • 금: 2% (보수적)

    • 구리: 3% (보수적)

5-2. 은 가격 민감도(연간)

  • 은 가격 1달러/oz 상승 시

    • 영업이익 약 87.2억원(= 8.72bn KRW) 증가(캡처율 9.5% 기준)

이는 단순히 다음 공식으로 표현된다.

Δ영업이익(원)
= 연간 은 판매량(oz) × Δ은 가격($/oz) × 캡처율 × 환율(원/$)

 


6. 왜 은 가격이 오르면 원가도 같이 오르는가: Payable / TC / RC 구조


제련사가 정광을 매입할 때의 기본 식은 다음과 같다.

정광 가격(매입대금)
= Payable metals 가치 합계 − (TC + RC + Penalty 등 공제)

 

여기서 핵심 개념은 다음과 같다.

  • Payable metal:

    정광에 들어 있는 금속 중, 제련사가 광산에 지급하기로 약정된 금속량·금속가치이다.

  • TC (Treatment Charge):

    “제련(용해/처리)” 서비스에 대한 대가로, 보통 정광 톤(t)당 달러로 청구된다.

  • RC (Refining Charge):

    “정련” 서비스 대가로, 보통 payable 금속 단위당 달러로 부과된다.

TC/RC와 Payable 조건은 대부분 연 단위로 재협상되며, 벤치마크 조건을 기반으로 개별 약정이 붙는 구조이다.

따라서 은 가격이 상승하면:

  • 정광 내 은의 payable 가치가 상승
    제련사의 정광 매입원가(원료비)가 함께 상승한다.

제련사의 이익은 결국

  1. TC/RC 마진,

  2. 비지급 금속(Free metal),

  3. 부산물/프리미엄

에서 발생한다.
즉, 같은 은 가격 상승이라도, **대부분은 원가로 통과(pass-through)**되고, 일부만 Free metal과 조건에 의해 이익으로 남는 구조이다.


7. 업계 Payable 사례: 은을 얼마나 “지급”하고 얼마나 “공짜로” 가져오는가


실제 공개된 계약·설명 자료를 보면, 은 Payable 구조는 대략 다음 세 가지 유형이 대표적이다.

  1. 납(Lead) 정광: “95% 지급 + 최소 공제(그램)”

    • 예: 은은 final silver content의 95%를 지급하되, 최소 50g 공제

    • 정광 은 함량이 G(g/t)라면

      • Payable 비율 ≈ 0.95 × (1 − 50/G)

      • Free silver 비율 ≈ 1 − 0.95 × (1 − 50/G)

  2. 아연(Zinc) 정광: “고정 공제 후 잔여분의 70% 지급”

    • 예: DMT당 은 3oz(≈93g) 공제 후 잔여분의 70% 지급

    • Payable 비율 ≈ 0.70 × (1 − 93/G)

    • G가 낮을수록 공제 비중이 커져 Free silver 비율이 크게 증가

  3. 동(Copper) 정광: “90% 지급 + 최소 공제(그램)”

    • 예: 은 90% 지급, 단 DMT당 30g 공제

    • Payable 비율 ≈ 0.90 × (1 − 30/G)

정리하면,
동일한 은 가격 상승이라도

  • 어떤 정광(납/아연/동/2차 원료)에서 들어오는 은인지,

  • 그 정광의 은 함량이 높은지 낮은지

에 따라, 제련사가 가져가는 Free silver의 비율이 크게 달라진다는 점이다.


8. 정광 내 은 함량과 Free silver 직관

프로젝트·광산별로 은 함량은 제각각이지만, ISO 기준에 나오는 범위만 봐도 상당히 넓다.

  • 동(구리) 정광: 은 25~1,500 g/t

  • 납 정광: 은 200~3,500 g/t

  • 아연 정광: 은 10~800 g/t

이 범위가 중요한 이유는, **최소 공제(예: 50g, 30g, 93g)**가 고정값이기 때문에,
은 함량 G가 낮을수록 공제 비중이 커지고 Free silver 비율이 급격히 커지기 때문이다.

예를 들어,

  • 납정광, G = 2,000 g/t

    • Payable ≈ 92.6%

    • Free silver ≈ 7.4%

  • 아연정광, G = 300 g/t

    • Payable ≈ 48.3%

    • Free silver ≈ 51.7%

  • 동정광, G = 200 g/t

    • Payable ≈ 76.5%

    • Free silver ≈ 23.5%

따라서 고려아연의 은 이익 민감도를 보려면, 단순히 “은 톤수”만 볼 것이 아니라,

  • 납/아연/동/2차원료 비중,

  • 각 정광의 은 함량 레벨

까지 종합적으로 봐야 한다는 결론에 도달하게 된다.


9. 고려아연 은 민감도(캡처율 9.5%)의 해석


앞서 설정한 **Base 캡처율 9.5%**는 계약 구조상 다음을 의미한다.

  • 은 가격이 1만큼 오를 때,

    • 매출은 “정련 은 판매가격”만큼 거의 1:1로 증가하지만,

    • 원료비도 “정광 내 은 Payable 가치”만큼 같이 증가

  • 이 둘의 차이(= Free silver 및 일부 조건)가 평균적으로 약 9.5% 수준에서 제련사 이익으로 남는다.

납 정광 비중이 크고, 고품위 위주라면 7~10%대 캡처율은 충분히 가능하다.
반대로 아연·저품위·2차 원료 비중이 커지면, Free metal 비율이 커지면서 캡처율이 더 높아질 여지도 있다.


10. 2030 시나리오: 은·금·구리 가격이 2030년에 도달했을 때


10-1. 가격 가정(2025 → 2030)


앞서 설정한 캡처율(은 9.5%, 금 2%, 구리 3%)을 그대로 적용하면,
2025 대비 2030년, “가격 요인만”으로 발생하는 연간 영업이익 증가분은 아래와 같다.

10-2. 결과(연간, 가격 요인만)

  • : 약 +1.139조원

  • : 약 +0.007조원

  • 구리: 약 +0.003조원

합산하면, 연간 약 +1.149조원의 영업이익 증분이 발생하는 시나리오이다.

여기서 핵심은,

  • 금·구리는 제련 계약상 대부분이 Payable → 원료비로 통과되기 때문에,

  • 가격 상승분에서 이익으로 남는 몫이 상대적으로 작다는 점이다.

반면 은은

  • 다양한 정광에서 유입되고,

  • Free silver 비율이 의미 있는 수준으로 존재할 수 있으며,

  • 부산물 구조와 맞물리면서

제련사의 이익 레버리지 측면에서 훨씬 결정적인 역할을 할 수 있다.


11. 이 구조가 깨질 수 있는 리스크: 정태적 민감도의 한계


위 민감도는 어디까지나 **“정태적(static) 가정”**이다.
실제 세계에서는 다음과 같은 변수들이 민감도를 바꾸어 놓을 수 있다.

  1. TC/RC/Payable 재협상 리스크

    • 은 가격이 장기간 급등하면,

      • 광산 측은 “은 크레딧을 더 가져가도록”(공제 축소, Payable 상향, RC 조정 등) 요구할 유인이 커진다.

    • 반대로 정광이 타이트하고 제련 캐파가 부족하면,

      • 제련사가 협상 우위를 점하며 유리한 조건을 유지하거나 강화할 수도 있다.

  2. 은 유입 경로 믹스 변화

    • 납/아연/동/2차원료 비중이 어떻게 바뀌는지에 따라,

    • 전체 Free silver 비율과 캡처율이 변한다.

    • 예를 들어, 아연·저품위 정광·2차 원료 비중이 늘어나면 캡처율이 커질 수 있다.

  3. 비용·부산물·생산량 변수

    • 전력·유가·약품비,

    • 황산 등 부산물 가격,

    • 헤지 전략,

    • 생산량 증감 등은

    • 본 계산에서 의도적으로 제외한 변수이지만, 현실에서는 이 요인들이 결과를 크게 좌우할 수 있다.


12. 희소금속, 미국 진출, 그리고 고려아연의 전략적 포지셔닝


여기에 더해, 고려아연은 제련 과정에서 부산물로 얻는 희소금속 영역에서 상당한 기술적 경쟁력을 쌓아왔다.

이 희소금속을 앞세워 미국 시장에 직접 진출하고,
미국 입장에서도 전략적으로 중요한 공급자로 자리 잡으려는 움직임을 보이고 있다.


이미 동사의 이익 구조에서 희소금속이 차지하는 비중은 의미 있게 올라와 있는 상황이다.

앞으로

  • 탈중국 공급망 재편,

  • AI·데이터센터·전력 인프라 확충 등 ‘physical AI’의 본격화,

고려아연

이 본궤도에 오를수록,
희소금속의 가치는 구조적으로 재평가될 가능성이 높으며, 이는 곧 고려아연 이익에 추가적인 상방 압력으로 작용할 것이다.


유안타증권



유안타증권


유안타증권



정리하면, 향후 고려아연의 이익 상방을 밀어올릴 축은

  1. 은 가격 레버리지,

  2. 희소금속 포트폴리오,

  3. 강달러 환경(달러 강세 + 메탈 강세의 동행 구간)


이 세 가지가 동시에 작동하는 구간이 얼마나 길게, 얼마나 강하게 이어지느냐에 달려 있다고 볼 수 있다.


지금은 지분 경쟁 이슈에 가려 본업 펀더멘털에 대한 인식 변화가 아직 주가에 충분히 Price-in되지 않은 것으로 보이지만, 구조적 변화의 중심에 있는 기업으로 재인식될 시점이 머지않았다는 생각이 든다.


과거의 고려아연이 “자동 헷지가 걸린 안정적인 이익 방어형 제련사”로 받아들여졌다면, 지금의 고려아연은 **“여전히 방어력을 유지하면서도 은·희소금속·강달러라는 세 축이 맞물릴 경우 상당한 이익 레버리지를 보여줄 수 있는 기업”**으로 다시 보아야 할 시점이라고 판단한다.

=끝

생각정리 152 (* Silver, 은)

 


1. 은(Silver)의 특징


1-1. 전기·전자 소재로서의 물성


대표 금속의 전기전도율을 상대값(구리=100)으로 보면 대략 다음과 같다.





은은 전기전도율·열전도율이 모두 최고 수준인 금속이다.

  • 그러나 가격이 높기 때문에 대량 도체(전선, 버스바)는 구리/알루미늄을 쓰고,

  • **고전류·고주파·고신뢰 접점(릴레이, 스위치, 커넥터, 태양광 전극 등)**에만 은을 얇게 도금·페이스트 형태로 사용하는 구조이다.

1-2. 공급 구조: “부산물 금속”의 한계


은은 대부분 다른 금속(연·아연·구리·금 등) 광산과 제련의 부산물로 생산된다.

World Silver Survey 및 학술 자료를 보면, 은광(Primary silver mine) 비중은 30% 미만이고 나머지는 lead/zinc, copper, gold 광산에서 나온다는 식으로 설명된다.


이 구조의 의미는 명확하다.

  • 은 가격이 많이 올라도, 은만을 위한 신규 광산 CAPEX가 급격히 늘어나기 어렵고,

  • 공급은 다른 비철금속의 채굴·제련 사이클과 환경 규제에 묶여 있다.




  • 장기적으로는 완만한 우상향이지만,

  • 최근 10년 정도를 보면 거의 횡보에 가까운 구간도 길다.

  • 다시 말해, 수요가 갑자기 뛰면 공급이 따라가기 어려운 구조이다.


2. 왜 최근 은 수요·수급·가격이 흔들렸는가


2-1. 2024년 글로벌 은 수요 구조


World Silver Survey 2025 기준 2024년 은 수요(최종 수요 기준)를 정리하면 아래와 같다.







핵심은 단순하다.

  • 은 수요의 **절반 이상이 산업용(Industrial)**이며,

  • 과거 귀금속·장신구 중심에서 “산업용 전략 금속” 비중이 훨씬 커진 시장으로 변했다는 점이다.

2-2. 구조적 적자와 가격 민감도


World Silver Survey 2025는 2024년 은 시장을 다음과 같이 정리한다.

  • 산업용 수요 680.5Moz(전년 대비 +4%)로 4년 연속 사상 최대,

  • 전체 수요 약 1,164Moz,

  • 공급을 148.9Moz 상회하는 적자(4년 연속 적자),

  • 2021~2024년 누적 적자 678Moz로, 2024년 광산 생산량의 약 10개월치 수준.



즉, 이미 몇 년째 수요 > 공급 상태이고,
창고 재고와 지상 재고(above-ground stocks)를 깎아 쓰는 구조가 지속되고 있다는 뜻이다.

이 상태에서

  • 태양광, 전기차, AI 데이터센터·통신망 등에서 산업용 수요가 추가로 늘고,

  • 공급은 부산물 구조 때문에 크게 늘지 못하면,


은 가격은 작은 수급 변화에도 민감하게 튀는 자산이 될 수밖에 없다.


3. 전방 산업별 수요와 2030년까지 증가 시나리오


이제 “어디에서 얼마나 새 수요가 생기는지”를
태양광(PV) / 전기차(EV) / AI 데이터센터로 나눠서,
2024~2030년 간단한 시나리오를 만든 결과를 보자.


3-1. 전제: 2024~2030 전방시장 성장 가정


각 산업별로, 공개 전망을 바탕으로 다음과 같이 두었다.

  1. 태양광(PV)

    • 2024년 PV 신규 설치: 574GW

    • 2030년: 880GW (BloombergNEF 전망)

    • 태양광이 사용하는 은: 2024년 243.7Moz를 기준으로,

    • 셀당 은 사용량은 매년 -4% 감소(thrifting).

  2. 전기차(EV)

    • 2024년 EV 판매: 1,700만 대

    • 2030년: 4,300만 대(STEPS 시나리오 기준)

    • EV 1대당 은 사용량: 35g(25~50g 중간값 가정).

  3. AI 데이터센터·통신 인프라

    • 2025~2030년 AI 관련 데이터센터 총 125GW 증설(McKinsey)

    • 데이터센터 설비 1MW당 은 5kg 사용(전력 스위치기어·커넥터 등, 보수적 추정).

  4. 기타 산업용 수요

    • 2024년 산업용 수요(680.5Moz)에서 PV·EV·AI를 뺀 나머지(기타 전자, 브레이징, 촉매 등)를 연 1% 성장 가정.


  • 파란 선(PV): 설치량은 크게 늘지만 로딩 감소가 있어서 완만한 우상향.

  • 주황 선(EV): 판매량 급증으로 가장 가파르게 증가.

  • 초록 선(AI Data Centers): 절대량은 아직 작지만, 2025년 이후 계단식으로 새 수요가 붙는 구조.

3-2. 전체 산업용·총수요 시나리오 (표)


위 전방 수요를 모두 합쳐,

  • 산업용 수요(Industrial),

  • 총수요(비산업 포함),

  • 공급,

  • 적자(Deficit),

  • 가격(단순 모델)

을 2024~2030년까지 계산한 결과는 아래와 같다.




해석을 정리하면,

  • Deficit이 2030년 ~200Moz 수준으로 확대되고, 가격은 2026~2030 구간이 점차 가팔라지는 형태로 도출된다.

  • 다만 이는 “가격을 수급차로 기계적으로 연결”한 단순 모델이므로, 실제 가격은 (투자수요, 재고, ETF/선물 포지션, 경기, 달러, 금리) 요인으로 더 크게 흔들릴 수 있다.



4. 은 공급량 분석


4-1. 현재 공급과 누적 적자


앞서 본 것처럼, 2024년 은 시장은

  • 총수요 1,164Moz,

  • 총공급 1,015.2Moz(광산+재활용 등)로,

  • 148.9Moz 적자,

  • 2021~2024년 누적 적자 678Moz(광산 생산량 10개월치 수준)를 기록하고 있다.

이 상황에서,

  • 신규 광산 개발은 환경 규제·ESG·지역사회 반발로 오래 걸리고,

  • 은은 대부분 부산물이기 때문에 “은만을 위한” 증산 여지가 크지 않다.


즉, 구조적으로 공급 증가 속도가 연 1% 내외에 그칠 공산이 크다는 가정을 둘 수 있다.

4-2. 2024~2030년 수요·공급 경로


앞의 수요 시나리오와
“총공급은 2024년 이후 연 0.8% 증가”라는 가정을 합치면,
2024~2030년 수요·공급 경로는 다음과 같다.



  • 파란 선: Total Demand

  • 주황 선: Total Supply

그래프에서 보듯,

  • 2024~2030 기간 내내 수요가 공급을 웃도는 구조가 유지되고,

  • 적자 폭은 오히려 조금씩 커진다.


물론 실제로는 가격 상승·대체 소재·정책 변화 등으로 수요가 조정될 수 있지만,
“현재 보이는 정책·투자 계획이 그대로 진행된다”는 전제에서는 적자 구조가 완화되기 쉽지 않다는 메시지이다.


5. 수급 불일치와 2030년까지의 은 가격 상승 모멘텀


5-1. 단순 가격 시나리오 (그래프)


가격은 실제로는 금리, 달러, 금·구리 가격, 투자심리 등 수많은 변수에 의해 결정되지만,
여기서는 **수급(Deficit/Supply)**만 반영한 매우 단순한 시나리오를 보겠다.






  • 2026 이후는 수급 모델에 따른 완만한 기울기의 상승이다.

  • 디피싯/공급 비율이 15~19% 수준에서 유지된다는 가정이라, 매년 15~20% 정도의 상승률이 누적되는 그림이다.


즉, 2025년 말 76달러 수준에서 출발해, 수급이 계속 빡빡하다는 전제라면 2030년에는 170달러 안팎까지 시도할 수 있는 경로가 나온다.

(물론 실제 시장에서는 투자심리·금리·달러 등으로 인해 이보다 훨씬 위/아래로 크게 흔들릴 수 있다.)

숫자 자체보다 중요한 것은,

  • 수요 증가 속도(태양광·EV·AI)가 공급 증가 속도를 꾸준히 웃도는 한,

  • 은 가격은 중장기적으로 우상향 모멘텀을 가지게 되고,

  • 동시에 귀금속·투자 자산이라는 성격 때문에 단기 변동성은 매우 클 수밖에 없다는 점이다.


정리

  1. 은의 특징

    • 전기전도율 1위 금속이며,

    • 대부분이 다른 금속의 부산물로 생산되는 탓에 공급 탄력성이 낮다.

  2. 최근 수요·수급·가격

    • 2024년 산업용 수요 680.5Moz, 전체 수요 1164Moz, 적자 148.9Moz,

    • 2021~2024년 누적 적자 678Moz로, 이미 수급이 구조적 적자 상태다.

  3. 전방 산업별 수요 및 2030년까지 증가

    • 태양광: 설치 574→880GW, thrifting를 감안해도 2030년 은 수요가 2024년보다 15~20% 증가.

    • 전기차: 1,700만→4,300만 대, 1대당 35g 가정 시 은 수요 2배 이상.

    • AI 데이터센터: 2025~2030년 125GW 증설, 연 수백t 수준의 새 수요.

  4. 공급

    • 부산물 구조·환경 규제·인허가 지연으로 연 1% 내외 증가에 그칠 가능성이 크고,

    • 2030년까지도 수요 증가를 따라잡기 어렵다는 시나리오가 자연스럽다.

  5. 가격 모멘텀

    • 이런 조건에서 은은 2030년까지

      • 장기적으로는 상승 모멘텀,

      • 단기적으로는 높은 변동성을 가진 “산업용 전략 귀금속”으로 남을 가능성이 크다.



희귀금속으로서의 m2와 silver간의 상관관계


m2와 실버가격간의 프리미엄 배수

=끝

2025년 12월 31일 수요일

생각정리 151 (* Sparse MoE)

즐겨 보는 유튜브 채널인 **‘백색나무’**에서 늘 많은 도움을 받고 있다.

최근 이 채널에 MoE를 다룬 매우 흥미로운 인터뷰 영상이 올라와, 그 내용을 나만의 방식으로 다시 정리해 보고 앞으로의 메모리 수요 추정까지 함께 정리해 보려 한다.


0. 먼저 용어부터 정리하기


전문가가 아니라도 이해할 수 있도록 핵심 용어를 정리해 두자.

0-1. 파라미터, 레이어, 헤드

  • 파라미터(parameter)

    모델이 학습을 통해 얻는 숫자(가중치)이다. 100B 파라미터 모델이면 이런 숫자가 1,000억 개 있다는 뜻이다.

  • 레이어(layer)

    뉴런이 여러 층으로 쌓여 있는 구조에서 각 층을 말한다. LLM은 대체로 수십~수백 개 레이어를 가진다.

  • 어텐션 헤드(head)

    한 레이어 안에서도 서로 다른 관점으로 문맥을 보는 작은 모듈들이다.
    예를 들어 “시제”, “대명사 지시”, “수학적 관계”처럼 다양한 패턴을 동시에 추적하기 위해 여러 개의 헤드가 병렬로 동작한다.

0-2. Dense 모델 vs MoE(희소 전문가 혼합)

  • Dense 모델

    매 토큰을 생성할 때 모든 파라미터를 매번 다 사용하는 구조.
    예: LLaMA-405B 같은 전통적인 초거대 모델.

  • Mixture of Experts(MoE, 희소 전문가 혼합)

    하나의 거대한 모델을 수십~수백 개의 **전문가(Expert)**로 나누고,
    매 토큰마다 **일부 전문가(예: 2~8개만)**만 활성화해서 계산하는 구조다.
    전체 파라미터는 1T에 이르지만, 실제로 매 토큰에 사용하는 파라미터는 그 중 몇 퍼센트에 불과하다.





그래프 1과 2는 팟캐스트에서 언급된 예시(LLaMA-405B vs GPT-OSS)를 단순화한 것이다.

  • LLaMA-405B: 405B 파라미터를 전부 사용, 점수 28, 벤치마크 비용 200달러

  • GPT-OSS: 120B 중 약 5B만 활성화, 점수 61, 비용 75달러

(수치는 팟캐스트에서 Ian Buck이 든 예시를 기반으로 한 개략적 비교임)

0-3. 컨텍스트 길이와 KV 캐시

  • 컨텍스트 길이(context length)

    한 번에 모델이 볼 수 있는 토큰 수.
    예: 8K, 32K, 1M 토큰 등.

  • KV 캐시(KV cache)

    한 번 프롬프트를 넣으면, 각 레이어·헤드마다 Key/Value 벡터가 생긴다.
    이후 토큰을 한 글자씩 생성할 때, 이미 계산해 둔 이 값들을 계속 참조한다.
    KV 캐시를 GPU 메모리(VRAM)에 계속 올려 두어야 하기 때문에,
    컨텍스트와 동시 사용자(배치)가 늘어날수록 메모리 요구량이 폭증한다는 점이 핵심이다.[(nvidia.github.io)]


아래 그래프 4는 “대략 8K 차원, 60레이어, 128헤드, 배치 4, FP16” 같은 초거대 모델을 가정했을 때
컨텍스트 길이에 따라 KV 캐시가 얼마나 늘어나는지 보여준다.

  • 4K 토큰: 수십 GB

  • 32K 토큰: 수백 GB

  • 128K 토큰: 약 1TB 수준

  • 1M 토큰: 수 PB에 가까운 수준까지 치솟는다


(정확한 값이라기보다 스케일을 보여주는 1차 근사로 이해하면 된다.)


0-4. HBM, HBF, AI SSD

  • HBM(High Bandwidth Memory)

    GPU 패키지 바로 옆에 적층하는 초고속 메모리. 대역폭은 매우 높지만 용량과 가격이 한계다.

  • HBF(High Bandwidth Flash)

    SanDisk가 제안한 새로운 플래시 계열 메모리.
    1세대 제품은 GPU당 최대 4TB VRAM을 제공하고 대역폭은 HBM 수준에 근접하는 것을 목표로 한다.출처 (Tom's Hardware)

  • AI SSD / 토큰 웨어하우징

    KV 캐시나 임베딩 등을 SSD·네트워크 스토리지까지 확장해서 저장하고,
    필요한 부분만 GPU로 스트리밍하는 구조를 말한다.출처 (WEKA)


1. 엔비디아 AI 팟캐스트 내용: MoE가 왜 표준이 되었나


Ian Buck(NVIDIA Hyperscale & HPC 부문 부사장)은 엔비디아 AI 팟캐스트에서
오늘날 프런티어 모델들이 왜 거의 모두 Mixture of Experts 구조를 채택하는지 설명했다.

1-1. “모든 뉴런을 다 불러내면 너무 비싸다”


처음에는 “파라미터 = 뉴런 수”가 곧 모델의 지능을 의미했다.

  • 1B → 10B → 100B → 1T 파라미터로 커질수록 성능이 올라갔다.

  • 하지만 Dense 구조에서는 질문 하나에 모든 파라미터를 매번 다 계산해야 한다.


예를 들어 LLaMA-405B 모델은 405B 파라미터를 전부 활성화해야 한다.
이 정도 모델은 GPU 여러 대에 걸쳐 분산해서 계산해야 하고,
벤치마크 한 번 돌리는 데 수백 달러가 들 정도로 비싸다.

1-2. 인간처럼 “필요한 부분만 쓰자” → MoE


연구자들은 “질문마다 뇌의 일부만 쓰는 인간”을 떠올리며 새로운 구조를 만들었다.

  • 하나의 거대 모델을 수십~수백 개의 **전문가(Experts)**로 나눈다.

  • 각 질문마다 **라우터(router)**가 “어떤 전문가 몇 개를 쓸지”를 결정한다.

  • 그 결과:

    • 전체 파라미터 수는 그대로 (또는 더 커지지만),

    • 실제로 활성화되는 파라미터는 5%·3% 수준으로 줄어든다.


GPT-OSS 같은 최신 오픈 모델은

  • 총 120B 파라미터를 갖지만,

  • 질문 1개를 처리할 때는 약 5B만 사용한다는 식이다.


그래프 1, 2에서 보듯이, 이 덕분에





  • 성능 점수는 28 → 61로 2배 이상 상승

  • 벤치마크 비용은 200달러 → 75달러로 약 3분의 1 수준까지 떨어진다.


즉, MoE는 **“더 똑똑하면서 더 싼 모델”**을 가능하게 하는 구조다.

1-3. 숨은 비용: 통신과 메모리


하지만 활성 파라미터 수가 줄어들었다고 해서
전체 비용이 단순히 10분의 1로 떨어지는 것은 아니다.

이유는 다음과 같다.


전문가를 수백 개로 쪼개면,
매 스텝마다 “어느 전문가에게 토큰을 보낼지”를 결정하고,
다시 결과를 모으는 통신 비용이 발생한다.


전문가들이 서로 다른 GPU에 흩어져 있기 때문에,
고속 인터커넥트(NVLink 등)를 통해 끊임없이 데이터를 주고받아야 한다.


이때 통신 비용뿐 아니라 VRAM 측면의 숨은 비용도 함께 붙는다.
Sparse MoE를 FFN 자리에 넣으면,
“전문가별로 보내고(dispatch) 합치고(combine) 조정(라우팅/게이팅)”하는 과정 때문에
KV 캐시와는 별도로 VRAM이 추가로 필요하다. 구조를 조금 더 뜯어보면 다음과 같다.

  1. 라우팅 결과 저장

    각 토큰이 어떤 전문가(top-k)로 갈지, 가중치가 얼마인지(게이트 값) 같은 정보를 저장해야 한다.

  2. 보내기용 버퍼(dispatch buffer)

    토큰을 “전문가별로” 묶어서 보내야 하므로, 토큰을 재배열하기 위한 임시 공간이 필요하다.

  3. 되돌리기/합치기용 버퍼(combine buffer)

    전문가들이 계산한 결과를 다시 원래 토큰 순서로 되돌리고,
    top-k 결과를 가중합으로 합치는 과정에서도 별도의 임시 공간이 필요하다.

  4. 패딩/버킷팅 오버헤드

    전문가마다 할당된 토큰 수가 들쭉날쭉하기 때문에,
    GPU 연산을 맞추기 위해 빈칸을 채우는 형태의 패딩 메모리가 추가로 잡힌다.

  5. 전문가 FFN 내부 임시 activation

    각 전문가가 계산하는 동안 잠깐 필요했다가 사라지는 중간 텐서들이 생기는데,
    배치가 커질수록 이 임시 activation도 함께 커진다.

요약하면, KV 캐시는 원래 “대화 로그”로 크게 깔려 있는 기본 항목이고,
MoE는 여기에 “분류·배송·재조립”을 위한 버퍼와 임시 텐서를 더 얹어서
VRAM이 훨씬 더 빨리 차는 구조를 만든다고 이해하면 된다.


그래서 엔비디아는 NVLink 스위치와 NVSwitch가 붙은 랙 규모 시스템을 만들었다.

  • Hopper 세대: 서버 1대에 GPU 8개를 NVLink로 묶어 하나의 큰 GPU처럼 사용.

  • Blackwell GB200 NVL72: 랙 하나에 GPU 72개를 NVLink-Switch 패브릭으로 묶어
    총 13.5TB HBM3e와 130TB/s급 NVLink 대역폭을 제공한다.


이처럼 통신·메모리까지 포함한 랙 단위 설계 덕분에
DeepSeek R1 같은 극단적으로 복잡한 MoE 모델을 돌릴 때도
각 GPU가 놀지 않고 풀 가동할 수 있게 된다.

1-4. 세대가 바뀔수록 “비용 10배씩 줄이기”를 노리는 구조


Ian Buck의 설명을 정리하면, 엔비디아의 목표는 단순히

  • FLOPS(초당 연산량)를 늘리는 것 이상으로,

  • “동일 지능 수준에서 토큰당 비용을 10배씩 줄이기”


이다.


Hopper → Blackwell → Vera Rubin으로 갈수록

  • GPU당 HBM 용량·대역폭,

  • NVLink 스위치 규모,

  • 랙당 총 메모리 용량


이 기하급수적으로 늘어나지만,
그만큼 한 랙이 처리할 수 있는 토큰 수도 더 빨리 늘어나므로
“토큰당 비용”은 오히려 떨어지는 구조다.


2. DeepSeek 모먼트 이후: 성능·비용 최적화가 왜 메모리 폭증으로 이어졌나


2-1. DeepSeek가 보여준 것: “좋은 설계로도 SOTA에 도달할 수 있다”

DeepSeek-V2 / R1은 중국 제한된 GPU 환경에서도
프런티어 모델과 경쟁 가능한 성능을 보여준 사례로,
MoE와 효율적인 훈련 기법을 적극 활용해
낮은 비용으로 높은 성능을 달성했다는 점 때문에 “DeepSeek 모먼트”라고 불린다.출처 (Geeky Gadgets)


이 사건 이후

  • OpenAI, Anthropic, xAI, Kimi 등 주요 플레이어들이
    Sparse MoE + 장문 컨텍스트 방향으로 빠르게 정렬되었다.


2-2. Sparse MoE → 토큰당 비용 하락 → 사용량·컨텍스트 길이 폭증


Sparse MoE의 핵심 효과는 두 가지다.

  1. 동일 하드웨어에서 더 많은 토큰을 처리할 수 있게 한다.

  2. 더 큰 모델(더 많은 총 파라미터)을 같은 비용에 돌릴 수 있게 한다.


그러면 서비스 레벨에서는 아래와 같은 변화가 발생한다.

  • 가격이 내려가거나, 같은 가격에 더 길고 더 자주 쓸 수 있는 플랜이 나온다.

  • 기업 고객은
    “8K · 32K 컨텍스트”에서 “128K · 1M 컨텍스트”로
    한 번에 넣는 데이터 양을 계속 늘린다.

  • 에이전트/워크플로는 한 세션 안에서 수백·수천 턴의 상호작용을 갖게 된다.


그 결과, KV 캐시 메모리가 폭발적으로 증가한다.


2-3. KV 캐시가 왜 그렇게 많이 드는가: 간단한 1차 계산

KV 캐시는 대략 다음과 같이 늘어난다.

KV 크기 ≈ 2(K와 V) × 배치 × 컨텍스트 길이 × 레이어 수 × 헤드 수 × 헤드 차원 × 바이트 수


예를 들어:

  • d_model = 8,192

  • 레이어 = 60

  • 헤드 수 = 128

  • 헤드 차원 = 64

  • 배치 = 4

  • FP16(2바이트)


이면, 그래프 4에서 보는 것처럼





  • 4K 토큰: 수십 GB

  • 32K 토큰: 수백 GB

  • 128K 토큰: 약 1TB

  • 1M 토큰: 수 PB급


까지 올라간다.

여기에 동시 유저 수(배치), 재질문 횟수, 체류 시간이 한꺼번에 늘어나기 때문에,
실제 데이터센터에서는 KV 캐시를

  • GPU HBM,

  • 서버 DRAM,

  • CXL 메모리,

  • HBF/AI SSD·원격 스토리지


까지 계층적으로 확장해 쓰게 된다.출처 (Blocks and Files)


결국 Sparse MoE가 연산량을 줄여서 토큰당 비용을 낮추자,
그 효과가 다시 컨텍스트·동시성 확대 → KV 메모리 폭증으로 되돌아온 셈이다.


3. 엔비디아 GPU 메모리 로드맵: Hopper → Blackwell → Rubin(+CPX) → Feynman + HBF


이제 엔비디아가 왜 “메모리 회사처럼” 행동하기 시작했는지 보자.

3-1. Hopper 기준선

  • H100: 80GB HBM3, 서버당 8개 구성(DGX H100 기준)
    서버 DRAM까지 합치면 GPU당 고속 메모리는 대략 272GB 수준이라는 가정이 가능하다.

  • Altman은 2025년 말까지 OpenAI가 100만 개 이상의 GPU를 운영할 것이라고 언급했다.출처 (Business Insider)

이를 단순 곱셈으로 계산하면, 2025년 기준 OpenAI급 사업자는

  • 고속 메모리 풀 ≒ 0.27EB(엑사바이트) 수준을 이미 운영 중일 수 있다.
    (정확한 수치는 아니고 스케치 수준의 1차 추정이다.)

그래프 3에서 2025년 (0.27EB)가 그 값이다.




3-2. Blackwell GB200 NVL72: 랙당 13.5TB HBM

  • GB200 NVL72는 랙 하나에 GPU 72개와 Grace CPU 36개를 묶어

  • Hopper 대비 랙당 GPU 수는 8 → 72(9배), 메모리와 통신 규모는 그 이상으로 커졌다.

  • Ian Buck이 예시로 든 DeepSeek R1 기준으로는
    Hopper 대비 토큰당 비용이 약 10분의 1 수준까지 감소했다고 설명한다.

이 세대부터 사실상 “훈련용 = 추론용” 경계가 흐려진다.
훈련에 쓰던 초대형 HBM 랙을 그대로 추론에도 쓰는 쪽이
MoE + 긴 컨텍스트 환경에서는 경제적으로도 맞아 떨어지기 시작한다.


3-3. Vera Rubin NVL144 CPX: 100TB급 고속 메모리, 1.7PB/s


Rubin 세대의 핵심은 **“장문 컨텍스트 전용 추론 랙”**이다.

  • Vera Rubin NVL144 CPX 랙은

    • Rubin GPU 144개,

    • Rubin CPX(Inference 전용) GPU 144개,

    • Vera CPU 36개를 묶어

    • NVFP4 기준 8EF 성능, 고속 메모리 100TB, 대역폭 1.7PB/s를 제공한다.출처 (Futurum)

  • CPX는 HBM 대신 GDDR7 기반이지만, **Prefill 단계(문맥 파싱)**에 특화돼
    긴 컨텍스트의 KV 캐시·프롬프트 처리를 빠르게 밀어 넣는 역할을 한다.출처 (NVIDIA Developer)

Rubin 세대에서는 하드웨어·소프트웨어가 모두

  • 프리필/디코드 분리(Disaggregated Serving),

  • KV 캐시 계층화(Dynamo, Distributed KV Cache Manager),

  • 장문(1M+ 토큰) 컨텍스트


에 맞춰 재설계되고 있다.출처 (nvidia.github.io)

즉, **“KV 캐시가 비용의 중심이 되는 시대”**에 최적화된 아키텍처다.

3-4. Feynman + HBF / AI SSD: 랙 밖으로 뻗는 메모리


엔비디아는 GTC 2025에서 Rubin 이후 세대인 Feynman(2028년경) 로드맵을 공개했다.

  • 구체 스펙은 아직 없지만, **차세대 HBM(HBM4e 또는 HBM5 추정)**을 사용할 예정이라고만 알려졌다.출처 (Wccftech)


한편, 메모리 업계에서는

  • SanDisk의 **HBF(High Bandwidth Flash)**가
    GPU당 최대 4TB VRAM을 제공할 수 있다고 밝혔고,출처 (Tom's Hardware)

  • TrendForce 등은 HBF + AI SSD 조합이
    “HBM 용량·비용 한계를 보완하는 차세대 메모리 계층”이 될 것이라고 분석한다.출처 (TrendForce)


엔비디아의 Dynamo·Disaggregated Serving 로드맵을 보면,
실제 KV 캐시는

HBM → GPU L2 → 서버 DRAM → NVMe/AI SSD → 네트워크 스토리지


까지 확장 가능한 계층형 메모리 구조를 전제로 하고 있다.출처 (Blocks and Files)


따라서 Feynman 세대에서는

  • 더 큰 HBM(온칩),

  • HBF·AI SSD(근접 플래시),

  • 네트워크형 KV 스토리지


를 모두 엮는 “토큰 웨어하우징” 구조가 본격화될 가능성이 크다.

3-5. OpenAI 스타일 시나리오: 2025 → 2030 메모리 풀 성장


이전에 제시한 가정을 그대로 쓰면,

  • 2025년: 0.27EB

  • 2030년:

    • Low: 7EB

    • Base: 9.5EB

    • High: 14EB


의 고속 메모리 풀이 필요하다는 시나리오가 나온다.


그래프 3은 이 가정을 시각화한 것이다.
실제 수치는 불확실하지만, **“5년 사이 30~50배 확장”**이라는 방향성 자체는




  • OpenAI Stargate가 DRAM 생산량의 수십 퍼센트를 잠식할 수 있다는 분석,출처 (Tom's Hardware)

  • 대형 클라우드의 GPU 증설 계획


등과도 크게 어긋나지 않는 수준의 추정으로 볼 수 있다.


4. Sparse MoE 이후, 왜 “훈련용 GPU”가 오히려 추론에 더 잘 맞게 되었나


본래 GPU는

  • 훈련: 엄청난 연산량(FLOPS) + 비교적 작은 배치에서의 통신

  • 추론: 상대적으로 작은 연산량 + 짧은 컨텍스트


를 염두에 둔 범용 가속기였다.


하지만 Sparse MoE, 장문 컨텍스트가 대세가 되면서 상황이 바뀌었다.


4-1. 추론이 “메모리 지배적 작업”이 됨


최근 논문·벤치마크들을 보면, LLM 추론은

“연산보다는 HBM 대역폭과 KV 캐시 전송에 의해 지배되는 메모리 바운드 워크로드”


라는 결론이 반복해서 나온다.출처 (arXiv)

즉,

  • FLOPS를 2배 늘리더라도,

  • HBM 용량·대역폭이 그대로면


길고 큰 배치에서의 성능은 거의 늘지 않는다.

반대로,

  • HBM·HBF 계층을 키우고,

  • NVLink·Dynamo로 KV 캐시를 효율적으로 배치하면,


같은 FLOPS로 훨씬 많은 토큰을 처리
할 수 있게 된다.

4-2. 훈련용 GPU의 강점이 추론에서도 그대로 필요


훈련용 GPU는 원래부터

  • 대용량 HBM,

  • 고속 NVLink·NVSwitch,

  • 멀티 GPU 통신 스택(NCCL, CUDA-X),


같은 무식하게 큰 메모리·통신 인프라를 갖고 있었다.

Sparse MoE + 장문 컨텍스트 시대에는

  • 추론 역시 수십~수백 개 전문가가
    GPU 여러 대에 흩어져 있는 구조가 일반적이다.

  • KV 캐시와 모델 파라미터 둘 다
    GPU 랙 전체에 분산해서 관리해야 한다.


결과적으로 **“훈련용 GPU가 곧 장문 추론용 GPU”**가 되어 버린다.
Rubin CPX처럼 일부는 프리필 전용으로 바꾸더라도,
기본적으로는 같은 NVLink 패브릭과 소프트웨어 스택 위에서 돌아간다.


5. ASIC 계열 추론 가속기와의 구조적 차이


마지막으로, “ASIC 계열 추론 전용 칩 vs 엔비디아 GPU” 구도를 보자.

5-1. ASIC의 강점


Groq LPU, d-Matrix, Tenstorrent 등 ASIC 계열은

  • 특정 연산(행렬 곱, attention 등)에 최적화된 데이터플로 구조,

  • 낮은 지연시간, 높은 에너지 효율,

  • 간단한 멀티칩 스케일링(토크나이저처럼 직렬 파이프라인)


을 장점으로 내세운다.출처 (Groq)


따라서

  • 비교적 작은 모델,

  • 짧은 컨텍스트,

  • 고정된 워크로드


에서는 여전히 $/TOPS, 와트당 성능이 우수할 수 있다.

5-2. 그러나 메모리·통신 로드맵에서는 아직 GPU만큼 정렬되지 않았다


현재 공개된 정보를 기준으로 보면,

  • 많은 ASIC은 HBM 없이 LPDDR·GDDR 중심,
    일부는 HBM을 쓰더라도 용량이 제한적이다.

  • 랙 단위 NVLink/NVSwitch 같은 완전 연결 패브릭 대신,
    더 단순한 토러스·포인트투포인트 토폴로지를 택하는 경우가 많다.

  • KV 캐시 계층화, 프리필/디코드 분리, 대규모 분산 KV 스토리지까지 포함한
    소프트웨어 스택은 아직 성숙도가 낮다.


물론 d-Matrix처럼 “메모리 중시”를 내세우는 업체도 있지만,
엔비디아처럼

Hopper → Blackwell → Rubin(+CPX) → Feynman + HBF/AI SSD


로 이어지는 일관된 랙급 메모리·통신 로드맵
동일한 속도로 따라가고 있는 곳은 많지 않다.출처 (Futurum)

5-3. Sparse MoE + 장문 컨텍스트에서는 어떤 구조가 유리한가


Sparse MoE와 장문 컨텍스트, 멀티모달(텍스트+비전+비디오)·로보틱스까지 고려하면

  1. 총 파라미터 수는 1T 이상으로 계속 커지고,

  2. 매 토큰 활성 파라미터는 1~5%로 줄어드는 대신,

  3. KV 캐시·멀티모달 상태·에이전트 상태가
    대량의 장기 메모리로 남게 된다.


이 구조에서는

  • “행렬 곱을 얼마나 빨리 하느냐”보다

  • “얼마나 많은 상태를, 얼마나 싸게·빠르게 저장하고 읽을 수 있느냐”가
    경쟁의 핵심이 된다.


따라서

  • HBM + NVLink + HBF/AI SSD + 분산 KV 스택까지
    수직 통합한 엔비디아식 GPU 플랫폼은

    • 프런티어 LLM,

    • 1M 토큰 컨텍스트,

    • 비전·비디오·로보틱스·과학 시뮬레이션


같은 “메모리 폭식형” 워크로드에서 장기적으로 유리할 가능성이 크다.


ASIC은

  • 특정 규모 이하 모델이나,

  • 온디바이스 추론,

  • 짧은 컨텍스트·정형 업무


같은 틈새에서는 여전히 강력할 수 있지만,
Sparse MoE로 무장한 프런티어 LLM·멀티모달 모델이 지배하는 영역에서는

  • 메모리·통신 로드맵에서 GPU 진영과 같은 수준의 투자를 하지 않으면
    구조적으로 불리해질 위험이 있다는 점은 부인하기 어렵다.


마무리


정리하면,

  1. MoE는 “더 똑똑하면서 더 싼 AI”를 위한 구조이고,

  2. DeepSeek 모먼트 이후 이 구조가 사실상 프런티어 모델 표준이 되었다.

  3. 하지만 MoE + 장문 컨텍스트는 KV 캐시와 상태 메모리를 폭발적으로 증가시켜,

  4. 결과적으로 훈련용 초대형 GPU 랙이 추론용으로도 가장 경제적인 환경을 만들었다.

  5. 엔비디아는 Hopper → Blackwell → Vera Rubin(+CPX) → Feynman + HBF/AI SSD로 이어지는
    **“메모리 계층화 로드맵”**을 통해 이 흐름을 선도하려 하고 있다.

  6. ASIC 추론 가속기는 연산 효율에서는 강점을 갖지만,
    이런 메모리·통신 중심의 게임에서는
    동급의 인프라·소프트웨어 투자가 없다면 점점 불리해질 수 있다.


이런 관점에서 보면, Sparse MoE는 단순한 모델 구조 변화가 아니라
앞으로의 AI 하드웨어, 그중에서도 메모리가 사실상의 엔드게임이 될 수 있다는 가능성을 보여준 계기라고 생각된다.

돌이켜보면, 이른바 DeepSeek 쇼크 당시에는 MoE 구조에 대한 이해가 부족했다.

그 결과,

  • 왜 메모리가 앞으로 AI 진화의 핵심 자원이 될 수밖에 없는지,

  • 왜 GPU가 ASIC 대비 구조적인 우위를 점할 수 있는지


이 두 가지를 충분히 납득하지 못했다. 결국 AI 기술 자체에 대한 이해 부족이 뿌리에 있었던 셈이다.

그래서 이제는 시간이 날 때마다

  • AI 아키텍처와 하드웨어 구조,

  • 모델 설계 트렌드와 서비스 방향성


같은 내용을 꾸준히 공부하면서, 기술 발전 방향에 대한 감도를 높여야 한다고 생각한다.


미래 메모리 수요에 대해 최소한의 “감”이라도 가지려면,
먼저 AI 기술이 어디로 향하고 있는지에 대한 입체적인 이해가 필요하다.
그런 이해 없이 SK하이닉스나 삼성전자 같은 업체에 전망만 계속 물어본다고 해서,
정말 필요한 인사이트를 얻기 어렵다는 생각이 든다.

=끝

2025년 12월 30일 화요일

생각정리 150 (* 연준의 기원)



대공황, 연준, 그리고 ‘큰 정부’의 기원


— 밀턴 프리드먼을 다시 읽고


연말 휴가 동안 밀턴 프리드먼의 『선택할 자유』를 다시 읽었다.

20대 후반에 처음 읽었을 때는 “자유시장 옹호”라는 큰 틀만 어렴풋하게 남았을 뿐, 구체적인 역사·정책 논쟁은 잘 와 닿지 않았던 기억뿐이었다. 거시경제에 대한 이해도 부족했고, 투자 실무에서 체감한 경험도 부족했고, 트럼프 행정부의 보호무역 정책이나 미국의 부채 레버리지 확대 같은 이슈도 아직 본격화되기 전이었다.

하지만 지금 다시 읽어보니 상황이 완전히 다르다.

연준의 독립성 논쟁, 각국 재정적자의 상시화, 팬데믹 이후 인플레이션 재부상이라는 현실을 겪은 뒤라서인지, 프리드먼이 이야기하는 통화와 국가의 역할, 그리고 대공황·연준·복지국가의 기원이 훨씬 더 구체적이고 실제적인 문제로 다가온다.


이 글은 프리드먼의 시각을 따라가며

  • 1929년 대공황의 정치·경제적 의미,

  • 1907년 공황과 연방준비제도(연준)의 탄생,

  • 연준의 통화정책 실패와 ‘대수축’(Great Contraction),

  • 그리고 뉴딜·케인즈경제학·큰 정부의 정당화

를 하나의 흐름으로 정리해 보는 시도이다.


1. 대공황이 남긴 정치·경제적 상처


대공황(Great Depression)
은 1929년 뉴욕 증시 붕괴에서 시작해 1930년대 후반까지 이어진 세계적 경제위기이다. 산업 생산·국제무역이 급락하고 실업은 두 자릿수로 치솟았으며, 각국에서 대량 실업과 빈곤이 일상 풍경이 되었다.(Encyclopedia Britannica)

그 파장은 경제를 넘어 정치·사회 전반을 뒤흔들었다.

  • 독일에서는 극심한 실업과 불만이 나치당과 히틀러의 부상에 비옥한 토양이 되었고,

  • 일본에서는 해외 시장·자원 확보를 명분으로 한 군부 주도의 팽창정책이 강화되었으며,

  • 중국에서는 세계공황·은본위제 붕괴·전시 재정난 등이 겹치며 통화불안·인플레이션과 정권 불안정이 심화되었다.


경제사 관점에서 대공황은 다음과 같은 믿음을 남겼다.

자본주의는 본질적으로 불안정하며, 방치하면 주기적으로 심각한 위기를 초래한다.
그러므로 정부가 적극적으로 개입해 경기를 관리하고, 안전망을 제공해야 한다.


이 인식 속에서 루즈벨트의 뉴딜(New Deal) 은 구제·공공사업·금융개혁·사회보장제도 등을 통해 연방정부의 역할과 복지국가의 토대를 대폭 확장했다.(Encyclopedia Britannica)

오늘날 우리가 당연하게 받아들이는

  • 실업급여·연금·사회보장,

  • 경기침체 시 재정지출 확대,

  • 금융규제와 중앙은행의 적극적 역할


은 상당 부분 이 시기의 경험에서 비롯된 것이다.

그러나 프리드먼은 여기서 한 가지 근본적인 질문을 던진다.

대공황은 정말 시장경제의 내재적 실패였는가,
아니면 통화정책에 실패한 중앙은행(연준)의 인재였는가.


이 질문을 이해하려면 먼저 연준이 어떤 배경에서 만들어졌는지 살펴볼 필요가 있다.


2. 1907년 공황과 연방준비제도의 탄생


2-1. 1907년 공황: 예금 지급 제한과 시스템 마비


연준의 기원은 1907년 금융공황(Panic of 1907) 으로 거슬러 올라간다.

1907년 10월, 뉴욕의 신탁회사들을 중심으로 뱅크런이 발생했고 뉴욕증권거래소 주가는 전년 고점 대비 거의 절반 가까이 떨어졌다. 당시 미국에는 중앙은행이 없었기 때문에, 위기 대응은 사실상 민간 금융가와 개별 은행에 맡겨져 있었다.(연방준비제도 역사)

은행·신탁회사들은

  • 예금 지급을 제한하거나 일시 중단하고,

  • J.P. 모건 등이 민간 컨소시엄을 조직해 유동성을 공급하는 방식으로


위기를 간신히 막았다. 단기적으로는 대규모 붕괴를 막았지만, 동시에 결제 시스템과 신용공급을 마비시켜 통화·신용을 급격히 줄이는 효과를 가져왔다. 그 결과 1907~1908년의 경기침체는 당시 기준으로 매우 심각한 실물 불황을 동반했다.(연방준비제도 역사)

이 경험은 금융계와 정치권에 명확한 문제의식을 남겼다.

민간 금융가의 자발적 구조조정만으로는 위기를 막기 어렵다.
국가 차원의 마지막 대부자(lender of last resort) 가 필요하다.


2-2. 1913년 연방준비법과 연준의 설립


이 문제의식은 여러 차례의 조사·논의를 거쳐 1913년 연방준비법(Federal Reserve Act) 제정으로 이어진다.(Investopedia)

이 법에 따라

  • 미국 전역을 12개 구역으로 나눈 연방준비은행(Federal Reserve Banks) 이 설립되고,

  • 워싱턴 D.C.에 연방준비제도 이사회(Board of Governors) 가 설치된다.(위키백과)


연준에 부여된 핵심 기능은 다음과 같다.

  • 발권 기능: 연방준비권(Federal Reserve notes)을 발행해 통화량을 조절

  • 최종 대부자 기능: 일시적 유동성 위기에 빠진 상업은행에 재할인·대출 제공

  • 은행·결제 시스템 감독: 준비금·결제·감독 기능을 통해 시스템 안정 도모


즉, 1907년처럼 예금 지급 제한 → 결제 마비 → 통화 급감 → 실물대공황으로 이어지는 패턴을 막기 위해, 연준은 필요할 때 통화를 공급하고 은행에 유동성을 투입할 법적 권한을 부여받은 것이다.(연방준비제도 역사)


3. 1차 세계대전과 연준의 위상 변화


3-1. 전비 조달과 인플레이션


연준의 위상이 급격히 달라진 계기는 1차 세계대전이다.
미국은 1917년 참전하면서 막대한 전비를 조달해야 했고, 연준은

  • 전쟁채권 판매 지원,

  • 저금리 유지·통화 공급 확대


를 통해 전쟁 재정을 뒷받침하는 중심 기관이 되었다.(HISTORY)


이 과정에서 1910년대 후반 미국 물가는 빠르게 상승했고, 전쟁이 끝난 이후인 1919~1920년에도 인플레이션이 상당 기간 지속되었다는 점이 기록된다.(Encyclopedia Britannica)

이 경험은 두 가지 의미를 갖는다.

  1. 연준이 재정·전쟁정책을 뒷받침하는 통화정책의 핵심 기관으로 자리잡았고,

  2. 전쟁이후 인플레이션을 잡기 위한 긴축 과정에서
    “연준의 결정이 경기·물가를 좌우한다”는 인식이 확고해졌다.

3-2. 벤저민 스트롱과 1920년대의 연준


이 시기의 핵심 인물이 뉴욕 연방준비은행 초대 총재 벤저민 스트롱(Benjamin Strong) 이다.
그는 1914년부터 1928년 사망 때까지 뉴욕 연준을 이끌며, 사실상 연준 시스템 전체의 정책 방향을 주도했다.(위키백과)


프리드먼의 평가에 따르면 스트롱은

  • 경기부양과 긴축의 균형을 맞추며 인플레이션을 억제하려 한 능력 있는 통화관리자였고,

  • 1920년대 연준의 상대적 안정성을 이끌던 핵심 리더였다.


그의 급작스러운 사망(1928년)은

  • 뉴욕 연준과 워싱턴의 이사회,

  • 여러 지역 연준들 사이의 권력 균형 변화를 촉발했다.


이사회는 뉴욕 연준의 영향력을 견제하려 했고, 지역 연준들은 이사회 리더십에 회의적인 태도를 보였다. 그 결과 1920년대 후반의 연준은 분열되고 우유부단한 의사결정 구조로 이행하게 된다.


4. 1929~1933년: ‘대수축’과 연준의 실패


4-1. 주가 붕괴 이후의 초기 대응


1929년 10월 뉴욕 증시 붕괴 이후, 뉴욕 연준은 스트롱 시절에 익숙했던 방식대로

  • 국채 매입 등 공개시장조작을 통해 시중 유동성을 공급하며

  • 금융시장의 충격을 완화하려 했다.


그러나 워싱턴의 연준 이사회와 다른 지역 연준들은

  • 과도한 완화가 투기를 부추길 것이라는 우려,

  • 뉴욕 연준의 영향력 견제라는 정치적 동기 속에서


공세적 완화 정책에 제동을 걸었다.

프리드먼의 표현을 빌리면, 이 시점부터 연준은 점차 “방관적이고 수동적인 통화정책” 으로 후퇴한다.

4-2. 은행 파산과 통화량 1/3 감소 – ‘대수축’


문제의 핵심은 1930~1933년 사이 반복된 은행 파산과 뱅크런이었다.

  • 수천 개 은행이 문을 닫으며 예금이 동결·소멸되었고,

  • 연준은 최종 대부자(lender of last resort) 역할을 충분히 수행하지 못했다.


프리드먼·슈워츠의 계산에 따르면, 1929년 경기 정점에서 1933년 저점까지 미국의 통화량(M2)은 3분의 1 이상 감소했다. 이 기간의 급격한 통화수축은 단순한 경기침체를 넘어, 가격·임금·산출이 동시에 하락하는 대규모 디플레이션 충격으로 작용했다는 해석이 지배적이다.(Encyclopedia Britannica)


프리드먼은 이 시기를 **“대수축(The Great Contraction)”**이라고 부르며, 다음과 같이 주장한다.

대공황은 시장경제의 자생적 붕괴가 아니라,
연준이 은행위기를 방치하고 통화수축을 용인한 결과이다.


4-3. 금본위제의 족쇄와 긴축


여기에 국제 금본위제 체제가 추가적인 족쇄로 작용했다.

  • 1931년 영국이 금본위제를 포기하자,

  • 투자자들은 달러의 금 태환 가능성을 의심하며 금으로 이동했다.(Encyclopedia Britannica)

  • 미국은 금본위제를 방어하기 위해 금리를 인상하고 통화긴축을 선택했다.


금본위제 아래에서 통화당국은

  • 경기침체 국면에서도 금 유출을 막기 위해

  • 금리를 올리고 통화량을 줄이는 선택을 강요받을 수밖에 없다.


프리드먼의 시각에서 보자면,

연준은 금본위제를 유지하기 위해 국내경제를 희생하는 결정을 반복했고,
그 결과 디플레이션과 실업이 한층 심화되었다.

 


5. 뉴딜, 케인즈경제학, 그리고 ‘큰 정부’의 정당화


5-1. 루즈벨트의 뉴딜과 복지국가의 토대


대공황의 정치적 책임을 떠안은 후버 대통령은 1932년 선거에서 루즈벨트에게 패했고,
1933년 출범한 루즈벨트 정부는 뉴딜(New Deal) 을 내세워 대규모 정책 전환에 나선다.


뉴딜은

  • 공공사업 및 고용 프로그램(CCC, WPA, PWA 등),

  • 금융개혁(FDIC 설립, 은행 휴업, 증권규제),

  • 농업·주택 지원,

  • 1935년 사회보장법(Social Security Act) 등을 통해(Encyclopedia Britannica)


미국 연방정부의 역할을 “야간경찰국가(minimal state)”에서 복지국가(welfare state)의 방향으로 크게 확장시켰다.

즉, 대공황은

  • 경기관리(거시경제 안정화)와

  • 최소한의 사회적 안전망 제공이라는 명분 아래


“큰 정부” 모델
을 정당화한 결정적 계기였다.

5-2. 케인즈경제학과 프리드먼의 반론


사상적으로 이 전환을 뒷받침한 것은 케인즈경제학(Keynesian economics) 이다.

  • 유효수요 부족이 장기간 지속될 수 있으며,

  • 이때는 정부의 재정지출과 통화정책으로 수요를 보완해야 한다는 논리가
    대공황의 경험과 결합하면서 주류 거시경제학 패러다임이 되었다.(Encyclopedia Britannica)


프리드먼은 여기서 두 가지를 문제 삼는다.

  1. 대공황의 원인이 시장·민간경제의 구조적 불안정성으로만 해석되었고,

  2. 그 결과 정부·중앙은행 권한 확대가 구조적으로 정당화되었다는 점이다.


그의 논지를 요약하면 다음과 같다.

대공황은 “자유시장 = 위험, 정부개입 = 안전”이라는 이분법을 낳았지만,
실제로는 연준의 통화정책 실패와 제도 설계의 문제가 훨씬 더 중요한 원인이었다.

 


6. 연준 권력의 제도화와 오늘의 논쟁


대공황·뉴딜·제도개편을 거치며

  • 워싱턴의 연준 이사회(Board of Governors)는 지역 연준들에 대한 권한을 강화했고,(위키백과)

  • 연준은 독립적인 통화정책 기구이자, 금융안정·위기대응의 중심기관으로 자리 잡았다.

프리드먼의 비판적 서술을 정리하면 다음과 같다.

  1. 연준은 대공황 시기 최종 대부자 역할을 충분히 수행하지 못해 위기를 대형 참사로 키웠음에도,

  2. 이후 역사에서는

    • 경기확장기에는 자신의 공을 강조하고,

    • 위기 때는 외부 요인 탓을 하는 경향이 강했다.

  3. 그럼에도 연준의 상징·권위, 그리고 정치·경제 체제 내 영향력은 오히려 강화되었다.


물론 오늘날의 연구들은

  • 대공황의 원인을 연준의 실책 하나로 환원하는 것은 과도하다고 보면서도,

  • 연준의 통화 수축과 은행위기 방치가 위기를 극단적으로 심화시켰다는 점에는 상당한 합의를 보인다.(Encyclopedia Britannica)

이 지점에서 다시 현재로 돌아오면,

  • 연준의 독립성 논쟁,

  • 대규모 재정적자와 국채 발행,

  • 구조적 인플레이션의 가능성


이라는 오늘의 쟁점은, 결국 **“국가·중앙은행·시장 사이의 역할 분담을 어디까지 인정할 것인가”**라는, 대공황 이후 100년 넘게 이어져 온 질문의 연장선에 놓여 있다.


맺음말: 다시 프리드먼으로, 그리고 지금의 연준으로


정리하면,

  • 1907년 공황은 “민간이 감당할 수 없는 금융위기 앞에서 누군가는 최종 대부자가 되어야 한다”는 문제의식을 남겼고,(연방준비제도 역사)

  • 그 결과 탄생한 연준은 1차 세계대전, 1920년대, 대공황을 거치며
    재정·통화·금융을 아우르는 핵심 권력기관으로 변모했다.

  • 대공황과 뉴딜
    시장의 실패를 강조하는 방식으로 큰 정부·복지국가·중앙은행 권한 확대를 정당화했다.


프리드먼의 『선택할 자유』는 이 역사를 거꾸로 읽으면서,
대공황을 시장 자체의 실패가 아니라 통화정책 실패가 키운 인재로 해석하고,
오늘날 우리가 너무 당연하게 받아들이는

  • 큰 정부,

  • 복지정책,

  • 독립적인 중앙은행


의 정당성을 다시 묻는다.


여기에 한 가지 개인적인 인상을 덧붙이자면, 연준의 기원 자체가 애초부터 정치적 권력투쟁의 산물이었다는 점이 계속해서 마음에 남는다.

100년 전 연준을 둘러싼 논쟁과 오늘날 연준 인사·정책을 둘러싼 정치적 갈등을 나란히 놓고 보면, 연준이라는 조직이 권력을 둘러싼 정치집단이라는 측면에서는 과거와 지금이 크게 다르지 않다는 느낌을 강하게 받게 된다.

  • 1907년 → “중앙은행이 필요하다”

  • 1930년대 → “큰 정부·복지가 필요하다”

  • 2008년 → “무제한 유동성과 비상대출이 필요하다”

  • 2020년 → “팬데믹 재정·통화 쌍둥이 부양이 필요하다”

매번 위기 → 제도·권한 확대 → 새로운 ‘뉴 노멀’ 이 반복되고,
그 과정에서 “독립적”이라고 불리는 기관(연준)은 계속해서 더 깊이 정치와 시장 사이의 경계에 발을 담그는 구조가 만들어진다.


동시에 과거 연준 의장들의 자서전을 반복해서 읽어볼수록, 그리고 최근에는 앨런 그린스펀의 자서전을 곱씹어볼수록, 

21세기 통화정책 (*벤 버냉키)
The Lord of easy money
The Age Of Turbulence, Alan Greenspan

그들이 구사한 통화정책이 실제 거시경제의 결과에 어느 정도까지 영향을 미쳤는지,
또 어느 지점부터는 정치·시장·우연이 섞인 구조적 결과였는지는 누구나 한 번쯤 던져볼 만한 질문이라는 생각이 든다.

현재 진행 중인 연준 독립성 논쟁, 재정 팽창과 부채 문제, 인플레이션 재부상을 생각하면,
연준의 기원과 대공황의 해석을 다시 뜯어보는 작업은 여전히 현재진행형의 의미를 가진다.

그리고 그 작업은 지금도 계속되는 권력투쟁의 구조를 어떻게 이해할 것인가라는 문제와 직결되어 있다고 느낀다.

2026년을 앞두고 연준의 위상 변화와 독립성 훼손 가능성이 부각되는 만큼, 과거 아서 번스 시기처럼 정치적 압력에 정책이 휘둘리거나 1931~1933년 연준 내부의 권력투쟁처럼 의사결정이 마비되면서 결과적으로 인플레이션 통제에 실패할 시나리오도 배제하지 말아야 한다고 본다.


참고 자료(링크)


=끝

2025년 12월 25일 목요일

생각정리 149 (** 2026년 미국 시나리오-3 원달러 환율)

최근 정부의 시장 개입이 지나치게 확대되고 있다는 인상이 강하다.




특히 원·달러 환율 시장에 대한 개입은, 지금의 선택이 시간이 지난 뒤 어떤 후폭풍으로 돌아올지에 대한 고민이 충분했는지 의문이 든다.

원화의 구조적인 약세가 물가 상승과 내수 경기 위축으로 이어질 수 있다는 점을 고려해 개입에 나섰다는 명분 자체는 이해할 수 있다.

그러나 이 판단이 너무 단기적인 물가·경기 변수만을 바라본 편협한 시각에 기반한 것은 아닌지 되묻게 된다.


이번글은 밀턴 프리드먼의 명언으로 글을 시작해본다. 

“자유보다 평등을 앞세우는 사회는 결국 둘 다 잃는다.
자유를 우선하는 사회만이 자유와 실질적인 평등 모두에 더 가까이 갈 수 있다.”

 


0. 문제의식: 왜 2H26~2027년이 “원화 2차 약세”의 분기점인가


앞선 2편에서 2026년 미국 그림은 한 줄로 정리하면 이렇다.

**“AI 투자와 감세 환급으로 성장·투자는 강하고,
공급 쪽 요인 덕에 물가는 생각보다 버티는 가운데,
금리는 한 번 내리고, 더 높은 바닥(명목 3% 안팎)에서 멈추는 세계”**이다. 


여기에 더해 2H26 이후에는

  • 선거 직후 확장재정 재개 → 재정적자·국채 공급 확대,

  • 연준에 대한 정치적 압력 증가, 독립성 훼손 논란,

  • 점도표 폐지·인플레 타깃 재검토 논쟁 등으로

시장 입장에서 **“미국은 성장은 좋은데, 재정과 통화정책의 신뢰는 오히려 약해지는 나라”**로 보일 수 있다.

이 조합은 미국 금리에 대해 두 가지를 동시에 뜻한다.

  1. r* (중립 실질금리)은

    • AI 투자·잠재성장률 상향 때문에

    • 2010년대(실질 0% 안팎)보다 위로 이동한다.

  2. term premium(장기채에 붙는 위험 프리미엄)은

    • 재정적자·국채 공급·정치 리스크 때문에

    • 2H26~2027년부터 꾸준히 누적·점프될 가능성이 크다.

    • 연준 리포트에서도 최근 미 국채 금리 급등의 상당 부분을 term premium 상승으로 설명한다.



이 말은 곧,

**“미국은 성장도 괜찮고, 장기금리는 r*+term premium 덕분에 3~5%에서 고착되는 세계”**라는 전제가 깔린다는 뜻이다.

 

이 세계에서, 저성장·고령화·빠른 부채 증가·비기축통화·EXIT PLAN 부재인 한국의 원화가 어떻게 보일지를 정리하는 것이 이번 글의 핵심이다.


1. 한국 구조적 디스카운트: 네 가지 축을 한 문장으로 묶으면


앞선 글들에서 이미 얘기했듯, 한국은 네 축이 동시에 문제이다.

  1. 저성장·고령화

    • IMF 2024 Article IV에 따르면 한국의 실질 성장률은
      2024년 2.2%, 2025년 이후 2% 안팎으로 잠재 성장률 수준에 수렴할 것으로 전망된다.
      IMF 2024 한국 연례협의

    • 합계출산율 0.7대, 초고령화 진입 속도가 OECD 최고 수준이라는 점까지 감안하면,
      “예전처럼 높은 성장 프리미엄을 줄 수 있는 나라”는 아니다.

  2. 부채의 “속도”

    • IMF Fiscal Monitor와 이를 인용한 기사들에 따르면,
      한국 일반정부 부채비율은 2020년 45.9% → 2030년 64%대까지 상승할 것으로 예상된다.

    • 비(非)기축통화국 중에서는 향후 5년간 부채비율이 가장 빠르게 증가하는 나라로 지적된다.
      BusinessKorea 기사


  1. 비기축통화국이라는 신분

    • 달러·유로·엔처럼 자국통화로 무제한 차입이 가능한 기축통화국이 아니며,

    • 외국인·신용평가사가 요구하는 통화·금리·재정 규율을 무시하기 어렵다.

    • 같은 60%대 부채라도, 원화에 붙는 위험프리미엄은 달러·엔보다 더 클 수밖에 없다.

  2. EXIT PLAN 부재

    • IMF는 한국에 대해
      “고령화·지정학·기후변화를 감안할 때 연금·재정·구조개혁 로드맵을 명확히 해야 한다”고 반복해서 권고한다.
      IMF Staff Report

    • 그러나 시장이 보기에는
      “10~20년 뒤 이 부채·복지·에너지 구조를 어떤 경로로, 어떤 세금·지출 조합으로 수습할 것인지”가 여전히 안 보인다.

이 네 축을 한 문장으로 압축하면,

**“성장은 둔화되고, 부채는 가장 빠르게 늘고, 통화는 비기축이고, EXIT PLAN은 없다”**는 상태이다.

 

이 조합이 바로 원화와 한국 국채·한국 자산 전체에 붙는 구조적 디스카운트이다.
즉, 이 상태에서 미국이 r*+term premium을 얹은 3~5% 장기금리를 주는 나라가 되면,

**“한국에서 벌어 미국에 쌓는 것이 기본 전략”**이 되는 구조가 고착된다.

 


2. BASE 1,400원: 왜 1,300대는 사실상 시나리오에서 사라졌는가


이 전제 위에서, 원·달러 1,300대를 다시 보자.

  • 과거(고성장·저부채 시절)에는 1,100~1,200원이 “균형 또는 약세”였다.

  • 그러나 지금은

    • 미국은 성장·금리에서 우위,

    • 한국은 저성장·부채·비기축·EXIT PLAN 부재라는 네 가지 디스카운트를 갖고 있다.

이 그림이면 환율이 의미 있게 내려가는 경우는 보통 둘 중 하나이다.

  1. 미국이 크게 나빠지는 경우

    • 미국 경기 후퇴, 연준 대규모 인하, 달러 인덱스 90대 초반 붕괴 같은 이벤트.

    • 즉, “한국이 좋아져서”가 아니라 “미국이 나빠져서” 환율이 내려가는 구간이다.

  2. 한국 쪽에서 구조적 개선 쇼크가 나오는 경우

    • 연금·복지·재정·에너지·AI에 대한 신뢰할 수 있는 EXIT PLAN 패키지,

    • 중장기 성장·인구·전력·재정을 동시에 다루는 “큰 설계도”가 나올 때이다.

현실적으로, 우리 시나리오에서 2번에 해당하는 이벤트는 가능성 자체가 매우 낮다고 깔고 들어가고 있다.

따라서 1,300대는 “좋은 시나리오의 평균”이 아니라, 거의 tail에 가까운 구간이다.

그래서 정리하면,

BASE(중력중심)는 1,400원대,
1,500원대는 미국 term premium 재상승 + 한국 구조리스크 + 정치화된 환방어가 충돌할 때 열리는 스트레스 구간으로 보는 것이 구조적으로 일관된다.

 


3. 시간축으로 겹쳐 보기: 1H26 → 2H26 → 2027~28년


이제 2편에서 정리한 미국 금리 시나리오
지금까지 정리한 한국 구조 디스카운트를 시간축으로 겹쳐 보자.

3-1. 1H26: 숫자는 예쁘다, 원화는 “완화된 약세”


1H26은 미국 입장에서 숫자가 가장 좋아 보이는 구간이다.

  • OBBBA 감세 환급 → 1분기 소비(C) 부스트

  • AI·에너지 CAPEX → 투자(I) 상방

  • 선거 전 확장재정 → 정부지출(G) 플러스

  • 공급발 디스인플레이션 덕에 물가는 3% 안팎으로 내려와 있다.

이 환경에서 연준은

  • 5%대 정책금리를 3%대로 내리는 **1차 인하(정상화)**를 할 여지가 생기고,

  • QT 종료·T-bill 매입으로 유동성 환경을 중립에 가깝게 돌린다.

달러 입장에서는

“성장도 괜찮고, 물가도 내려가고, 금리도 조금 내린다”

 

라는 골디락스 내러티브가 만들어지기 쉽다.

이 국면에서 원·달러를 보면,

  • 2024~25년의 급격한 약세 구간(예: 1,500 테스트)에서
    일부 되돌림이 나오는 것은 자연스럽다.

  • 그러나 그 되돌림은 구조 개선이 아니라
    “미국 금리 정상화+달러 강세 피크 조정”에 따른 기술적 숨고르기에 가깝다.

그래서 1H26 원화는

“강세”라기보다는 “완화된 약세”,
평균 1,400 근처에서 상하로 흔들리되,
구조적 중력은 여전히 1,400대에 있다는 상태
로 보는 것이 타당하다.

 

3-2. 2H26: 확장재정 재개, term premium 씨앗이 심어지는 구간


문제는 2H26부터이다.

2편에서 설정한 것처럼,

  • 선거 직후 확장 재정이 재개되고,

  • 감세·지출 확대로 구조적 재정적자가 다시 커지고,

  • 국채 발행, 대외 불균형, 연준 정치화 리스크가 겹치면,

시장은 다음 질문을 던지기 시작한다.

“미국이 이렇게 계속 빚을 내면서도
장기금리가 3%대 중반에서 고정될 수 있나?”

 

여기서 생기는 것이 term premium 상승이다.

  • 기준금리는 3%대 초반~중반에서 동결되어 있어도,

  • 10년·30년 금리는

    • r*(실질 1% 내외) + 인플레(2~3%) + term premium

    • 4~5%대의 높은 장기금리가 형성될 수 있다.

    • 이 과정은 이미 2023년 미국 국채 금리 급등 때도 부분적으로 경험했다.
      연준 분석 노트

이 시점에서 원화는 두 겹의 압력을 받는다.

  1. 달러 쪽:

    • “성장+높은 장기금리+term premium”을 동시에 제공하는 자산으로서의 미국.

  2. 원화 쪽:

    • 앞서 요약한 저성장·빠른 부채·비기축·EXIT PLAN 부재라는 구조적 디스카운트.

그 결과, 2H26 이후 원화 약세 2라운드가 다시 시작될 수 있다.

  • 1H26에 숨을 돌렸던 환율이

  • 2H26부터는 다시 1,400 상단~1,500원을 향해 기어 올라가는 구조이다.




이때 정부·한은·국민연금의 개입이 본격적으로 “정치화”되기 시작한다.

  • “1,500원은 안 된다”

  • “원화는 구조는 튼튼한데, 시장이 과도하게 투기한다”

  • “시장실패를 정부가 바로잡아야 한다”

는 프레임이 힘을 얻을수록,
개입은 시장실패를 막는 수술이 아니라
정치 프로젝트로 성격이 변한다.

3-3. 2027~28년: term premium 쇼크 + 정부실패 리스크가 동시에 커지는 시기


같은 정책·성장 조합이 2~3년 지속된다고 가정하면,

  • 미국 재정적자·국채 공급 확대,

  • 연준 정치화 논란,

  • 지정학·무역마찰로 인한 대외 불균형,

이 차곡차곡 쌓이면서 **2027~28년에는 term premium 쇼크(장기금리·스프레드 급등 이벤트)**가 한 번쯤 터질 확률이 커진다.

이때 한국은 어떤 상태인가.

  • 성장률은 여전히 2% 안팎,

  • 부채비율은 60%대 중반으로 올라와 있고,

  • 연금·재정·에너지·AI EXIT PLAN은 여전히 가시화되지 않았으며,

  • 2~3년에 걸친 환율 방어전으로

    • 외환보유고·스와프 여력,

    • 국민연금의 환헤지 포지션,

    • 정부·한은의 정책 신뢰까지 소진되기 시작한다.

이 시점에서 1,500원대는 단순한 숫자가 아니라,
다음과 같은 프레임이 되어 있을 수 있다.

“이 레벨을 방어하지 못하면 정권 실패,
방어하면 시장을 이긴 정부”


바로 여기서 1992년 영국 파운드 방어와의 구조적 유사성이 커진다.

  • 영국은 ERM 하단을 정치적 마지노선으로 만들었다가,
    시장과 정면충돌 끝에 정부실패로 귀결되었다.
    영국 파운드 위기 개요

  • 한국도 1,500원을 정책·정치 마지노선으로 삼는 순간,
    제도는 다르지만 **“펀더멘털이 불리한 쪽이 환율 방어를 떠안는 구조”**가 닮아간다.

이 구간에서의 핵심 위험은

**“시장실패를 바로잡겠다며 시작한 개입이
정부실패(연금손실·보유고 소진·정책신뢰 붕괴)로 전환되는 시점”**이다.

 


4. 시장실패 vs 정부실패: 어디까지가 정당한 개입인가


환율 개입이 항상 나쁘다는 이야기는 아니다.
문제는 무엇을 시장실패로 정의하느냐이다.

  • 단기 패닉·유동성 부족으로
    환율이 짧은 시간에 5~10% 튀는 상황은
    정부·한은·공적부문의 개입으로 완화할 정당성이 있다.
    → 이 경우 개입은 “가격 수준”이 아니라 “속도·변동성”을 조정한다.

하지만 지금 우리가 가정한 세계에서는,

  • 미국의 r* 상향,

  • term premium 누적,

  • 한국의 구조적 디스카운트(저성장·부채 속도·비기축·EXIT PLAN 부재)가
    같이 움직이고 있다.

이 경우 원·달러 1,400~1,500원대는

“시장이 잠시 미친 가격”이 아니라,
**“미·한 구조 격차와 한국 구조적 디스카운트를 가격으로 반영한 결과”**에 가깝다.

 

이 구조적 변화를

“시장실패”라고 부르며
공적 자금·연금·보유고로 억누르기 시작하는 순간,

 

이제부터는 시장실패가 아니라 정부실패 리스크가 핵심이 된다.

1992년 영란은행의 교훈은 간단하다.

**“펀더멘털이 허용하지 않는 환율 레벨을
시장실패라는 이름으로 고정하려 들면,
시장실패보다 더 큰 정부실패가 터질 수 있다”**는 것이다.

 

한국도 같은 질문을 스스로에게 해야 한다.

  • 1,500원이 정말로 **“시장의 오류”**인가,

  • 아니면 **“한국 구조적 디스카운트와 미국 term premium가 반영된 새 레벨”**인가.




전자를 전제로 정책을 짜면,
개입은 영국식 “파운드 방어”와 닮아갈 수밖에 없다.


5. 정리: 이 시나리오에서 원·달러 환율은 어떻게 흘러가는가


이제 전체 시나리오를 한 번에 정리해 보겠다.

  1. 미국

    • AI 투자·감세 환급·확장재정 덕분에
      성장은 2010년대보다 높은 레벨을 유지한다.

    • r*는 생산성·잠재성장률 상승으로
      실질 0% → 1% 안팎으로 상향되고,

    • 2H26 이후 재정적자·국채 공급·정치 리스크로
      term premium이 누적·재상승한다.

    • 이로 인해 미국 10년·30년 금리는
      명목 3~5%대에서 고착되는 고금리 구조가 된다.

  2. 한국

    • 성장률은 2% 안팎,

    • 일반정부 부채는 비기축국 중 최고 속도로 증가,

    • 비기축통화, EXIT PLAN 부재라는
      구조적 디스카운트를 안고 있다.

    • 이 구조에서 원화는
      **“성장도, 이자도 미국보다 못 주는 통화”**가 된다.

  3. 환율

    • 1H26에는 연준 1차 인하·디스인플레이션 덕분에
      원·달러가 잠시 숨을 고를 수 있으나,
      이때도 중력중심은 이미 1,400원대에 가깝다.

    • 2H26 이후 확장재정·term premium 누적,
      한국 구조 디스카운트 지속,
      정치화된 환방어가 겹치면서
      원·달러 1,500원대가 열리는 2차 약세 국면이 재개될 수 있다.

    • 정부·한은·국민연금의 개입은
      방향(약세) 자체를 바꾸기보다,
      1,500원 이상으로 가는 속도와 타이밍을 늦추는 역할
      에 그칠 가능성이 크다.


  1. 정책 리스크

    • 이 과정에서 환율이
      “시장 가격”이 아니라 “정권 성적표”로 소비되면,
      개입은 시장실패 방어가 아니라 정부실패 리스크로 바뀐다.

    • 1992년 영란은행처럼 단 하루에 붕괴하는 드라마는 아닐 수 있지만,
      **“느리게 진행되는 블랙 웬즈데이”**에 가까운 시나리오로 수렴할 위험이 있다.

마지막 문장으로 압축하면 이렇게 쓸 수 있다.

AI·감세·확장재정 덕분에 미국은 r*와 term premium을 동시에 위로 끌어올리는 나라가 되는 반면, 저성장·부채·비기축·EXIT PLAN 부재 속에 한국은 구조적 디스카운트를 피하지 못하는 나라가 된다. 

이 조합이 계속되는 한, 원·달러 환율의 BASE는 1,400원대에 고정되고, 2H26 이후 재정적자와 term premium 재상승, 정치화된 환율 방어가 겹치는 시점마다 1,500원대가 열리는 2차 약세 국면이 반복될 수 있다. 

그때도 환율 수준을 일방적으로 시장실패로 규정하며 정부가 개입을 이어 간다면, 문제의 초점은 약한 원화가 아니라 시장실패를 교정하려다 오히려 정부실패를 초래하는 구조로 옮겨가며, 그 과정에서 한국 자산과 원화에 대한 구조적 디스카운트 요인만 더 강화될 것이다.

 

=끝