1) HBM
SEC이 납품하고 있다는 HBM은 중국, AMD, ASIC 향 일부일 것으로 사료되며, 수율도 높지 않아 마진율도 그닥 좋지 않을 것으로 판단된다.
24.11월 NVIDIA향 HBM3E 납품이 시작된다손 치더라도 DGX H100, H200 일부일 것으로 사료되며, 그 물량도 많지 않을 것으로 사료된다. (아래 그림 25년 HBM rev 참고)
8단/12단으로 쌓긴 쌓아도, 본딩 수율이 제대로 잡히지 않고서는 수익으로 바로 연결될리도 만무하고, 1a base로 쌓은 HBM 성능이 1b base로 쌓은 경쟁사 HBM 성능만큼 나올리는 만무하지 않나 싶다.
즉, SEC의 HBM은 NVIDIA의 메인제품에 들어가기엔 아직도 너무 시기상조이며, DGX H100,H200에 들어간다손 치더라도 25년엔 해당 시장은 매우 작아져있을 것으로 사료되기에 HBM3E 퀄 통과가 크게 의미가 있지 않을 것으로 본다
무엇보다 HBM3E 매출비중이 늘어난다는 것도, 분모(HBM2-3)가 줄어들면서 자연스래 HBM3E 매출비중이 늘어나는 것일수도 있어, 듣는 사람으로 하여금 의도적으로 오해를 불러일으킬 수 있는 말장난이 아닌가 싶었다.
2) 그렇다면 SEC가 발표한 1c HBM4를 1H25에 성공시킬 수 있을까?
결론부터 말하면 불가능에 가깝지 않나 싶다.
기사에 따르면, SEC는 1a full layer revision을 하겠다고 한다. 이는 기존의 마스크를 싹 갈아버리겠다는 의미로, 상부 메탈 몇개만 바꾸는게 아니라, 최하부층까지 아예 싹 갈아엎겠다는 뜻이라고 한다.
개발된지 2년이 지난 제품을 이렇게 대대적으로 갈아엎겠다는건 그만큼 문제가 심각하다는 뜻이 아닐까 하며,
무엇보다 1a를 갈아엎는동안, 수율도 깨질뿐 아니라, 퀄도 다시 받아야하는 비용이 수반되지 않을까 한다.
SEC의 1b는 애초에 HBM용이 아니니, 어쩔 수 없다 치더라도,
1) 1a 문제를 해결하면서
2) 단번에 1c까지 성공하고
3) 동시에 HBM4본딩 수율을 잡아 퀄 테스트를 받고 양산까지 6개월만에 성공하겠다..?
1) 1a 문제를 해결하면서
2) 단번에 1c까지 성공하고
3) 동시에 HBM4본딩 수율을 잡아 퀄 테스트를 받고 양산까지 6개월만에 성공하겠다..?
상식적으로 가능한건가 싶다.
그간의 Commodity성 메모리 시장에서도 SEC 제품 성능은 타사 대비 열위였지만, 가성비가 좋아 사용되다가 ai boom이 터져 제품성능이 가격보다 중시되는 시장이 열리면서, 모든 문제가 수면위로 드러난게 아닌가 싶었다.
수율에 영향을 미치는 라인당 계측, 검사장비 수도 SEC는 타사대비 현저히 적다는 말도 들렸었다..
그만큼 SEC는 제품의 성능을 높이기 보다는 CAPA를 늘려 원가를 낮추는 등 최대한 원가절감에 모든 Focusing이 맞춰져 있었으며, 미래 기술을 위한 R&D(=HBM) 비용까지 절감하는 지경에 이른게 아닌가 싶었다.
HBM4 관련해 HBM4 상품이 전반적으로 커스터마이징화 될 예정이라고 한다. HBM의 최하단에 위치하는 BASE DIE 요구사항이 고객사마다 달라져, BASE DIE의 중요성이 올라가고 제품차별화가 더욱 가속화될 예정이라고 한다. SEC는 이러한 BASE DIE 제작을 SEC 내 파운드리를 고집하지 않고 TSMC로 이관할 것임을 암시했다고 하니, 스스로 파운드리의 역량을 인정한게 아닌가 싶기도 하다.
2) 삼성의 파운드리는 왜 망했는가?
이번 TSMC 파운드리를 공부하면서 느낀거지만, 파운드리의 핵심경쟁력은 순수 Try & error로 실제로 현장에서 여러 장비 셋팅 값들을 변수에 따라 맞춰가며 최적의 수율을 잡아가는 엔지니어들의 순수역량이지 않을까 했다.
반도체 공정은 크게 8대 공정이 있다고는 하지만,
실상 세부공정별로 보면 한 공정당 수십 ~ 수백공정까지 더 나온다고 한다.
실상 세부공정별로 보면 한 공정당 수십 ~ 수백공정까지 더 나온다고 한다.
또한 한 공정에서 제어해야 할 파라미터(=변수)값들도 수십가지라고 하며,
웨이퍼 위의 die가 중앙이냐 아니면 외곽이냐에 따라 색상 산화막 등 편차도 따로 있어 관련해 장비 내 셋팅 값을 또 따로 설정해줘야 한다고 한다.
이렇듯 공정 엔지니어들은 수많은 변수들을 조정해가며 데이터의 경향성을 보면서 하나의 양산제품을 만들기 위해 수많은 DOE(Design of Experiment)를 해야 한다고 한다.
엔지니어들은 Wafer를 들고 여기저기 공정에 돌아다니면서, 샘플을 넣어 검증하고, 그 와중에 이슈가 생기면 불려가서 꾸중듣고 또 다시 샘플 테스트를 하는 등, wafer 갈아(?)가며 try & error로 장비 내 변수를 조정해가며 최적의 수율을 잡아가야 한다고 한다. 그 과정에서 엔지니어들의 노하우, 역량이 쌓이며, 파운드리 산업의 경쟁우위를 만들어나가는 것이라고 한다.
이렇게 고려해야할 변수 값이 무한대에 가깝기 때문에, 자동화는 거의 불가능하고,
자동화 시도 과정에서 엔지니어들은 얼마 못버티고 또 갈려나간다고 하니,
기술, 자본, 인력 모든 것이 있다고 해도 시간과 노하우가 충분히 축적되지 않으면 성공할 수 없는 biz model이지 않을까 했다.
즉, 소수의 천재의 혁신이 모든 것을 바꾸는 게임이 아닌,
수천, 수만명의 엔지니어들이 한마음 한뜻으로 현장에서 오랜기간 쌓아온 손맛(?), 노하우가 하나씩 차근차근 쌓여, 하나의 완성품을 만들어내는 제조업 장인 마인드를 갖춘 플레이어가 독식하는 게임이지 않을까 했다.
또한 TSMC는 3Q24 실적발표에서 AIML를 활용해 생산성, 효율성, 속도, 품질을 향상시켜 1%의 생산성을 향상(약 10억달러)시켰다고 하니, AI을 활용해 파운드리 산업에서의 경쟁우위를 더욱 견고히 다져나가고 있다고 한다.
또한, SEC 파운드리는 경쟁사 대비 절대적인 인력수도 엄청난 차이가 날 뿐 아니라,
삼성 내부 파운드리 조직 엔지니어들은 1) 실패=해고 문화 +2) 원가절감 목표가 1순위였으므로 try&error를 시도해볼 수도 없었기에 wafer를 원없이 마음껏 갈아(?)보는게 그들의 꿈이었다고도 한다.
또한, SEC는 소수의 핵심인력이(=핵인) 경쟁사로 유출됐을 때의 피해를 최소화 하기위해 부서간의 정보를 공유하지 않는걸로 유명했다고 한다.
그렇기에 공정간의 정보가 제대로 공유되지 않아 수율을 잡는데도 어려움이 있지 않았나 싶고, 실패의 원인을 다른 부서로 떠넘기는 부서이기주의(?)가 만연해있지 않았나 싶다.
이미 관료화되어 버린 SEC 내 임원들은 자리보존을 위해 개발에는 관심이 없고, 임기 내에 성과를 보여주기 위해 아래 실무직원들에게 계속 압박을 가하며, 거짓보고를 종용하지 않았나 싶고, 이렇게 거짓보고가 지난 10년간 누적되어, 거짓보고가 다른 거짓보고를 낳으며, 사내에는 어디까지가 거짓된 자료인지 구분도 안되는 지경에 이르게 된게 아닌가 싶다.
돌이켜보면, SEC에서 임원으로 승진하기 위해서는 무조건 해외박사과정이라는 학위가 있어야 한다고 하며 이는 아직 학연, 학벌을 우선하는 사내승진 시스템이 인사체제에 내재되어 있다는 것이다. 무서운 점은 이는 실질적인 사내성과, 도덕성이 결여되어 있는 인사체제로, 거짓보고가 만연하게 된 원인이 되기도 했지 않나 싶다.
7nm, 5nm, 3nm, 2nm 미세화가 진행됨에 따라 무어의 법칙이 한계에 부딪히고, 그간 중시됐던 회로설계, 개발보다는 그간 (한국에서) 상대적으로 덜 중시됐던 공정설계, 현장 엔지니어의 역량이 중시되기 시작되면서, SEC의 그간의 여러 문제점과 부실이 드디어 수면위로 드러난게 아닌 싶었다.
해외 타사처럼 해외박사과정, or 유명 석사과정을 밟고 입사해서 생산직 공정 관리자에게 꾸중을 들어가며, wafer sample test를 고개숙이며 여러번 부탁하고, 문제가 생기면 주말이건 밤이건 불려나가 될 때까지 계속 단순반복작업을 할 수 있는 엔지니어 기업문화가 우리나라에 있을까 싶기도 하며, 생산직, 공정에서 노하우를 쌓아온 현장 엔지니어에 대한 존중, 우대 문화가 한국에 있을까 싶기도 하다.
3) 신뢰
해당임원이 거짓을 말하는 것인지, 거짓된 보고가 올라가도 이걸 눈치채지 못하고 그대로 전 국민, 전 세계인 앞에서 공표하는 것인지 알 수는 없지만, 그간 SEC가 말한 내용에는 앞뒤가 맞지 않는게 참 많아 더 이상 신뢰할 수 없는 기업이 되버린 느낌이다.
대표적으로 삼성 파운드리 기술력은 TSMC에 밀리지 않는다는 발표 이후, 삼성 파운드리를 찾는 고객이 없어 P2,P3 라인 추가 셧다운이 발표되며,
심지어 놀고 있는 파운드리 EUV를 Memory 사업부로 이관한다는 발표까지 났었다.
앞서 언급했듯, 상식적으로 가능하지 않은 목표를 내세우며, 계속해서 NVIDIA 향 퀄테스트를 통과했다는 식의 발표도 더 이상 그 누구도 믿지 않는 눈치이다.
#투자전략
SEC가 이대로 무너진다면, SEC와 경쟁관계에 있어왔던 AI BOOM에 수혜를 받는 기업을 사는게 하나의 전략이 되지 않을까 싶다.
아쉬운점은 SKH의 HBM Value chain은 사실상 한국에 거의 없다고 한다.
위는 COWOS의 주요 재료와 공급업체 리스트인데, 백엔드 패키징 재료의 90% 이상은 일본기업이 생산하고 있으며, 일부 일본소재 제조업체들은 그 수요를 따라갈 수 없을 정도라고 한다.
아래는 SKH 체인 일본 어드반테스트 CY 3Q24 실적발표 전후 I/S추정치인데, SKH-TSMC-NVIDIA CHAIN에 실질적인 수혜를 받으며, 관련 검사장비 수요가 폭발하는 것을 볼 수 있다.
(25E,26E DRAM, SoC 사업부 숫자 변화)
<before>
다음은 어드반테스트의 경쟁업체 미국의 테라다인 I/S인데, 테라다인은 주로 Micorn의 밸류체인이라고 한다. 테라다인은 어드반테스트과 달리 HBM 장비 수요가 올해가 피크라고 암시했다고 하니, 관련해서 추정해보면, 어드반테스트가 해당 시장에서의 M/S를 늘려오고 있음을 알 수 있으며, 이는 곧 SKH가 타사대비 빠르게 HBM 시장에서 치고 나가고 있음을 유추해 볼 수 있다. (M/S 58% 이상)
하고싶었던 말은 국내에서 AI BOOM에 올라탈 수 있는 기업은 SKH 밖에 없지 않을까 싶었다. 관련 국내 장비체인에서는 SKH의 고객사 다변화전략으로 부가가치가 낮아지며, 그만큼 SKH의 이익으로 귀결되지 않을까 싶었고,
NVIDIA에서 치열하게 경쟁시키고 싶은 SKH-SEC-MICORN 경쟁은 아직까지 SKH의 우위로 귀결되고 있지 않나 싶었다.
#Inferencing
CHATGPT o1의 추론능력이 대폭 올라간 뒤로 S/W AI APP 시장 개화가 본격화되지 않나 싶었다.
o1 출시 이후 급격히 올라간 LLM 추론성능 덕에 서비스나우, 세일즈포스, 아틀라시안 컨콜을 들어보면, 회계, 재무, CRM 분야에서 빠르게 자동화가 이뤄져 관련 수요가 빠르게 올라왔다고 한다.
2014년 초기 클라우드 시장이 급격하게 성장하기 시작했을 때보다, 혹은 2000년 초기 인터넷이 보급되기 시작했을 때보다 초기 성장, 수익지표는 AI가 월등하다고 한다.
하지만, 아직 10B$이 넘는 AI APP은 전무후무인 상태이다.
아래는 글로벌 IB에서 추정한 서버시장인데, 개인적으로 Inferencing 시장이 아직 과소추정되어 있는 감이 없지 않다.
구글에 따르면, 지난 6개월동안 추론처리시간이 50%, 운영비용이 72% 감소했다고 하며, OPENAI에 따르면, 지난 1년간 추론비용은 약 10배가 감소했으며, GPT-4o mini는 GPT-3 비용의 약 2%에 불과할 정도로 빠르게 비용이 감소했으며 이같은 경향은 지속되고 있다고 한다.
다음은 최근 빅테크 3Q24 실적발표에서 추론과 관련해 흥미로운 문구들이 나왔었다.
1) Gemini의 API 호출이 14배나 증가했다는 언급과 함께
2) Microsoft 사의 현재 추론의 수요가 너무 많아 일부 외부수요를 외면했었어야만 했다는 언급,
3) Amazon사도 MS와 비슷한 현재 클라우드 수요가 너무 많아 용량이 부족하다는 언급과 함께, 특히 추론측면에 관련 구현확장 비용이 너무 높아 자체 ASIC 제작을 서두르고 있다는 언급도 있었다.
금번 실적발표 MS의 azure capex 대비 rev 지표를 추정해보면, 확실히 초기 azure cloud 시장보다 수익성지표가 더 빠르며, AI 수익화가 상당히 진전되고 있음을 알 수 있다.
Training에서 inferencing으로 넘어가면서, 전성비 측면에서의 자체제작 ASIC의 중요성이 GPU보다 올라가는 상황으로 사료되며 (Broadcom, Mavell),
데이터주권, edge datacenter 수요 증가와 맞물려 분산형 데이터센터 수요에 따라 ai 네트워킹 장비 수요도 오르고 있다고 하며, 이에 따라 테스트 강도, 시간이 늘어나며 관련 테스트장비 수요도 늘어날 예정이라고 한다. (=advantest, teradyne)
무엇보다 ai inferencing의 개화로 ai app 생태계가 활성화된다면, on device 시장의 개화 또한 기대해봄직하다.
또 다른 재밌는 문구는 이번에 좋은 실적을 발표한 Cadence Design system 실적발표에서 볼 수 있었다. cadence는 지난 2년 전에 데이터센터에서 일어났던 일이 똑같이 현재 자동차(=자율주행), 로봇, 드론과 같은 물리적인 AI 칩 시장에서도 나타나고 있다고 언급하며, 2년전 데이터센터에서 시작된 AI 확산 물결이 현재 엣지 디바이스인 노트북, 휴대폰 칩 시장으로 확장(?)되고 있다고 한다.
HPC의 넘쳐나는 수요로도 벅찬 3nm, 2nm 선단공정이 edge device까지 얹혀지면, 물리적으로 공급적체 현상은 더욱 심해질 것으로 사료되며,
관련해서 TSMC는 정말 마음껏 2nm, 3nm 가격을 올려 최고의 전성기를 누리지 않을까 하며,
TSMC의 선단공정을 우선적으로 쓸 수 있는 Apple, Broadcom, Nvidia 제품 또한 가격을 올려받지 않을까 하며, 관련 후발주자들과의 격차는 더 벌어지지 않을까 싶다. (영원한 2인자 AMD)
관련해서 Nvidia 후발주자 AMD는 항상 공급망 불안(TSMC의 선단공정 접근가능성)에 대해 질문공격(?)을 받곤한다.
ai app 생태계가 펼쳐지며 혹여라도 killer content가 나와 handset 교체시기가 도래한다면, device간의 성능차이가 더욱 두드러질 것이며, SEC의 갤럭시를 포함한 중화권 Smartphone과 apple 간의 M/S가 다시 벌어지지 않을까 망상에 빠져본다 (=apple, arm)
최근 Chip 검사장비 업체들의 실적 발표이후 sell on 매물이 나왔지만, (좀 더 넓게) 2nm 3nm mono-chip에서의 물리적한계로 인한 multi-die chip chiplet 시장으로의 전환 방향을 보면, 검사장비의 역할은 더욱 강화되지 않을까 싶다.
선단공정으로 전환, 고급패키징으로의 전환이 가속화되면서 칩의 가치가 점차 올라가며, 실패비용 또한 비례해서 올라가 수율이 점차 중요해지며, 검사장비의 역할이 중요해지고 있다고 한다.
예시로 과거에는 가치가 그렇게 높지 않아 검사 공정강도가 약했던 시장에서도 (대표적으로 HBM) 검사장비 수요가 오르고 있다고 하며 첨단패키징 시장에서도 동일한 로직이 적용되고 있다고 한다.
현재 유휴 상태인 일부 SoC tester는 hpc tester로 전환되서 사용되고 있다고 한다. ai app 활성화로 인한 hadnset 교체수요로 인한 SoC tester 수요가 되살아난다면, 검사장비 시장도 한번 더 ai boom을 누려볼 수 있지 않나 싶다.
이번에 런칭하는 우리회사의 해외펀드가 잘 되길 바래본다.
댓글 없음:
댓글 쓰기