「AI+HW 2035: Shaping the Next Decade」

AI 성능이 고도화될수록 난해한 논문도 쉽게 풀어 번역하고 설명할 수 있게 되었으며, 이에 따라 나와 같은 전문지식이 없는 일반인들 또한 이러한 자료에 한층 수월하게 접근할 수 있게 되었다는 점에서, 참으로 좋은 시대를 살아가고 있음을 다시금 실감하게 된다.

개인적으로 카이에 De market 텔레그램 채널에 언제나 많은 도움을 받고 있으며, 감사함을 느낀다.

https://m.blog.naver.com/cahier/224214389070

AI+HW 2035: 앞으로 10년의 AI와 반도체는 어떻게 바뀌는가

1) 이 논문이 말하는 핵심 한 줄

지금까지는 AI 모델은 따로 발전하고, 반도체와 시스템은 그 뒤를 쫓아가는 방식이었다. 그런데 이제는 이런 방식이 한계에 도달했다는 것이 논문의 출발점이다. 앞으로는 “더 큰 모델, 더 많은 연산”만으로는 안 되고, 같은 전력으로 더 많은 지능을 내는 방향, 즉 에너지 효율 중심의 AI로 패러다임이 바뀌어야 한다는 주장이다. (arXiv)

2) 왜 이런 논문이 나왔는가

논문은 지금 AI 산업이 겉으로는 빠르게 발전하는 것처럼 보이지만, 내부적으로는 매우 비효율적인 구조 위에 서 있다고 본다.

쉽게 말하면 이렇다.

오늘의 AI 알고리즘은 어제의 컴퓨터 구조에 맞춰 설계된다.
반대로 내일 나올 칩은 오늘 유행하는 모델에 맞춰 설계된다.
그러다 보니 둘 사이의 타이밍이 계속 어긋난다. (arXiv)

그 결과, AI는 점점 더 많은 전력을 먹고, 더 많은 메모리와 대역폭을 요구하며, 데이터센터 전력 수요는 국가 단위와 비교될 정도로 커진다. 논문은 이런 흐름을 환경적으로도, 경제적으로도 지속 불가능한 상태라고 진단한다. (arXiv)

3) 논문이 말하는 가장 중요한 개념: “더 똑똑한 AI”보다 “더 효율적인 AI”

이 논문에서 가장 중요한 표현은 “intelligence per joule”, 즉 전력 1줄당 얼마나 유의미한 지능을 만들어내는가이다. 저자들은 앞으로 AI 경쟁의 기준이 단순히 “누가 더 큰 모델을 만드느냐”가 아니라, 누가 더 적은 에너지로 더 많은 성능을 내느냐로 바뀌어야 한다고 본다. (arXiv)

쉽게 풀면 다음과 같다.

예전 방식:

파라미터를 더 키운다
데이터센터를 더 짓는다
GPU를 더 붙인다

앞으로 필요한 방식:

데이터를 덜 움직이게 설계한다
메모리와 연산을 더 가깝게 붙인다
모델 자체를 더 작고 영리하게 만든다
하드웨어와 소프트웨어를 한 몸처럼 같이 설계한다 (arXiv)

4) 병목은 “연산”이 아니라 “데이터 이동”이라는 주장

논문은 오늘날 AI 시스템의 가장 큰 병목이 계산 자체보다도 데이터를 옮기는 비용이라고 강조한다. 즉, 칩이 계산하는 것보다 메모리에서 데이터를 가져오고 보내는 과정이 더 많은 에너지와 시간을 먹는다는 뜻이다. 이른바 memory wall 문제이다. (arXiv)

그래서 저자들은 앞으로 중요해질 방향으로 다음을 제시한다.

메모리 중심(memory-centric) 아키텍처
3D 적층(3D integration)
compute-in-memory / near-memory
이기종 통합 시스템 (arXiv)

쉽게 말하면,

“연산 장치와 저장 장치를 멀리 떨어뜨려 놓고 왔다 갔다 시키지 말고, 가능한 한 붙여서 처리하자”는 것이다.

5) 모델도 바뀌어야 한다: 무조건 큰 LLM이 답은 아니다

이 논문은 “하드웨어만 좋아지면 해결된다”는 생각도 부정한다. 반대로 모델 구조 자체도 더 효율적으로 바뀌어야 한다고 본다. 예를 들어,

더 작은데 성능이 좋은 모델
저정밀도 연산을 잘 활용하는 모델
중복을 줄인 모델
sparse, low-rank, state-space 같은 대안적 구조
테스트 시 계산량을 효율적으로 조절하는 방식

등이 중요해진다고 본다. (arXiv)

즉, 미래의 AI는
“무조건 거대한 범용 모델 1개”가 아니라
작고 빠르며, 용도에 맞게 특화된 모델들의 조합으로 갈 가능성이 크다는 뜻이다. 특히 엣지 기기나 로봇, 산업장비처럼 전력 제약이 큰 환경에서는 이런 방향이 더 중요하다고 본다. (arXiv)

6) 학습(training)과 추론(inference)은 완전히 다른 문제다

논문은 많은 사람들이 AI를 한 덩어리로 보지만, 실제로는 학습과 추론이 요구하는 시스템 조건이 근본적으로 다르다고 강조한다.

학습은 대규모 처리량, 정확도, 긴 시간에 걸친 총비용 최적화가 중요하다.
추론은 특히 물리 AI에서는 짧은 지연시간, 예측 가능한 응답, 낮은 전력 소모, 안전성이 훨씬 더 중요하다. (arXiv)

쉽게 말하면,

데이터센터에서 몇 주 동안 학습시키는 문제와
로봇이 0.1초 안에 판단해서 움직여야 하는 문제는

완전히 다른 성격이라는 뜻이다.

그래서 미래 시스템은 “학습용 AI 인프라”와 “실시간 추론용 AI 인프라”를 다르게 설계해야 한다고 본다. (arXiv)

7) 이 논문이 특히 주목하는 미래: “물리 AI”

논문에서 매우 중요하게 다루는 부분이 Physical AI이다. 이는 단순히 화면 속 텍스트를 다루는 AI가 아니라, 현실 세계에서 보고, 판단하고, 움직이는 AI를 뜻한다. 예를 들면 다음과 같다.

로봇
자율주행
산업 자동화
과학 실험 자동화
실시간 제어 시스템 (arXiv)

저자들은 앞으로 실제 세상에서 발생하는 대부분의 추론은 이런 물리 AI 환경에서 일어날 가능성이 크다고 본다. 이 영역에서는 성능만 좋다고 되는 것이 아니라,

전력 효율
발열
응답 시간
안정성
신뢰성

이 전부 중요하다. 그래서 물리 AI야말로 AI+HW 공동설계의 필요성이 가장 크게 드러나는 분야라고 말한다. (arXiv)

8) 단지 칩을 잘 만드는 문제가 아니라, “전체 스택”을 다시 설계하자는 주장

이 논문은 반도체 논문처럼 보이지만, 사실은 칩만 이야기하지 않는다. 저자들은 소재-소자-칩-패키징-시스템-컴파일러-런타임-모델-응용까지 전부 한 덩어리로 봐야 한다고 주장한다. 어느 한 층만 개선해서는 1000배 효율 향상이 불가능하다는 것이다. (arXiv)

즉, 미래 경쟁력은 단순히

좋은 GPU를 만드는 회사,
혹은
좋은 모델을 만드는 회사

한 군데에서만 나오지 않는다.

오히려 모델, 시스템, 컴파일러, 메모리 구조, 네트워크, 전력·냉각 설계까지 동시에 맞물리는 생태계 전체가 중요해진다는 메시지이다. (arXiv)

9) 신뢰성과 안전성도 성능만큼 중요해진다

논문은 미래 AI 시스템을 평가할 때 더 이상 “정확도만 높으면 된다”는 기준으로는 부족하다고 말한다. 앞으로는 다음의 균형을 함께 봐야 한다는 것이다.

정확도
강건성(robustness)
에너지 효율
지연시간
설명 가능성
지속 가능성 (arXiv)

특히 AI가 반도체 설계, 공장, 로봇, 인프라, 과학 연구처럼 실제 시스템에 들어갈수록 오류를 내도 되는 AI가 아니라 검증 가능하고 신뢰할 수 있는 AI가 필요해진다. 이를 위해 논문은 형식 검증, 물리 제약 반영, 런타임 모니터링 같은 접근이 중요하다고 본다. (arXiv)

10) 산업과 사회에 어떤 변화가 오나

논문은 AI+HW 공동설계가 단지 속도를 조금 높이는 수준이 아니라, 지금은 비용과 전력 때문에 불가능한 새로운 응용을 열 것이라고 본다. 예를 들어

더 똑똑한 설계 자동화
더 빠른 연구개발 사이클
공급망 최적화
제조 자동화
자율 시스템
과학 발견 가속

같은 변화가 나타날 수 있다고 본다. (arXiv)

즉, 이 논문은 “AI 반도체를 잘 만들자” 정도의 얘기가 아니라,
AI와 컴퓨팅 인프라를 다시 짜면 산업 생산성 전체가 재편될 수 있다는 큰 그림을 제시한다.

11) 저자들이 생각하는 2035년의 성공 기준

논문이 제시하는 10년 뒤 성공의 모습은 꽤 분명하다.

AI 학습과 추론 효율 1000배 향상
클라우드, 엣지, 물리 AI를 끊김 없이 연결하는 에너지 인지형 시스템
소수 초대형 기업만이 아닌 더 넓은 주체들이 접근 가능한 AI 인프라
인간 중심 원칙이 내장된 지능형 시스템 (arXiv)

이 목표를 요약하면,
“더 거대한 AI”가 아니라
더 널리 쓰이고, 더 싸고, 더 안전하며, 더 지속 가능한 AI를 만들자는 것이다.

12) 이 논문이 정부·학계·기업에 요구하는 것

논문은 기술 제안에서 끝나지 않고, 정책과 협력 구조까지 강조한다. 저자들은 다음이 필요하다고 본다.

국가 차원의 장기 AI+HW 이니셔티브
공유 가능한 컴퓨팅 인프라
학계-산업계-정부의 장기 협력
인력 양성
공공-민간 파트너십 강화 (arXiv)

핵심은 이렇다.
이 문제는 어떤 한 기업이 혼자 해결할 수 있는 문제가 아니라, 국가 차원의 산업·기술 전략으로 접근해야 한다는 것이다. 워크숍 소개 페이지도 이 보고서가 AI와 하드웨어 공동설계를 위한 10년 비전과 실행 과제를 만드는 목적에서 출발했다고 설명한다. (publish.illinois.edu)

아주 쉽게 요약하면

이 논문은 사실상 다음 말을 하고 있다.

“앞으로 AI의 승부는 모델 크기가 아니라, 전력·메모리·시스템까지 포함한 총체적 효율의 승부가 된다.”

조금 더 풀어쓰면,

이제 GPU만 더 사서 해결하는 시대는 한계에 가깝다.
데이터 이동 비용과 전력 문제가 진짜 병목이다.
그래서 모델, 칩, 메모리, 패키징, 시스템 소프트웨어를 함께 설계해야 한다.
특히 로봇, 자율주행, 산업자동화 같은 물리 AI 시대가 오면 이 문제가 훨씬 더 중요해진다.
결국 미래 AI 경쟁력은 **“누가 더 큰 모델을 만들었는가”**보다
**“누가 더 적은 전력과 더 낮은 비용으로 현실 세계에서 잘 돌아가는 지능 시스템을 만들었는가”**로 옮겨간다. (arXiv)

한 문단으로 다시 쓴 초압축 재작성본

이 논문은 앞으로 10년의 AI 경쟁이 단순한 모델 확장이 아니라 AI와 하드웨어를 처음부터 함께 설계하는 능력에 달려 있다고 본다.

지금까지는 더 큰 모델과 더 많은 연산으로 성능을 높여 왔지만, 이제는 전력 소모, 메모리 병목, 데이터 이동 비용, 냉각과 인프라 한계가 AI 발전의 진짜 제약이 되었다.

따라서 미래의 AI는 연산 중심 구조에서 벗어나 메모리 중심 아키텍처, 3D 적층, 이기종 시스템, 저전력 특화 모델, 실시간 추론 최적화로 이동해야 한다.

특히 로봇·자율주행·산업 자동화 같은 물리 AI 시대에는 낮은 지연시간과 높은 신뢰성, 에너지 효율이 핵심이 되므로, 모델·컴파일러·칩·시스템 전체를 통합 설계하는 접근이 필수적이다.

궁극적으로 이 논문은 2035년까지 AI 학습과 추론 효율을 1000배 높이고, 더 많은 주체가 활용할 수 있는 지속 가능하고 인간 중심적인 AI 인프라를 구축하자는 청사진을 제시한다. (arXiv)

=끝

나만의 투자이야기

2026년 3월 12일 목요일

생각정리 201 (* AI+HW 2035: Shaping the Next Decade)