테슬라, 슈퍼컴퓨터 칩 '도조 2' 양산 시작
자율주행, 실제 로봇공학, 고급 추론 등 실제 인공지능 문제를 해결하려면 헤아릴 수 없을 만큼 엄청난 연산 능력이 필요합니다. 이러한 과제를 해결하기 위해 테슬라는 자체 맞춤형 AI 훈련 하드웨어를 개발하는 동시에 오픈 마켓에서 하드웨어를 구매해 왔습니다.
차세대 Dojo 2 칩이 세계 최대 반도체 제조업체인 TSMC에서 양산에 들어갔다는 보도가 나왔습니다 . 많은 사람들이 이를 부수적인 과제로 여길 수도 있지만, 테슬라의 컴퓨팅 기반 확장은 엑사스케일 슈퍼컴퓨팅을 달성하기 위해 필수적이며, 이는 테슬라의 AI 야망에 매우 중요합니다.
일론 머스크는 Dojo 2를 " 좋은 컴퓨터 "라고 불렀고, 이어서 고전적인 컴퓨터 성능 농담을 했습니다. Dojo 2는 실제로 초당 10억 프레임으로 Crysis를 플레이할 수 있습니다.
초당 10억 프레임으로 Crysis를 플레이할 수 있습니다.
테슬라는 지금까지 강력한 타사 GPU를 효과적으로 활용하여 모델을 학습시켜 왔지만, Dojo 슈퍼컴퓨터는 단 하나의 목적을 위해 설계된, 완전히 새로운 애플리케이션 특화 솔루션입니다. Dojo 슈퍼컴퓨터는 신경망 학습을 위해 방대한 양의 비디오 데이터를 효율적으로 처리합니다. Dojo 2 칩 자체가 이러한 잠재력을 실현하는 열쇠입니다.
Dojo 2는 FSD에 사용되는 비전 기반 신경망을 학습시켜 테슬라가 전 세계적으로 보유한 방대한 차량의 비디오를 더욱 빠르게 처리할 수 있도록 지원합니다. 테슬라가 FSD를 지속적으로 개선해 나가면서, 가장 큰 과제 중 하나는 까다로운 엣지 케이스를 처리하기 위한 비디오 처리였습니다.
엣지 케이스를 식별하고 학습시키기 전에 수십만 마일의 학습 데이터가 지나갈 수 있지만, 이 모든 데이터 를 분석하고, 레이블을 지정하고, 처리 해야 하며, 이는 Dojo 2의 핵심입니다. 유용한 새로운 학습 데이터 하나하나가 Tesla가 9의 속도로 발전하는 데 도움이 되어 FSD가 매번 조금씩 더 나아질 것입니다.
이 과정에는 막대한 컴퓨팅 및 학습 시간이 필요하지만, FSD를 개선하는 데 절대적으로 필요합니다. 물론 이는 차량의 FSD에만 국한되지 않습니다. 테슬라의 휴머노이드 로봇 옵티머스 또한 FSD를 기반으로 물리적 세계를 탐색하고 상호 작용합니다.
FSD의 커스텀 버전이기는 하지만 핵심은 여전히 FSD입니다. 즉, 자동차의 환경을 분석하고 세계의 3D 지도를 구축하는 신경망이 Optimus에서도 동일한 작업을 수행한다는 의미입니다.
Dojo 2의 힘은 단순히 순수한 컴퓨팅 성능에서만 나오는 것이 아닙니다. FSD 훈련에 탁월하고 일반 용도 하드웨어나 다른 AI 전용 하드웨어와 차별화되는 일련의 아키텍처적 선택에서 나옵니다.
이를 위해 테슬라는 TSMC의 새로운 InFO-SoW(Integrated Fan-Out with Silicon-on-Wafer) 패키징 기술을 사용하고 있습니다. 대규모 AI 워크로드의 경우, 발열과 칩 간 데이터 이동 속도가 가장 큰 병목 현상으로 작용하는 경우가 많습니다.
이 새로운 패키징 기술은 프로세싱 다이 간에 직접 고대역폭 연결을 가능하게 하여 대기 시간을 낮추고 방열을 획기적으로 개선합니다. 이는 모두 대규모의 고밀도 컴퓨팅 클러스터를 구축하는 데 중요합니다.
범용 칩과 달리 Dojo 2는 FSD(초점 추적) 훈련을 위해 특별히 제작된 맞춤형 명령어 집합으로 설계되었습니다. 이 코어는 테슬라 비전 기반 신경망의 중추를 이루는 행렬 곱셈 및 시스톨릭 배열과 같은 정확한 수학 연산을 가속화하도록 특별히 설계되었습니다.
테슬라는 자체 하드웨어를 구축함으로써 자사 소프트웨어와 컴파일러를 실리콘에 직접 통합하여 특정 작업 부하에 맞게 최적화하고 Nvidia의 CUDA와 같은 타사 소프트웨어를 사용함으로써 발생할 수 있는 성능 저하를 피할 수 있습니다.
Dojo 2의 시작은 일부에게는 부수적인 과제처럼 보일 수 있지만, 실제로는 테슬라의 AI 기술에 있어 핵심적인 단계입니다. 이 기술은 기성 하드웨어를 사용하는 경쟁사보다 테슬라가 우위를 점할 수 있도록 지원합니다. 테슬라는 지난 몇 달 동안의 느린 속도보다는 합리적인 속도로 FSD를 개선하기 위해 맞춤형 하드웨어에 대한 투자를 지속해야 할 것입니다.