NVIDIA CEO Jensen Huang Keynote at COMPUTEX 2024 · TECH BLOG by Dongyoung Kim Ph.D.

주요 내용

프로세서 아키텍처
- 칩 크기: 최대 크기의 TSMC 제조 칩 2개 연결.
- 연결 속도: 10테라바이트/초 링크.
GPU 사양
- 코어 수: 18,000개 이상의 CUDA 코어.
- 텐서 코어: 2,304개의 텐서 코어.
- RT 코어: 576개의 RT 코어.
메모리
- 메모리 용량: 최대 128GB HBM3 메모리.
- 메모리 대역폭: 4TB/초 이상.
데이터 처리 및 압축
- 데이터 압축/해제 엔진: 20배 빠른 데이터 처리 속도.
- 보안 기능: AI 모델 보호를 위한 강화된 보안 기능.
에너지 효율성
- 전력 소비: 15kW (공랭식 시스템 기준).
- 성능 대비 전력 효율성: 기존 대비 3배 향상된 전력 효율성.
네트워킹
- NVLink 5세대: 72개의 GPU를 연결하는 NVLink 스위치.
- 스위치 대역폭: 7.2테라바이트/초.
컴퓨팅 성능
- AI 연산 성능: 1,000 테라플롭스 이상.
- FP64 성능: 125 테라플롭스 이상.

프로세서 아키텍처
- 최신 반도체 기술: TSMC 3nm 공정 사용.
- 코어 수: 20,000개 이상의 CUDA 코어.
- 텐서 코어: 3,000개의 텐서 코어.
멀티모달 AI 지원
- AI 모델 학습 및 추론 최적화: 음성, 이미지, 텍스트 등 다양한 데이터 처리 지원.
메모리
- 메모리 용량: 최대 160GB HBM4 메모리.
- 메모리 대역폭: 5TB/초 이상.
데이터 처리 및 압축
- 데이터 압축/해제 엔진: 30배 빠른 데이터 처리 속도.
- 보안 기능: AI 모델 보호를 위한 강화된 보안 기능.
에너지 효율성
- 전력 소비: 10kW (공랭식 시스템 기준).
- 성능 대비 전력 효율성: 기존 대비 4배 향상된 전력 효율성.
네트워킹
- NVLink 6세대: 144개의 GPU를 연결하는 NVLink 스위치.
- 스위치 대역폭: 14.4테라바이트/초.
컴퓨팅 성능
- AI 연산 성능: 2,000 테라플롭스 이상.
- FP64 성능: 250 테라플롭스 이상.

NVIDIA는 AI와 로보틱스 분야에서 혁신을 주도하고 있으며, 최신 기술을 통해 다양한 산업에 큰 변화를 예고하고 있음.
제너러티브 AI와 디지털 트윈 기술은 산업 전반에 걸쳐 새로운 가능성을 열어가고 있음.
블랙웰 울트라와 루빈 플랫폼은 NVIDIA의 최첨단 기술을 집약한 제품으로, 각각의 뛰어난 성능과 확장성을 통해 다양한 산업 분야에서 혁신적인 변화를 이끌어낼것임.
이러한 고성능 컴퓨팅 플랫폼은 대규모 데이터 처리와 AI 모델 학습 및 추론에서 중요한 역할을 할 것으로 기대되며, NVIDIA의 지속적인 기술 발전은 AI와 데이터 처리의 새로운 가능성을 열어갈 것으로 기대됨.