엔비디아, 차세대 AI 칩 출시 계획 발표
엔비디아는 최근 "Rubin Ultra"와 "Feynman" AI 칩의 출시 계획을 밝혔습니다. 두 칩은 각각 2027년과 2028년에 출시될 예정입니다. GTC 2025 콘퍼런스에서 제슨 황 CEO는 AI 가속 GPU의 사양과 이전에 발표한 칩에 대한 업데이트를 공유했습니다.
중심 발표는 2026년 하반기에 출시될 "베라 루빈(Vera Rubin)" GPU였으며, 288GB 메모리와 맞춤형 설계된 CPU를 탑재했습니다. "베라 루빈"은 이전 버전인 "Grace Blackwell"에 비해 AI 훈련과 추론 성능에서 많은 개선이 이루어질 것으로 보입니다. 이 GPU는 두 개의 칩으로 구성되어 있으며, 함께 50 페타플롭스의 FP4 추론 성능을 제공합니다. NVL144 랙에 구성하면 3.6 엑사플롭스의 FP4 추론 성능을 달성할 수 있습니다.
2027년 말 출시 예상인 "루빈 울트라(Rubin Ultra)"는 칩당 100 페타플롭스의 FP4 정밀성을 제공하는 네 개의 레티클 크기 다이로 구성될 예정이며, 총 15 엑사플롭스의 FP4 추론 성능을 구현할 수 있습니다. 각 Rubin Ultra GPU는 1TB의 HBM4e 메모리와 함께 제공됩니다.
또한, 엔비디아는 2025년 하반기에 "블랙웰 울트라 B300(Blackwell Ultra B300)"을 소개할 예정입니다. 이 제품은 두 개의 GPU로 구성되며, 15 페타플롭스의 밀집 FP4 연산을 제공합니다. 전체 NVL72 랙에 구성하면 1.1 엑사플롭스의 밀집 FP4 추론 성능을 달성할 수 있습니다.
차세대 GPU 아키텍처인 "페인만(Feynman)"에 대한 간단한 언급도 있었습니다. 이 아키텍처는 "Vera" CPU를 사용할 예정이며, 2028년 출시가 기대됩니다.
제슨 황 CEO는 데이터 센터 내 AI의 역할 진화를 강조하며, 이를 "데이터 토큰"을 생산하는 "AI 공장"에 비유했습니다. 그는 "물리적 AI"의 미래에 대한 비전을 공유하며, 언젠가는 인간이 전통적으로 수행하던 작업을 대신 수행할 휴머노이드 로봇을 위한 동력원이 될 수 있음을 시사했습니다.
출처 : 원문 보러가기