Współzałożyciel i dyrektor generalny Nvidii, Jensen Huang, zaprezentował Superchip Vera Rubin AI na konferencji GPU Technology Conference w Waszyngtonie, zaznaczając tym samym przejście firmy na sprzęt AI w obliczu boomu na sztuczną inteligencję, zwiększając jej wartość rynkową do prawie 5 bilionów dolarów. Platforma Vera Rubin jest przeznaczona do obciążeń związanych z generatywną sztuczną inteligencją o dużej intensywności. Integruje pojedynczy procesor Vera wyposażony w 88 niestandardowych rdzeni ARM obsługujących 176 wątków. Ten procesor łączy się z dwoma procesorami graficznymi Rubin, aby osiągnąć do 100 petaFLOPS wydajności obliczeniowej FP4. Jako komputer NVLink 72 trzeciej generacji firmy Nvidia do montażu w szafie serwerowej, Vera Rubin jest następcą modeli GB200 i GB300. System wykorzystuje chłodzenie cieczą i zawiera sześć bilionów tranzystorów. Zawiera także 2 TB pamięci SOCAMM2 o niskim opóźnieniu, aby skutecznie obsługiwać wymagające zadania przetwarzania AI. W swojej podstawowej konfiguracji Vera Rubin zapewnia około 100 razy większą wydajność obliczeniową w porównaniu do DGX-1 opartego na Volcie. Ta wcześniejsza platforma, początkowy system głębokiego uczenia się firmy Nvidia, zapewniła szczytową wydajność 170 teraflopów w FP16. Ten znaczny wzrost podkreśla ewolucję mocy obliczeniowej zastosowań sztucznej inteligencji na przestrzeni lat. Nvidia planuje wypuścić Verę Rubin w różnych konfiguracjach, aby sprostać różnorodnym potrzebom. Konfiguracja NVL144 obejmuje dwa procesory graficzne wielkości siatki, które umożliwiają do 3,6 eksaflopa wnioskowania FP4 i 1,2 eksaflopa wydajności szkoleniowej FP8. Aby zwiększyć możliwości, konfiguracja NVL144 CPX osiąga 8 eksaflopów, co stanowi 7,5 razy większą moc systemów obecnej generacji GB300 NVL72. Aby sprostać wymaganiom hiperskalowych centrów danych w zakresie przetwarzania większych obciążeń w kontekście modelu, Nvidia wprowadza system Rubin Ultra NVL576. W tym wariancie zastosowano cztery procesory graficzne o wielkości siatki oraz do 365 TB szybkiej pamięci. Zapewnia do 15 eksaflopów wnioskowania 4PR i 5 eksaflopów wydajności szkoleniowej 8PR, co stanowi 8-krotny wzrost w porównaniu z GB300. Każdy procesor graficzny Rubin składa się z dwóch chipletów obliczeniowych i ośmiu stosów pamięci HBM4, optymalizując przepustowość danych i obliczenia. Płyta GPU jest wyposażona w pięć złączy na płycie montażowej NVLink. Dwa złącza na górze łączą procesory graficzne z przełącznikiem NVLink, zapewniając szybką łączność. Trzy dolne złącza zarządzają zasilaniem, interfejsem PCIe i łącznością CXL, aby wspierać integrację z szerszymi systemami. Huang przewiduje, że procesory graficzne Rubin wejdą do masowej produkcji w drugiej połowie 2026 r. Premiera systemów NVL144 planowana jest pod koniec 2026 r. lub na początku 2027 r. Tymczasem oczekuje się, że systemy NVL576 będą dostępne w drugiej połowie 2027 r., co będzie zgodne z planem działania Nvidii dotyczącym rozwoju infrastruktury sztucznej inteligencji. https://www.youtube.com/watch?v=lQHK61IDFH4





