Procesory graficzne Blackwell firmy Nvidia borykają się z wyzwaniami związanymi z przegrzaniem, które mają wpływ na głównych klientów technologicznych. Procesory nowej generacji mają trudności z wydajną pracą w szafach serwerowych mieszczących 72 procesory graficzne, co budzi obawy takich firm jak Google, Meta i Microsoft dotyczące terminowego wdrożenia. Raporty wskazują, że Nvidia wielokrotnie dokonuje ponownej oceny swoich projektów stojaków ze względu na problemy z przegrzaniem, które mogą spowodować uszkodzenie podzespołów i ograniczenie wydajności procesora graficznego. Przewidywany pobór mocy dla tych konfiguracji wynosi do 120 kW na szafę.
Insiderzy poinformowali Informacje że procesory graficzne Nvidia Blackwell do sztucznej inteligencji i obliczeń o wysokiej wydajności (HPC) przegrzały się w serwerach o dużej pojemności, co wpływa na harmonogram uruchamiania klientów korzystających z tych technologii. Chcąc zaradzić komplikacjom wynikającym z problemów z przegrzaniem, Nvidia zwróciła się do swoich dostawców o wielokrotne modyfikowanie konstrukcji szaf. Rzecznik Nvidii podkreślił ich wspólne podejście do usług w chmurze, opisując zmiany projektowe jako rutynową część procesu rozwoju.
Korekty konstrukcyjne mające na celu przeciwdziałanie problemom z przegrzaniem
Wcześniej opóźnienia na rampie produkcyjnej w Blackwell przypisywano błędom projektowym „zabijającym wydajność”. The Karty graficzne Blackwell B100 i B200 wykorzystują technologię pakowania CoWoS-L firmy TSMC, która integruje dwa chiplety w celu zwiększenia prędkości przesyłania danych do 10 TB/s. Jednak niedopasowanie właściwości rozszerzalności cieplnej pomiędzy chipletami GPU i innymi komponentami doprowadziło do wypaczeń i awarii systemu. Aby rozwiązać ten problem, Nvidia wprowadziła modyfikacje w metalowych warstwach krzemu GPU i strukturach nierówności.
Rezultat tych ulepszeń wszedł do masowej produkcji dopiero pod koniec października, a przewidywane daty wysyłki przesunęły się na koniec stycznia. To opóźnienie ma kluczowe znaczenie dla klientów Nvidii, takich jak Google, MetaI Microsoftuktóre polegają na tych procesorach graficznych w celu ulepszenia ich najpotężniejszych modeli sztucznej inteligencji. Nvidia wcześniej reklamowała chipy Blackwell jako 30 razy szybsze w przypadku zadań takich jak odpowiadanie na zapytania chatbota w porównaniu do wcześniejszych modeli.
Prognozowano, że przychody Nvidii z chipów Blackwell osiągną w następnym kwartale 6 miliardów dolarów, co podkreśla wysoki popyt pomimo ciągłych ograniczeń podaży. Nvidia, która niedawno wyprzedziła Apple, jest obecnie najcenniejszą firmą na świecie, której kapitalizacja rynkowa gwałtownie rośnie do 3,482 biliona dolarów. Jednak ciągłe niepowodzenia dotyczące procesorów Blackwell grożą zakłóceniem planowanych postępów w zakresie możliwości sztucznej inteligencji, niezbędnych dla głównych graczy technologicznych.
Autor wyróżnionego obrazu: Nvidia