Deepseek przesuwa mniejszą sztuczną inteligencję na chipsy Huawei

Deepseek będzie wykorzystywać układy AI Huawei zamiast do szkolenia małych modeli AI, ponieważ firma stara się zmniejszyć poleganie na procesorach NVIDIA. Zmiana pojawia się, gdy Deepseek testuje nowe akceleratory GPU AI od różnych producentów.

Według Deepseek planuje przyjąć chipsy Huawei dla mniejszych modeli AI. Ta inicjatywa ma na celu zmniejszenie zależności firmy od NVIDIA. Deepseek ocenia obecnie nowe akceleratorów GPU AI z Huawei, Baidu i Cambricon pod kątem modeli szkoleniowych mniejszych niż wersja AI R2.

Deepseek zamierza kontynuować korzystanie z procesorów NVIDIA do swojego dużego modelu języka R2 AI (LLM), biorąc pod uwagę ich niezawodne źródło obecnych produktów. Firma wcześniej rozważała procesor wznoszący się swojego modelu rozumowania AI nowej generacji, ale może odroczyć ten plan.

Deepseek napotkał wyzwania z nadchodzącym modelem R2 AI. Pomimo wsparcia inżynieryjnego Huawei, problemy z programowaniem doprowadziły do odroczenia uruchomienia modelu R2 AI. Debiut modelu AI R2 jest oczekiwany jeszcze w tym roku.

Deepseek polega na chipsetach Nvidii, aby zbudować silniejszy model rozumowania R2 AI. Jednocześnie będzie wykorzystywać procesory Huawei Ascend do szkolenia i rafinacji mniejszych iteracji modelu R2. Firma nie określiła debiutanckiej daty platform konsumenckich wykorzystujących technologię LLM Huawei AI LLM.

Rzecznik NVIDIA stwierdził: „Konkurs niezaprzeczalnie przybył. Świat wybierze najlepszy stos techniczny do prowadzenia najpopularniejszych aplikacji i modeli open source. Aby wygrać wyścig AI, przemysł amerykański musi zdobyć wsparcie programistów na całym świecie, w tym Chin”.

Wyróżniony obraz