Chiński jednorożec AI DeepSeek podtrzymuje branżę w niepewności co do premiery modeli nowej generacji, V4 i R2. Pomimo intensywnych spekulacji na temat potencjalnego startu podczas nadchodzącego Księżycowego Nowego Roku, firma odmówiła komentarza na temat konkretnych dat.
Zamiast, firma pozwala mówić swoim badaniom. W ostatnich tygodniach DeepSeek opublikował wiele artykułów technicznych opisujących nowatorskie metody ominięcia bieżących ograniczeń sprzętowych. W związku z amerykańskimi sankcjami ograniczającymi dostęp Chin do zaawansowanych procesorów graficznych Nvidia, Najnowsze badania DeepSeek skupiają się na efektywności algorytmicznej.
we wtorek, firma wprowadziła”Engram,„technika pamięci warunkowej zaprojektowana w celu rozwiązania problemu niedoborów pamięci GPU o dużej przepustowości – krytycznego wąskiego gardła w skalowaniu sztucznej inteligencji. Jest to następstwem artykułu, którego współautorem jest dyrektor generalny Liang Wenfeng, na temat „hiperpołączeń o ograniczeniach wielorakich” (mHC), ramy mające na celu bardziej efektywne kosztowo szkolenie masywnych systemów.
Analitycy uważają, że te innowacje to strategiczne posunięcia mające na celu utrzymanie dynamiki pomimo trudności geopolitycznych. „DeepSeek chce tylko udowodnić, że innowacja w infrastrukturze AI zwiększy wydajność,„powiedział Zhang Ruiwang, architekt systemów informatycznych z siedzibą w Pekinie.
Choć data premiery następców modeli V3 i R1 pozostaje tajemnicą, firma potwierdziła, że jej główny zespół pozostaje nienaruszony. W zaktualizowanym artykule na temat modelu R1 zauważono, że wszystkich 18 głównych naukowców nadal pracuje w firmie, przeciwstawiając się wysokim wskaźnikom rotacji przemysłu w Chinach.





