Deepseek ma przyspieszyć wprowadzenie nowego modelu AI, R2, po powodzenia swojego poprzedniego modelu, R1, który niedawno spowodował wyprzedaż w wysokości 1 biliona dolarów na globalnych rynkach akcji ze względu na jego konkurencyjne wyniki przeciwko zachodnim odpowiednikom.
Deepseek przyspiesza wprowadzenie modelu R2 AI po sukcesie R1
Startup z Hangzhou pierwotnie miał na początku wydania R2 na początku maja, ale teraz dąży do przyspieszonego wdrożenia, według trzech źródeł zaznajomionych z firmą. Oczekuje się, że nowy model zwiększy możliwości kodowania i obsługuje rozumowanie w wielu językach poza angielskim. Deepseek nie skomentował tych zmian.
R1, opracowany przy użyciu mniej potężnych układów NVIDIA, pozostaje konkurencyjny z modelami stworzonymi przez główne amerykańskie firmy technologiczne, które zainwestowały setki miliardów w technologie AI. Vijayasimha Alilughatta, dyrektor operacyjny Zensar, stwierdził, że wydanie R2 może znacząco wpłynąć na przemysł AI, kwestionując dominację istniejących liderów rynku.
Założyciel i etos operacyjny
Liang Wenfeng, założyciel DeepSeek i miliarder z jego ilościowej Funduszu Hedgingowego High-Flyer, utrzymuje niski profil od lipca 2024 r.. Byli pracownicy opisują Deepseek jako działające bardziej jak laboratorium badawcze niż konwencjonalny biznes, charakteryzujący się płaskim stylem zarządzania, który kontrastuje z hierarchiczną strukturą powszechną w sektorze technologicznym w Chinach.
Liang, który rozpoczął karierę w inteligentnym obrazowaniu, a później zarządzał zespołem badawczym, został pochwalony za zatrudnienie najlepszych inżynierów algorytmów i wspieranie środowiska współpracy. Pracownicy zauważyli, że wielu pracowało ośmiogodzinne dni, czując się upoważniony do przyczyniania się do kluczowych projektów. Liang podkreśla jakość nad rozległym rozwojem aplikacji, skomentując unikanie dużych wydatków na rzecz udoskonalania modeli AI.
Rekompensata w Deepseek i High-Flyer jest podobno hojna; Starsi naukowcy danych w High-Flyer mogą zarobić do 1,5 miliona juanów rocznie, znacznie wyższe niż konkurenci. Sama Flyer jest uznawana za jedno z najlepszych funduszy ilościowych w Chinach, zarządzając dziesiątkami miliardów juanów pomimo presji regulacyjnej na sektorze.
Deepseek wstrząsnął rynkiem raz i oto, dlaczego może się to powtórzyć
Przewagę konkurencyjną Deepseek wynika ze znaczących inwestycji o wysokiej flyer w badania i siłę obliczeniową. Firma przeznaczyła 70% swoich przychodów na badania AI, budując dwa superkomputerowe klastry AI, w tym jeden składający się z 10 000 układów NVIDIA A100 w 2020 r. I 2021 r. Rząd chiński początkowo podniósł obawy dotyczące masowego przejęcia chipów, ale ostatecznie pozwoliło operacjom na kontynuację, co później korzystało z Deepseek, gdy amerykański zakazał eksportu chipów w 2022 roku.
Dzięki ograniczonej konkurencji o takie zasoby Deepseek przyciągnął wiodących badaczy. Zastosowanie opłacalnych technik, takich jak mieszanka ekspertów (MOE) i wielopanowata uwaga utajona (MLA), umożliwiło firmie obniżenie kosztów obliczeniowych przy jednoczesnym pozostaniu konkurencyjnym. Według analityków Bernsteina, ceny Deepseek wynoszą 20 do 40 razy niż podobne niż podobne modele z Openai.
Od czasu wprowadzenia R1 giganci zachodnio -techniczni dostosowali swoje strategie, odzwierciedlone w obniżkach cen z Openai i wprowadzeniem zdyskontowanych poziomów dostępu przez Google. Testy porównawcze od UST zauważyło, że R1 często wymagał trzykrotnie tokeny rozumowania w porównaniu do zmniejszonych modeli Openai.
Wsparcie rządowe
Deepseek zyskał przychylność chińskiego rządu, o czym świadczy Liang, uczestniczący w głośnym spotkaniu z premierem Li Qiang jako przedstawiciela sektora AI. Samorządy lokalne i kilka przedsiębiorstw państwowych rozpoczęły integrację modeli Deepseek, co wskazuje na silne poparcie dla chińskiego przywództwa, które ma na celu wykazanie wyższości w stosunku do technologii amerykańskiej.
Wzrost ten pojawia się w czasach, gdy modele Deepseeka stoją przed usuwaniem sklepów z aplikacjami w niektórych krajach, w tym z Korei Południowej i Włoch, z powodu obaw związanych z prywatnością. Eksperci ostrzegają, że jeśli Deepseek stanie się preferowanym modelem AI dla chińskich podmiotów państwowych, zachodnie organy regulacyjne mogą reagować podwyższonym ograniczeniami na eksport technologii AI i współpracę.
Liang potwierdził wyzwania związane z Embargo na zaawansowanych układach AI, podkreślając, że finansowanie nie było głównym problemem dla Deepseek.
Wyróżniony obraz obrazu: Matheus Bertelli/Pexels