Deepseek R2 nadchodzi szybko: czy Zachód może nadążyć?

Deepseek ma przyspieszyć wprowadzenie nowego modelu AI, R2, po powodzenia swojego poprzedniego modelu, R1, który niedawno spowodował wyprzedaż w wysokości 1 biliona dolarów na globalnych rynkach akcji ze względu na jego konkurencyjne wyniki przeciwko zachodnim odpowiednikom.

Deepseek przyspiesza wprowadzenie modelu R2 AI po sukcesie R1

Startup z Hangzhou pierwotnie miał na początku wydania R2 na początku maja, ale teraz dąży do przyspieszonego wdrożenia, według trzech źródeł zaznajomionych z firmą. Oczekuje się, że nowy model zwiększy możliwości kodowania i obsługuje rozumowanie w wielu językach poza angielskim. Deepseek nie skomentował tych zmian.

R1, opracowany przy użyciu mniej potężnych układów NVIDIA, pozostaje konkurencyjny z modelami stworzonymi przez główne amerykańskie firmy technologiczne, które zainwestowały setki miliardów w technologie AI. Vijayasimha Alilughatta, dyrektor operacyjny Zensar, stwierdził, że wydanie R2 może znacząco wpłynąć na przemysł AI, kwestionując dominację istniejących liderów rynku.

Założyciel i etos operacyjny

Liang Wenfeng, założyciel DeepSeek i miliarder z jego ilościowej Funduszu Hedgingowego High-Flyer, utrzymuje niski profil od lipca 2024 r.. Byli pracownicy opisują Deepseek jako działające bardziej jak laboratorium badawcze niż konwencjonalny biznes, charakteryzujący się płaskim stylem zarządzania, który kontrastuje z hierarchiczną strukturą powszechną w sektorze technologicznym w Chinach.

Liang, który rozpoczął karierę w inteligentnym obrazowaniu, a później zarządzał zespołem badawczym, został pochwalony za zatrudnienie najlepszych inżynierów algorytmów i wspieranie środowiska współpracy. Pracownicy zauważyli, że wielu pracowało ośmiogodzinne dni, czując się upoważniony do przyczyniania się do kluczowych projektów. Liang podkreśla jakość nad rozległym rozwojem aplikacji, skomentując unikanie dużych wydatków na rzecz udoskonalania modeli AI.

Rekompensata w Deepseek i High-Flyer jest podobno hojna; Starsi naukowcy danych w High-Flyer mogą zarobić do 1,5 miliona juanów rocznie, znacznie wyższe niż konkurenci. Sama Flyer jest uznawana za jedno z najlepszych funduszy ilościowych w Chinach, zarządzając dziesiątkami miliardów juanów pomimo presji regulacyjnej na sektorze.

Deepseek wstrząsnął rynkiem raz i oto, dlaczego może się to powtórzyć

Przewagę konkurencyjną Deepseek wynika ze znaczących inwestycji o wysokiej flyer w badania i siłę obliczeniową. Firma przeznaczyła 70% swoich przychodów na badania AI, budując dwa superkomputerowe klastry AI, w tym jeden składający się z 10 000 układów NVIDIA A100 w 2020 r. I 2021 r. Rząd chiński początkowo podniósł obawy dotyczące masowego przejęcia chipów, ale ostatecznie pozwoliło operacjom na kontynuację, co później korzystało z Deepseek, gdy amerykański zakazał eksportu chipów w 2022 roku.

Dzięki ograniczonej konkurencji o takie zasoby Deepseek przyciągnął wiodących badaczy. Zastosowanie opłacalnych technik, takich jak mieszanka ekspertów (MOE) i wielopanowata uwaga utajona (MLA), umożliwiło firmie obniżenie kosztów obliczeniowych przy jednoczesnym pozostaniu konkurencyjnym. Według analityków Bernsteina, ceny Deepseek wynoszą 20 do 40 razy niż podobne niż podobne modele z Openai.

Od czasu wprowadzenia R1 giganci zachodnio -techniczni dostosowali swoje strategie, odzwierciedlone w obniżkach cen z Openai i wprowadzeniem zdyskontowanych poziomów dostępu przez Google. Testy porównawcze od UST zauważyło, że R1 często wymagał trzykrotnie tokeny rozumowania w porównaniu do zmniejszonych modeli Openai.

Wsparcie rządowe

Deepseek zyskał przychylność chińskiego rządu, o czym świadczy Liang, uczestniczący w głośnym spotkaniu z premierem Li Qiang jako przedstawiciela sektora AI. Samorządy lokalne i kilka przedsiębiorstw państwowych rozpoczęły integrację modeli Deepseek, co wskazuje na silne poparcie dla chińskiego przywództwa, które ma na celu wykazanie wyższości w stosunku do technologii amerykańskiej.

Wzrost ten pojawia się w czasach, gdy modele Deepseeka stoją przed usuwaniem sklepów z aplikacjami w niektórych krajach, w tym z Korei Południowej i Włoch, z powodu obaw związanych z prywatnością. Eksperci ostrzegają, że jeśli Deepseek stanie się preferowanym modelem AI dla chińskich podmiotów państwowych, zachodnie organy regulacyjne mogą reagować podwyższonym ograniczeniami na eksport technologii AI i współpracę.

Liang potwierdził wyzwania związane z Embargo na zaawansowanych układach AI, podkreślając, że finansowanie nie było głównym problemem dla Deepseek.

Wyróżniony obraz obrazu: Matheus Bertelli/Pexels

Tags: Deepseek Wyróżniony

Deepseek R2 nadchodzi szybko: czy Zachód może nadążyć?

Related Posts

Nowy Flash Gemini 2.5 Google to dowód, że sztuczna inteligencja nie musi być powolna

Wojnarzka: Meta sprzedawała reklamy, gdy nastolatki poczuły się „bezwartościowe”

WhatsApp testuje tryb blokady dla najbardziej prywatnych czatów

Bliźnięta może teraz czytać Twoje dokumenty Google jak podcast

Podstępna podwyżka cen T-Mobile’a w kwietniu

Nowa sztuczna inteligencja Google może przewidzieć katastrofy, zanim trafią

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Deepseek R2 nadchodzi szybko: czy Zachód może nadążyć?

Deepseek przyspiesza wprowadzenie modelu R2 AI po sukcesie R1

Założyciel i etos operacyjny

Wsparcie rządowe

Related Posts

Nowy Flash Gemini 2.5 Google to dowód, że sztuczna inteligencja nie musi być powolna

Wojnarzka: Meta sprzedawała reklamy, gdy nastolatki poczuły się „bezwartościowe”

WhatsApp testuje tryb blokady dla najbardziej prywatnych czatów

Bliźnięta może teraz czytać Twoje dokumenty Google jak podcast

Podstępna podwyżka cen T-Mobile’a w kwietniu

Nowa sztuczna inteligencja Google może przewidzieć katastrofy, zanim trafią

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us