Chińskie laboratorium sztucznej inteligencji DeepSeek ogłosiło wypuszczenie modelu DeepSeek-R1-Lite-Preview, który według niego może konkurować z modelem o1 OpenAI. Nowy model oferuje unikalną cechę: przejrzystość procesu rozumowania, pozwalającą użytkownikom zobaczyć metody rozwiązywania problemów krok po kroku. Ogłoszenie to następuje dwa miesiące po uruchomieniu OpenAI o1-podgląd modelu, podkreślając rosnącą konkurencję w przestrzeni rozumowania AI.
DeepSeek wprowadza model rozumowania, który może konkurować z OpenAI
Dostęp do DeepSeek-R1-Lite-Preview można uzyskać za pośrednictwem chatbota internetowego, Czat DeepSeekgdzie użytkownicy mogą wchodzić w interakcję z modelem, ograniczona do 50 wiadomości dziennie. Chociaż szczegółowe testy porównawcze i karta modelu nie zostały jeszcze opublikowane, wczesne oceny wskazują, że model rozumowania wykazuje wydajność porównywalną z testami OpenAI w zadaniach AIME i MATH. DeepSeek twierdzi, że osiąga najnowocześniejszą dokładność na poziomie 91,6% w teście MATH.
Wprowadzenie DeepSeek-R1 następuje w momencie, gdy tradycyjne prawa skalowania w sztucznej inteligencji, które sugerują, że zwiększenie danych i mocy obliczeniowej poprawią wydajność, zaczynają przynosić malejące zyski. W odpowiedzi firmy poszukują nowych podejść, takich jak te leżące u podstaw modeli rozumowania, takie jak DeepSeek-R1. W przeciwieństwie do tradycyjnych modeli, modele rozumowania rozszerzają przetwarzanie obliczeniowe podczas wnioskowania, aby zwiększyć możliwości podejmowania decyzji.
Pomimo obiecujących funkcji, nowy model jest również zgodny z rygorystycznymi protokołami cenzury powszechnymi w chińskiej technologii sztucznej inteligencji. Obserwacje potwierdziły, że DeepSeek-R1 unika drażliwych tematów politycznych, takich jak zapytania dotyczące Xi Jinpinga czy Tajwanu. Użytkownicy zgłaszali udane próby ominięcia tych ograniczeń, co umożliwiło modelowi dostarczenie niefiltrowanej treści w niektórych scenariuszach. Ten aspekt rodzi ciągłe pytania o równowagę między funkcjonalnością a zgodnością z przepisami w przypadku modeli sztucznej inteligencji opracowywanych w regionach podlegających rygorystycznemu nadzorowi rządowemu.
DeepSeek twierdzi, że jego model DeepSeek-R1 – a dokładniej DeepSeek-R1-Lite-Preview – jest zgodny z modelem o1-preview OpenAI w dwóch czołowych testach porównawczych AI, AIME i MATH. AIME ocenia wydajność modelu przy użyciu innych modeli AI, podczas gdy MATH testuje rozwiązywanie problemów za pomocą zbioru zadań tekstowych. Model ma jednak swoje wady. Niektórzy użytkownicy X zauważył że DeepSeek-R1, podobnie jak o1, stawia czoła wyzwaniom związanym z grą w kółko i krzyżyk i innymi zadaniami opartymi na logice.
Patrząc w przyszłość, DeepSeek planuje wypuścić wersje swoich modeli R1 o otwartym kodzie źródłowym i rozszerzyć dostęp za pośrednictwem interfejsów API, kontynuując swoje zaangażowanie na rzecz społeczności AI o otwartym kodzie źródłowym. Firma jest wspierana przez High-Flyer Capital Management, który realizuje strategię włączania sztucznej inteligencji do decyzji handlowych. Działalność High-Flyer obejmuje znaczne inwestycje w infrastrukturę sprzętową, obejmującą klastry procesorów graficznych Nvidia A100 do szkolenia modeli.
Autor wyróżnionego obrazu: DeepSeek