DeepSeek twierdzi, że przewyższa ChatGPT o1

Chińskie laboratorium sztucznej inteligencji DeepSeek ogłosiło wypuszczenie modelu DeepSeek-R1-Lite-Preview, który według niego może konkurować z modelem o1 OpenAI. Nowy model oferuje unikalną cechę: przejrzystość procesu rozumowania, pozwalającą użytkownikom zobaczyć metody rozwiązywania problemów krok po kroku. Ogłoszenie to następuje dwa miesiące po uruchomieniu OpenAI o1-podgląd modelu, podkreślając rosnącą konkurencję w przestrzeni rozumowania AI.

DeepSeek wprowadza model rozumowania, który może konkurować z OpenAI

Dostęp do DeepSeek-R1-Lite-Preview można uzyskać za pośrednictwem chatbota internetowego, Czat DeepSeekgdzie użytkownicy mogą wchodzić w interakcję z modelem, ograniczona do 50 wiadomości dziennie. Chociaż szczegółowe testy porównawcze i karta modelu nie zostały jeszcze opublikowane, wczesne oceny wskazują, że model rozumowania wykazuje wydajność porównywalną z testami OpenAI w zadaniach AIME i MATH. DeepSeek twierdzi, że osiąga najnowocześniejszą dokładność na poziomie 91,6% w teście MATH.

Wprowadzenie DeepSeek-R1 następuje w momencie, gdy tradycyjne prawa skalowania w sztucznej inteligencji, które sugerują, że zwiększenie danych i mocy obliczeniowej poprawią wydajność, zaczynają przynosić malejące zyski. W odpowiedzi firmy poszukują nowych podejść, takich jak te leżące u podstaw modeli rozumowania, takie jak DeepSeek-R1. W przeciwieństwie do tradycyjnych modeli, modele rozumowania rozszerzają przetwarzanie obliczeniowe podczas wnioskowania, aby zwiększyć możliwości podejmowania decyzji.

Pomimo obiecujących funkcji, nowy model jest również zgodny z rygorystycznymi protokołami cenzury powszechnymi w chińskiej technologii sztucznej inteligencji. Obserwacje potwierdziły, że DeepSeek-R1 unika drażliwych tematów politycznych, takich jak zapytania dotyczące Xi Jinpinga czy Tajwanu. Użytkownicy zgłaszali udane próby ominięcia tych ograniczeń, co umożliwiło modelowi dostarczenie niefiltrowanej treści w niektórych scenariuszach. Ten aspekt rodzi ciągłe pytania o równowagę między funkcjonalnością a zgodnością z przepisami w przypadku modeli sztucznej inteligencji opracowywanych w regionach podlegających rygorystycznemu nadzorowi rządowemu.

DeepSeek twierdzi, że jego model DeepSeek-R1 – a dokładniej DeepSeek-R1-Lite-Preview – jest zgodny z modelem o1-preview OpenAI w dwóch czołowych testach porównawczych AI, AIME i MATH. AIME ocenia wydajność modelu przy użyciu innych modeli AI, podczas gdy MATH testuje rozwiązywanie problemów za pomocą zbioru zadań tekstowych. Model ma jednak swoje wady. Niektórzy użytkownicy X zauważył że DeepSeek-R1, podobnie jak o1, stawia czoła wyzwaniom związanym z grą w kółko i krzyżyk i innymi zadaniami opartymi na logice.

Patrząc w przyszłość, DeepSeek planuje wypuścić wersje swoich modeli R1 o otwartym kodzie źródłowym i rozszerzyć dostęp za pośrednictwem interfejsów API, kontynuując swoje zaangażowanie na rzecz społeczności AI o otwartym kodzie źródłowym. Firma jest wspierana przez High-Flyer Capital Management, który realizuje strategię włączania sztucznej inteligencji do decyzji handlowych. Działalność High-Flyer obejmuje znaczne inwestycje w infrastrukturę sprzętową, obejmującą klastry procesorów graficznych Nvidia A100 do szkolenia modeli.

Autor wyróżnionego obrazu: DeepSeek

DeepSeek twierdzi, że przewyższa ChatGPT o1

Related Posts

XBrew Lab prezentuje na targach CES 2026 beznabojowy ekspres do kawy nitro

Google przekształca Gmaila dzięki AI Inbox i wyszukiwaniu w języku naturalnym

TikTok nawiązuje współpracę z FIFA w zakresie najważniejszych wydarzeń z Mistrzostw Świata

Dell wprowadza zdezagregowaną infrastrukturę dla nowoczesnych centrów danych

Xbox Developer Direct powraca 22 stycznia z Fable i Forza Horizon 6

YouTube umożliwia teraz ukrywanie filmów Short w wynikach wyszukiwania

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

DeepSeek twierdzi, że przewyższa ChatGPT o1

DeepSeek wprowadza model rozumowania, który może konkurować z OpenAI

Related Posts

XBrew Lab prezentuje na targach CES 2026 beznabojowy ekspres do kawy nitro

Google przekształca Gmaila dzięki AI Inbox i wyszukiwaniu w języku naturalnym

TikTok nawiązuje współpracę z FIFA w zakresie najważniejszych wydarzeń z Mistrzostw Świata

Dell wprowadza zdezagregowaną infrastrukturę dla nowoczesnych centrów danych

Xbox Developer Direct powraca 22 stycznia z Fable i Forza Horizon 6

YouTube umożliwia teraz ukrywanie filmów Short w wynikach wyszukiwania

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us