Należąca do Elona Muska xAI rozpoczęła wdrażanie Grok 4.1, aktualizacji modelu Grok 4. Wydanie poprawia jakość i szybkość, zapewniając bezpłatny dostęp dla wszystkich użytkowników w celu zwiększenia wydajności modelu dużych języków. xAI wypuściło dwie wersje nowego modelu: Grok 4.1 i Grok 4.1 Thinking. Obydwa zawierają stopniowe ulepszenia w stosunku do poprzednich iteracji. Użytkownicy bezpłatni mają natychmiastowy dostęp do tych modeli, a klienci płacący korzystają ze zmniejszonych limitów użytkowania. xAI stwierdza, że Grok 4.1 zmniejsza ryzyko halucynacji trzykrotnie w porównaniu do poprzednich modeli. Ten postęp plasuje tę wersję wśród najlepszych dotychczasowych ofert xAI. Halucynacje, w przypadku których modele generują niedokładne informacje, stanowią kluczowe wyzwanie w opracowywaniu dużych modeli językowych, a redukcja ta wynika z ukierunkowanych udoskonaleń szkoleniowych. Wyniki w porównaniu z konkurentami, takimi jak GPT 5.1, który został niedawno wprowadzony na rynek i zapewnił wzrost wydajności i inteligencji emocjonalnej, pozostają niepotwierdzone w bezpośrednich porównaniach. Aktualizacje GPT 5.1 skupiają się na udoskonaleniu dokładności reakcji i zrozumienia kontekstu w interakcjach. LMArena Text Arena udostępnia wczesne dane dotyczące wydajności Groka 4.1. To narzędzie typu open source umożliwia bezpośrednie, ślepe i losowe porównania dużych modeli językowych. Użytkownicy przesyłają podpowiedzi, a platforma anonimowo łączy odpowiedzi w pary, aby uszeregować modele na podstawie ludzkich preferencji. Wczesne testy porównawcze przeprowadzone przez Text Arena umieszczają Grok 4.1 (myślący) na pierwszym miejscu w tabeli liderów Arena Expert z wynikiem 1510. Grok 4.1 plasuje się na 19. miejscu z wynikiem 1437. Wyniki te pokazują, że oba modele osiągają nowe pozycje w konkurencyjnym środowisku Text Arena. Platforma porównawcza zauważyła: „To wzrost o ponad 40 punktów od czasu Grok 4 Fast, który wylądował na Arenie zaledwie dwa miesiące wcześniej”. Grok 4 szybko wszedł na listę liderów we wrześniu 2025 r., ustanawiając poziom bazowy, który obecnie Grok 4.1 znacznie przekracza. https://twitter.com/arena/status/1990530978943787291





