5 grudnia firma Tencent wypuściła Hunyuan 2.0, duży model językowy z 406 miliardami parametrów ogółem. Ta aktualizacja ma na celu postęp w matematyce, kodowaniu i złożonym rozumowaniu dzięki architekturze mieszanki ekspertów i udoskonalonym metodom szkoleniowym. Model występuje w dwóch wariantach: Myśl i Instruuj. Jego architektura aktywuje 32 miliardy parametrów podczas każdego wnioskowania, umożliwiając wydajne przetwarzanie. Obsługuje okno kontekstowe zawierające 256 000 tokenów, umożliwiając obsługę obszernych danych wejściowych bez obcinania. Tencent pozycjonuje HY 2.0 Think jako jeden z „najwyższych poziomów w kraju” w zakresie złożonych zadań rozumowania. Ta wersja przewyższa swoją poprzedniczkę, Hunyuan-T1-20250822, w wielu obszarach oceny. W matematycznym teście porównawczym IMO-AnswerBench rozwiązanie HY 2.0 Think uzyskało wynik 73,4, co odzwierciedla duże możliwości rozwiązywania problemów w dziedzinach matematycznych. W ocenach inżynierii oprogramowania wydajność znacznie wzrosła w teście porównawczym SWE-bench Verified, wzrastając z 6,0 w przypadku poprzedniego modelu do 53,0. To ulepszenie zapewnia większą dokładność generowania i debugowania kodu w przypadku rzeczywistych wyzwań programistycznych. https://twitter.com/TencentHunyuan/status/1996948083377332614 Tencent przypisuje te postępy poprawie jakości danych przedtreningowych i dwuetapowemu podejściu do uczenia się przez wzmacnianie. Strategia ta integruje RLVR, czyli uczenie się przez wzmacnianie z weryfikowalnymi nagrodami, które wykorzystuje obiektywne wskaźniki w szkoleniu, oraz RLHF, czyli uczenie się przez wzmacnianie na podstawie informacji zwrotnej od ludzi, obejmujące oceny ludzkie w celu udoskonalenia wyników. HY 2.0 Think stosuje strategie kar za długość, aby zapobiec nadmiernej gadatliwości w odpowiedziach, co skutkuje tym, co Tencent nazywa „wiodącą w branży” wydajnością obliczeniową na token. Taka konstrukcja optymalizuje wykorzystanie zasobów podczas wytwarzania, redukując czas i koszty przetwarzania. Udoskonalono także funkcje kodowania i agenta, a wynik Tau2-Bench wzrósł z 17,1 do 72,4. Metryki te oceniają autonomiczne wykonywanie zadań i interakcje związane z kodem. Integracja obejmuje aplikacje konsumenckie Tencent, takie jak Yuanbao i ima, gdzie model usprawnia interakcje użytkownika. Programiści mogą uzyskać do niego dostęp za pośrednictwem platformy API Tencent Cloud w celu realizacji niestandardowych implementacji. Tencent planuje udostępnienie technologii i modeli związanych z oprogramowaniem open source do użytku społeczności.





