Google’s AI Research and Development Lab, Deepmind, zaprezentowało Alphaevolve, system AI zaprojektowany do rozwiązywania złożonych problemów z matematyki i nauk ścisłych za pomocą rozwiązań „mrożących studia”. System wykorzystuje modele „najnowocześniejszych”, w szczególności modele Gemini, w celu generowania, krytyki i oceny możliwych odpowiedzi na dany problem.
Alphaevolve wprowadza mechanizm zmniejszania halucynacji w modelach AI za pomocą automatycznego systemu oceny. Ten system ocenia wygenerowane odpowiedzi pod kątem dokładności, umożliwiając efektywne działanie na temat problemów, które mogą być samoocenione, szczególnie w dziedzinach takich jak informatyka i optymalizacja systemu.

Do wykorzystania AlphaevolveUżytkownicy muszą podać problem z opcjonalnymi szczegółami, takimi jak instrukcje, równania i odpowiednia literatura. Muszą również dostarczyć mechanizm automatycznej oceny odpowiedzi systemu, zwykle w postaci formuły. Zdolność systemu ogranicza się do opisywania rozwiązań jako algorytmów, co czyni go mniej odpowiednim do problemów niewidocznych.
W testach porównawczych Alphaevolve przedstawiono około 50 problemów matematycznych w różnych gałęziach, w tym geometrii i kombinatorycznych. System z powodzeniem „odkrył” najbardziej znane odpowiedzi 75% czasu i odkrył ulepszone rozwiązania w 20% przypadków. DeepMind zastosował również alfaevolve do problemów praktycznych, takich jak optymalizacja wydajności centrum danych i przyspieszanie treningów modelowych.
Wideo: Google Deepmind
Według DeepmindAlphaevolve wygenerował algorytm, który odzyskał średnio 0,7% światowych zasobów obliczeniowych i zasugerował optymalizację, który skrócił ogólny czas szkolenia modeli GEMINI o 1%. Chociaż Alphaevolve nie dokonuje przełomowych odkryć, twierdzi się, że oszczędzono czas i zwolnić ekspertów, aby skupić się na bardziej krytycznych zadaniach.
DeepMind planuje zbudować interfejs użytkownika dla Alphaevolve i uruchomić program wczesnego dostępu dla wybranych naukowców przed rozważeniem szerszego wdrożenia. Laboratorium twierdzi, że możliwości Alphaevolve sprawiają, że jest to cenne narzędzie dla ekspertów w dziedzinie.