Duże modele językowe (LLM) stają się mądrzejsze, ale jest jeden duży problem: nie wiedzą, jak uczyć się skutecznie. Magellan to nowa rama AI, która naśladuje uczenie się przez ludzi, przewidując własny postęp – przyczyniając się do poruszania się w ogromnych przestrzeniach celowych bez utknięcia w tym, co jest zbyt łatwe lub zbyt trudne.
Opracowany przez naukowców z INRII i MIT, w tym Loris Gaven, Thomas Carta, Clément Romac, Cédric Colas, Sylvain Lampier, Olivier Sigaud i Pierre-Yves Oudeyer, The Studium ”Magellan: prognozy metapoznawcze prowadzącego do nauki Przewodnik Autotelic LLM Agents w dużych celach„Wprowadza ramy, które dają AI zdolność metapoznawczą – zasadniczo umiejętność przewidywania, ile poprawi się, ćwicząc zadanie. Pozwala to na priorytety AI celów uczenia się w otwarty sposób, podobnie jak ludzie, gdy zajmują się nowymi umiejętnościami.
AI nie priorytetowo traktuje nauki
Tradycyjne metody uczenia się sztucznej inteligencji walczą w rozległych przestrzeniach do celu. Oni:
- Marnuj czas na zadania, które już opanowalirobienie powolnego postępu.
- Próbuj zbyt trudnych celówprowadząc do powtarzających się awarii.
- Wymagaj kategorii celów zdefiniowanych przez człowiekaco jest nieefektywne i nie skaluje.
Z drugiej strony ludzie instynktownie Szukaj wyzwań, które rozciągają ich umiejętności bez bycia niemożliwym. Magellan wprowadza to ludzkie podejście do szkolenia LLM.
Jak działa Magellan: przewidywanie postępu, a nie tylko wydajność
Większość systemów szkoleniowych AI:
- Mierzyć wcześniejsze wyniki (Co nie pomaga w nowych celach).
- Użyj ustalonych ocen trudności (które nie dostosowują się do zmieniających się umiejętności).
Magellan wybiera mądrzejszą trasę. Dynamicznie szacuje Ile sztucznej inteligencji poprawi cel, jeśli go praktykuje. Umożliwia to modele AI wybieranie zadań uczenia się, które maksymalizują postęp, a nie tylko próbować rzeczy losowo.
Metoda działa poprzez proces o nazwie Absolute Learning Progress (ALP)—Tracking, jak bardzo AI poprawia dane zadanie z czasem. Korzystając z ALP, Magellan skupia cele w sensowne kategorie bez interwencji człowieka, Pozwalając AI uogólnić się między powiązanymi umiejętnościami.
Wyniki wydajności LLM są zawyżone: Nowa metoda pokazuje prawdę
Uczenie sztucznej inteligencji uczenia się jak człowiek
Aby przetestować Magellan, naukowcy wykorzystali interaktywne środowisko AI o nazwie Little-Zoogdzie agent LLM musiał uczyć się różnych zadań – takich jak rozpoznawanie przedmiotów, uprawy roślin, a nawet interakcja ze zwierzętami.
Wyniki były jasne:
- AI trenowane z Magellan przewyższyło wszystkie inne metody, szybciej opanowując więcej zadań.
- Lepiej uogólniłco oznacza, że może skuteczniej sprostać nowym, niewidzialnym wyzwaniom.
- Nie wymagało kategorii celów znakowanych przez człowiekaudowadniając jego skalowalność.
Natomiast tradycyjne podejście do uczenia się albo na płaskowyżu wcześnie lub wymagane Grupowania celów zdefiniowanych przez ekspertówczyniąc je sztywnymi i nieefektywnymi.
Dlaczego to ma znaczenie
Największym przełomem Magellan jest samokierowana nauka. Zamiast polegać na ludzkich inżynierach, aby wybrać cele, AI może autonomicznie ustalić, czego się nauczyć w oparciu o własne postępy. To przesuwa sztuczną inteligencję z biernego szkolonego do aktywnego ulepszania się, dzięki czemu jest to podejście transformacyjne na wielu dziedzinach.
Asystenci AI mogą nauczyć się nowych umiejętności, identyfikując obszary, w których walczą, zwiększając zdolność dostosowywania się bez interwencji człowieka. W robotyce maszyny mogą udoskonalić swoje umiejętności, koncentrując się na zadaniach o najwyższym potencjale uczenia się, co prowadzi do bardziej wydajnych i zdolnych systemów autonomicznych. W edukacji nauczyciele AI mogą dostosowywać lekcje w czasie rzeczywistym, nie tylko w oparciu o wcześniejsze wyniki, ale na przewidywanej poprawie, oferując bardziej spersonalizowane doświadczenie edukacyjne.
Magellan udowadnia, że sztuczna inteligencja może Pomyśl o własnej nauceczyniąc go znacznie bardziej wydajnym w środowiskach otwartych. Kolejny krok może być w celu uzyskania tej metody poza celami tekstowymi w dziedziny, takie jak robotyka, odkrycie naukowe, a nawet edukacja ludzka.
Wyróżniony obraz obrazu: Kerem Gülen/Ideogram