Nowe badania wskazują, że uczenie się transferowe może znacznie przyspieszyć poszukiwania nowej fizyki, zmniejszając potrzebę stosowania kosztownych symulacji. Jednak według badania opublikowanego w czasopiśmie Journal of Cosmology and Astroparticle Physics (JCAP poleganie na ustalonych wzorcach może spowodować, że sztuczna inteligencja przeoczy prawdziwie nowe zjawiska).
Standardowy model kosmologii, znany jako ΛCDM, wyjaśnia wiele cech wszechświata, ale nie jest wyczerpujący. Nowe obserwacje zrodziły pytania dotyczące takich pojęć, jak masywne neutrina, zmodyfikowana grawitacja i ewoluująca ciemna energia. Badanie ich wymaga szeroko zakrojonych symulacji komputerowych, które są zarówno kosztowne obliczeniowo, jak i czasochłonne.
Celem zespołu badawczego było ustalenie, czy uczenie się transferowe może zwiększyć efektywność symulacji. Uczenie się transferowe pozwala sztucznej inteligencji zastosować wiedzę z prostszych zadań do bardziej złożonych, obniżając w ten sposób koszty. Początkowo sztuczną inteligencję szkolono w oparciu o podstawowe symulacje ΛCDM, a następnie przystąpiono do przejścia na bardziej złożone modele, które uwzględniały potencjalną nową fizykę.
Adrian Bayer, współautor z Flatiron Institute i Princeton University, opisał tę metodę jako skrót do tradycyjnego szkolenia AI. „Zwykle ludzie szkolą sztuczną inteligencję bezpośrednio na podstawie najbardziej kosztownych obliczeniowo symulacji. Zamiast tego najpierw używamy prostszych i tańszych symulacji ΛCDM, aby dać sztucznej inteligencji pojęcie o tym, co się dzieje” – powiedział Bayer.
Ta strategia przedszkoleniowa pomogła sztucznej inteligencji zarządzać złożonością bez przytłaczania. Badanie wykazało, że w niektórych przypadkach uczenie się transferowe zmniejszyło liczbę potrzebnych kosztownych symulacji ponad dziesięciokrotnie.
Naukowcy zidentyfikowali także wyzwanie zwane transferem negatywnym, które występuje, gdy sztuczna inteligencja błędnie interpretuje nowe informacje w oparciu o swoją wcześniejszą wiedzę. Sztuczna inteligencja często miała trudności z dostrzeżeniem nowych efektów, gdy przypominały one wzorce zgodne z istniejącymi parametrami ΛCDM. Było to widoczne w symulacjach z udziałem masywnych neutrin, w których sztuczna inteligencja miała trudności z odróżnieniem nowych sygnatur od tych, które już powiązała ze znanymi parametrami.
Veena Krishnaraj, główna autorka badania, wyjaśniła, że negatywny transfer wynika z podstawowych degeneracji fizycznych modeli. „Różne procesy fizyczne mogą dawać bardzo podobne obserwowalne sygnatury” – zauważyła, wskazując na potrzebę ostrożności przy interpretowaniu wyników sztucznej inteligencji.
W badaniu podkreślono zarówno potencjalne korzyści, jak i ograniczenia uczenia się transferowego w dziedzinie fizyki. Chociaż wstępne uczenie może przyspieszyć analizę danych, może utrudniać zdolność sztucznej inteligencji do rozpoznawania przełomowych odkryć. Następny etap będzie polegał na zastosowaniu techniki transferu uczenia się do rzeczywistych obserwacji astronomicznych.
Naukowcy przewidują, że uczenie się transferowe będzie miało kluczowe znaczenie w nadchodzących badaniach kosmologicznych, których celem będzie gromadzenie bardzo precyzyjnych danych. Artykuł zatytułowany „Transfer Learning Beyond the Standard Model”, którego autorką jest Veena Krishnaraj i współpracownicy, został właśnie opublikowany w czasopiśmie JSTAT.





