Symulacje Molecular Dynamics (MD) są kamieniem węgielnym nowoczesnej chemii i biologii, ale ich automatyzacja pozostała wyzwaniem – do teraz.
Naukowcy z University of Rochester i Futurehouse Inc., w tym Quintina Campbell, Sam Cox, Jorge Medina, Brittany Watterson i Andrew D. White, wprowadzili MDCROW: automatyzacja przepływów pracy dynamiki molekularnej z dużymi modelami-AI, zaprojektowany przez AI agent zaprojektowany Usprawnij złożone zadania MD przy użyciu dużych modeli językowych (LLM).
MDCROW integruje się 40 narzędzi zaprojektowanych ekspertów Aby obsłużyć każdy etap przepływu pracy MD – od przygotowania plików wejściowych po uruchamianie symulacji i analizy wyników. W przeciwieństwie do poprzednich prób ograniczonych do konkretnych ekosystemów oprogramowania, MDCROW jest przeznaczony do szerokiej zdolności adaptacyjnej. Zatrudnia Rozumowanie łańcuchowe Aby dynamiczna interakcja z narzędziami, optymalizacja przepływów pracy bez wymagania obszernej interwencji człowieka.
Wyzwanie automatyzacji symulacji MD
Wymagają symulacji MD skrupulatne strojenie parametrówod wyboru pól siłowych po zarządzanie złożonymi krokami przed i po przetwarzaniu. Podczas gdy postęp obliczeniowy zwiększył dostępność, Pełna automatyzacja pozostała nieuchwytna Z powodu wysoce wyspecjalizowanego podejmowania decyzji. Poprzednie wysiłki, takie jak Radonpy i Pyautofep, koncentrowały się na wąskich domenach lub wymaganych sztywnych integracji narzędzi. Mdcrow zmienia to według Łączenie możliwości adaptacji LLM z wyspecjalizowanymi narzędziami MDtworzenie systemu, który może uogólniać w różnych zastosowaniach naukowych.
Jak działa mdcrow
Zbudowany za pomocą Framework Langchain i szybki reakcjaMdcrow działa jako Asystent oparty na LLM, który autonomicznie wybiera i wykonywa działania w kontrolowanym środowisku. Współdziała z narzędziami w czterech kluczowych obszarach:
- Wyszukiwanie informacji: Dostęp do literatury, baz danych i struktur białkowych w celu poinformowania parametrów symulacji.
- PDB i obsługa białka: Czyszczenie i przetwarzanie plików PDB dla symulacji molekularnych.
- Wykonanie symulacji: Uruchamianie symulacji MD za pomocą OpenMM, automatycznie obsługując błędy.
- Analiza i wizualizacja: Generowanie spostrzeżeń z wyników symulacji, w tym analiz strukturalnych i ocen stabilności.
Kluczową innowacją jest zdolność MDCROW do Dostosowuj dynamicznie do złożoności zadań. Niezależnie od tego, czy wykonując prostą strukturę oczyszczającą, czy organizując wieloetapowe symulacje z skomplikowanymi analizami, system udoskonala swoje podejście na podstawie wcześniejszych wyników i informacji zwrotnych w czasie rzeczywistym.
Czy naprawdę testujemy AI 3D? Badanie ujawnia poważną wadę w testach porównawczych 3D
Benchmarking mdcrow
Aby ocenić możliwości MDCROW, zespół badawczy przetestował je 25 zadań rosnącej złożonościporównanie jego wydajności w różnych LLM, w tym GPT-4O, LAMA3-405B i Claude-3 Opus.
Wyniki są uderzające:
- MDCROW, zasilane przez GPT-4O, pomyślnie wykonał 72% zadańznacznie przewyższają standardowe konfiguracje LLM.
- LAMA3-405B, alternatywa open source, osiągnęła 68% ukończeniaudowadniając realne rozwiązanie niepewne.
- Podstawowe LLM bez specjalistycznych narzędzi MDCROW osiągnęły tylko 28% dokładnościpodkreślając znaczenie przepływów pracy zaprojektowanych przez ekspertów.
- Szybki styl miał niewielki wpływ na modele o wysokiej wydajności Ale znacząco wpłynęło na słabsze, wzmacniając potrzebę ustrukturyzowanego rozumowania w złożonych zadaniach naukowych.
MDCROW reprezentuje duży krok w kierunku w pełni autonomicznych symulacji molekularnychale jego wpływ wykracza poza przepływy pracy MD. Przez Umożliwianie AI do obsługi skomplikowanych, wieloetapowych zadań obliczeniowychMdcrow pokazuje, w jaki sposób LLM mogą służyć jako Asystenci naukoweprzyspieszanie odkrycia wśród chemii, materiałów materiałowych i bioinżynierii.
Badanie pokazuje również znaczenie Współpraca człowieka-AI. Podczas gdy MDCROW automatyzuje rutynowe procesy, jego interaktywna funkcja „czatowania” pozwala naukowcom Udoskonalenie przepływów pracy w czasie rzeczywistymkierując sztuczną inteligencją w kierunku bardziej złożonego rozwiązywania problemów.
Badania są open source, z kodem dostępnym pod adresem Github.
Wyróżniony obraz obrazu: Kerem Gülen/Midjourney