Najnowsze przedsięwzięcie Google o nazwie kodowej „Project Jarvis” ma na celu wykorzystanie sztucznej inteligencji do automatyzacji zadań internetowych w przeglądarce Chrome.
Według Informacjenapędzany jest ten projekt oparty na sztucznej inteligencji, który ma zadebiutować we wczesnych zapowiedziach w grudniu tego roku Google Gemini 2.0 modelu i stanowi narzędzie skierowane do konsumentów, którego celem jest uproszczenie interakcji online. Wzorowany na fikcyjnym asystencie JARVIS Marvela, Jarvis będzie samodzielnie wykonywał wieloetapowe zadania cyfrowe, obejmujące wszystko, od zakupów online po rezerwację podróży.
Gemini 2.0 napędza Projekt Jarvis
Gemini 2.0, najnowsza wersja zaawansowanego modelu sztucznej inteligencji Google, stanowi podstawę Projektu Jarvis. Odsłonięty o godz We/Wy Google 2024Gemini zaprojektowano z ulepszeniami w zakresie rozumowania, planowania i pamięci, a wszystko to ma na celu pomóc użytkownikom w samodzielnym wykonywaniu złożonych, wieloetapowych zadań.
Jak wyjaśnił dyrektor generalny Google, Sundar Pichai podczas I/O, celem jest stworzenie „inteligentnych systemów, które wykazują rozumowanie, planowanie i pamięć, [and are] być w stanie myśleć wiele kroków do przodu”, pozostając w pełni nadzorowanym przez użytkownika. Dzięki tym możliwościom Gemini ma na celu zapewnienie „sztandarowy przykład” o tym, jak przyszli agenci AI mogą zwiększyć produktywność i zmniejszyć wkład użytkowników.

Tym, co wyróżnia Jarvisa, jest jego zdolność do działania w środowisku Chrom przeglądarka, przechwytywanie zrzutów ekranu aby kierować jego interakcjami z formularzami i przyciskami online. Według The Information Jarvis często wykonuje zrzuty ekranu okna Chrome użytkownika, aby zinterpretować każdy interfejs, umożliwiając mu „klikanie” przycisków, wpisywanie w polach, a nawet porównywanie elementów na stronach internetowych.
Metoda oparta na zrzutach ekranu umożliwia również Jarvisowi zrozumieć złożone formy i układy, które znacznie się różnią w różnych witrynach. Jednak ta funkcja oznacza, że Jarvis działa stosunkowo wolno, a analiza każdego zrzutu ekranu zajmuje kilka sekund przed przejściem do następnego kroku. Chociaż technologia ta nie jest jeszcze zoptymalizowana pod kątem szybkości, odzwierciedla strategię Google polegającą na wykorzystywaniu zasobów w chmurze do obsługi złożonych zadań sztucznej inteligencji, które w przeciwnym razie wymagałyby mocy obliczeniowej na urządzeniu.
A co z aplikacjami?
Project Jarvis obiecuje zmienić sposób interakcji użytkowników z platformami cyfrowymi, kładąc nacisk na automatyzację rutynowych zadań internetowych, takich jak kupowanie produktów, rezerwacja lotów czy gromadzenie badań.
Ta funkcja może spodobać się szerokiemu gronu odbiorców, od zapracowanych profesjonalistów po zwykłych użytkowników, którzy chcą usprawnić zadania. Raport „Information” podkreśla to Jarvis umożliwi użytkownikom realizację rozbudowanych procesów internetowych przy minimalnym wkładzie pracyumożliwiając im delegowanie czasochłonnych działań sztucznej inteligencji. W ten sposób Google dąży do pozycjonowania Jarvisa jako narzędzia skierowanego do konsumenta i skoncentrowanego na produktywności, podobnie jak narzędzie Wizja drugiego pilota Microsoftu lub Apple’a Inteligencja Apple.
Kiedy użytkownicy mogą uzyskać dostęp do Google Jarvis?
Z raportów wynika, że dostępna jest wczesna zapowiedź Project Jarvis może zadebiutować w grudniu tego rokuchoć szczegóły mogą ulec zmianie. Firma prawdopodobnie udostępni narzędzie początkowo ograniczonej grupie odbiorców, aby zidentyfikować i naprawić wszelkie błędy i ograniczenia przed szerszym wdrożeniem.
Google zastosował podobne podejście w przypadku wcześniejszych premier produktów, takich jak AI Bardadając wczesnym użytkownikom możliwość przekazania opinii i przyczynienia się do udoskonaleń przed szerszą dostępnością. Ta faza testowania może ukształtować sposób, w jaki Google optymalizuje Jarvisa pod kątem szybszego i bardziej płynnego działania, zapewniając jednocześnie, że protokoły bezpieczeństwa spełniają oczekiwania użytkowników.

Pojawiają się obawy
Jako asystent AI mający znaczną kontrolę nad tym, co użytkownik robi w Internecie, Jarvis podnosi nowe obawy dotyczące prywatności i bezpieczeństwa. Ponieważ Jarvis polega na interpretowaniu zrzutów ekranu zawierających potencjalnie wrażliwe informacje, niezbędne będą solidne środki bezpieczeństwa, aby zapewnić ochronę danych użytkownika. Plan Google obejmuje dokładne przetestowanie tych zabezpieczeń, zanim Jarvis ujrzy światło dzienne w szerszej wersji, ale potencjalne ryzyko związane z tak wysokim poziomem dostępu do systemu wywołuje debatę wśród obrońców prywatności i programistów.
Przyznając narzędziom AI, takim jak Jarvis, bezpośrednią kontrolę nad urządzeniami użytkowników, Google musi wdrożyć zabezpieczenia zapobiegające lukom w zabezpieczeniach i nieautoryzowanemu dostępowi. Choć Project Jarvis jest wciąż w fazie rozwoju, zapowiada się, że zmieni zasady gry w produktywności opartej na sztucznej inteligencji, umożliwiając użytkownikom delegowanie złożonych, wieloetapowych zadań w przeglądarce Chrome. Łącząc możliwości Gemini 2.0 z możliwościami internetowymi przeglądarki Chrome, Google tworzy sztuczną inteligencję, która może na nowo zdefiniować nasze podejście do zadań cyfrowych – od zakupów po badania.
Ponieważ Google finalizuje prace nad Jarvisem do użytku konsumenckiego, jego sukces może utorować drogę bardziej zaawansowanym i autonomicznym środowiskom sztucznej inteligencji, zmieniając sposób, w jaki współdziałamy z przeglądarkami i potencjalnie z całą technologią.
Kredyty obrazowe: Emre Citak/Ideogram AI