Google szczegółowo opisuje bariery zabezpieczające dla nowych agentów AI Chrome

Google szczegółowy swoje podejście do bezpieczeństwa dla funkcji agenta w przeglądarce Chrome, która może wykonywać działania w imieniu użytkowników. Firma zaprezentowała te możliwości już we wrześniu, a ich szersze wdrożenie nastąpi w nadchodzących miesiącach. Firma wdrożyła modele obserwatorów i mechanizmy zgody użytkownika w celu zarządzania tymi działaniami agentowymi. Strategia ta uwzględnia potencjalne zagrożenia bezpieczeństwa, które mogą obejmować utratę danych lub konsekwencje finansowe związane z takimi funkcjami. Google wykorzystuje kilka modeli do monitorowania działań agentów. Opracowano narzędzie User Alignment Critic, obsługiwane przez firmę Gemini, które ocenia elementy działań wygenerowane przez model planisty dla konkretnego zadania. Jeśli model krytyka uzna zaproponowane zadania za niezgodne z celem użytkownika, instruuje model planisty, aby zrewidował swoją strategię. Model krytyka uzyskuje dostęp tylko do metadanych proponowanego działania, a nie do rzeczywistej zawartości sieci. Aby uniemożliwić agentom dostęp do nieautoryzowanych lub niezaufanych witryn internetowych, Google korzysta z zestawów pochodzenia agentów. Zestawy te ograniczają modele do wyznaczonych źródeł tylko do odczytu i do odczytu i zapisu. Źródła tylko do odczytu umożliwiają Gemini korzystanie z treści, takich jak listy produktów w witrynie zakupów, z wyłączeniem nieistotnych elementów, takich jak reklamy banerowe. Podobnie agent może wchodzić w interakcję tylko z określonymi ramkami iframe na stronie.

Obraz: Google

„To rozgraniczenie wymusza, aby agent miał dostęp wyłącznie do danych z ograniczonego zestawu źródeł i że dane te mogą być przekazywane wyłącznie do źródeł, które można zapisać” – podała firma w poście na blogu. „Ogranicza to wektor zagrożenia wyciekami danych z różnych źródeł. Daje to również przeglądarce możliwość wymuszenia części tej separacji, na przykład poprzez nie wysyłanie do modelu danych spoza czytelnego zestawu”. Google monitoruje również nawigację na stronach za pomocą innego modelu obserwatora, który analizuje adresy URL. Mechanizm ten ma na celu zapobieganie nawigacji do szkodliwych adresów URL generowanych przez model. W przypadku poufnych zadań Google wymaga zgody użytkownika. Gdy agent próbuje uzyskać dostęp do witryn zawierających informacje bankowe lub medyczne, najpierw pyta użytkownika o zgodę. W przypadku witryn wymagających logowania Chrome prosi użytkownika o pozwolenie na korzystanie z menedżera haseł, dzięki czemu model agenta nie uzyska dostępu do danych haseł. Firma będzie również szukać zgody użytkownika przed podjęciem takich działań, jak dokonanie zakupu lub wysłanie wiadomości. Ponadto Google posiada klasyfikator szybkiego wstrzykiwania, który zapobiega niepożądanym działaniom i stale testuje swoje możliwości agenta pod kątem ataków opracowanych przez badaczy. Inni twórcy przeglądarek AI również skupili się na bezpieczeństwie; Na początku tego miesiąca firma Perplexity wypuściła nowy model wykrywania treści typu open source, aby przeciwdziałać atakom typu „wstrzykiwanie” na agentów.

Autor wyróżnionego obrazu