Openai ma wystrzelony Podgląd badań operatora, ogólnego agenta AI zdolnego do niezależnego wykonywania zadań poprzez przejęcie kontroli nad przeglądarką internetową. Ta funkcja jest najpierw dostępna dla użytkowników USA w planie subskrypcji Pro Chatgpt o wartości 200 USD, z planami rozszerzenia na dodatkowe poziomy użytkowników w przyszłości.
Operator Openai wyjaśnił
Operator może zautomatyzować różne zadania, w tym rezerwację zakwaterowania podróży, dokonywanie rezerwacji restauracji i zakupy online. Użytkownicy mogą wybierać spośród kategorii, takich jak zakupy, dostawa, jadalnia i podróżowanie w interfejsie operatora. Po aktywacji wyskakuje dedykowane okno przeglądarki internetowej, pokazując użytkownikom, że operator akcji wykonuje obok wyjaśnień. Użytkownicy mogą utrzymać kontrolę nad ekranami, podczas gdy operator działa we własnym środowisku przeglądarki.
Openai twierdzi, że nadintegencja jest bliżej niż myślisz
Agent AI jest zasilany modelem agenta użytkownika komputerowego (CUA), który łączy możliwości widzenia modelu GPT-4O z zaawansowanym rozumowaniem. CUA wchodzi w interakcje z frontem stron internetowych, nie wymagając interfejsów API zorientowanych na programistę. Ta funkcjonalność pozwala jej używać przycisków, nawigować menu i wypełniać formy jako człowiek. Openai współpracuje z różnymi firmami, w tym Doordash, eBay, Instacart i Priceline, zapewniając operatorowi przestrzegać ich warunków umów o usługach.
OpenAI stwierdza, że model CUA ma na celu poproszenie o potwierdzenie użytkownika przed sfinalizowaniem zadań, które mają efekty zewnętrzne, takie jak złożenie zamówienia lub wysłanie wiadomości e -mail. Pomimo swoich możliwości, OpenAI ostrzega, że CUA nie może niezawodnie wykonywać we wszystkich scenariuszach i zmaga się ze złożonymi zadaniami, takimi jak tworzenie szczegółowych slajdów, zarządzanie skomplikowanymi kalendarzami lub nawigowanie niestandardowymi interfejsami internetowymi.
W przypadku wrażliwych zadań, takich jak transakcje bankowe, wymagany jest nadzór użytkownika. Operator nie gromadzi ani danych użytkownika zrzut ekranu i nakazuje bezpośredni nadzór nad szczególnie poufnymi witrynami, takimi jak e -mail i usługi finansowe, umożliwiając użytkownikom niezwłocznie rozwiązywanie błędów.
Operator ma pewne ograniczenia. Openai Egzekwuje limity stawek-zarówno codziennie, jak i zależne od zadań-i określa, że niektóre zadania, takie jak wysyłanie wiadomości e-mail lub usuwanie zdarzeń kalendarzowych, zostaną odrzucone ze względów bezpieczeństwa. Openai planuje zrewidować te ograniczenia w przyszłości, chociaż nie podano konkretnej harmonogramu
Operator może również napotykać trudności ze złożonymi interfejsami internetowymi, pola hasła i kontrole CAPTCHA, zachęcając użytkownika do interwencji w tym momencie. Openai uznaje zagrożenia bezpieczeństwa związane z systemami AI, które mogą podejmować działania w Internecie, podkreślając konieczność zapobiegania potencjalnym wykorzystaniem przez złośliwych aktorów.
Openai wdrożył kilka środków bezpieczeństwa. Agent żąda wprowadzania kontroli użytkownika podczas wrażliwych transakcji i prowadzi potwierdzenia użytkownika przed znaczącymi działaniami. Operator odrzuca określone zadania wysokiego ryzyka i wymaga bezpośredniego nadzoru na wrażliwych platform. Środki dochodzeniowe obejmują ostrożną nawigację w celu zapobiegania szybkim zastrzykom, systemowi monitorowania w celu zatrzymania operacji podczas podejrzanych działań oraz zautomatyzowanego rurociągu wykrywania w celu zaktualizowanych zabezpieczeń.
Co to jest operator Openai i jak to działa?
Operator jest agentem AI ogólnym, który może autonomicznie wykonywać zadania w Internecie za pomocą dedykowanej przeglądarki. Współdziała z stronami internetowymi, klikając przyciski, nawigając w menu i wypełniając formularze.
Czym operator różni się od innych narzędzi AI, takich jak Siri, Alexa lub Asystent Google?
W przeciwieństwie do tradycyjnych asystentów, operator nie tylko przetwarza informacje; Może wykonywać działania w Internecie, takie jak rezerwacja zakwaterowania lub zamawianie artykułów spożywczych, poprzez bezpośrednią interakcję ze stronami internetowymi.
Jakie zadania może działać operator autonomicznie?
Może obsługiwać powtarzające się zadania, takie jak rezerwacja podróży, zamawianie jedzenia, dokonywanie rezerwacji i zakupy online.
Dlaczego operator jest uruchamiany jako podgląd badań?
Podgląd badań pozwala Openai na gromadzenie informacji zwrotnej, poprawę bezpieczeństwa i udoskonalanie narzędzia przed szerszym wdrożeniem.
Jaki jest model agenta użytkowania komputerowego (CUA) i jak umożliwia operatora interakcję ze stronami internetowymi?
CUA łączy możliwości widzenia GPT-4O z zaawansowanym rozumowaniem, umożliwiając operatorowi widzenie i interakcję z graficznymi interfejsami użytkownika, takimi jak przyciski i formularze.
Czy operator może wykonywać złożone zadania, takie jak tworzenie slajdów lub zarządzanie kalendarzami?
Jeszcze nie. Operator zmaga się ze złożonymi interfejsami i specjalistycznymi przepływami pracy.
Jakie są ograniczenia stawki lub ograniczenia zadań korzystania z operatora?
Operator ma dynamiczne codzienne i specyficzne dla zadań limity użytkowania i nie może wykonywać zadań, takich jak wysyłanie e-maili lub obsługa captchas.
W jaki sposób operator obsługuje wrażliwe zadania, takie jak bankowość lub wprowadzanie szczegółów płatności?
Wymaga nadzoru użytkownika w zakresie wrażliwych działań, takich jak wprowadzanie szczegółów płatności lub logowania, i nie przechowuje takich danych.
W jaki sposób OpenAI zapewnia bezpieczeństwo i niezawodność operatora?
Operator został zaprojektowany z zabezpieczeniami, w tym potwierdzeniem użytkowników, tryb przejęcia wrażliwych danych wejściowych i monitorowanie złośliwej aktywności.
Jakie są zabezpieczenia, aby zapobiec popełnianiu błędów lub niewłaściwie wykorzystywania operatora?
Prosi o potwierdzenie użytkownika przed wykonaniem znaczących działań i wykorzystuje systemy monitorowania w celu zatrzymania zadań w przypadku wykrycia podejrzanej aktywności.
W jaki sposób operator zajmuje się obawami dotyczącymi prywatności i czy użytkownicy mogą zrezygnować z gromadzenia danych?
Użytkownicy mogą zrezygnować z gromadzenia danych, usuwać dane przeglądania i kontrolować ustawienia prywatności za pośrednictwem interfejsu operatora.
Co się stanie, jeśli operator napotyka próby phishingowe lub złośliwe strony internetowe?
Jest wyszkolony do wykrywania i ignorowania złośliwych nakładów, a system monitorowania może zatrzymać zadania, jeśli wystąpi coś podejrzanego.
Kto może korzystać z operatora i ile to kosztuje?
Obecnie operator jest dostępny dla użytkowników USA w planie subskrypcji Pro Chatgpt w wysokości 200 USD.
Kiedy operator będzie dostępny poza USA, szczególnie w Europie?
Openai planuje wprowadzić go na całym świecie, ale Europa może potrwać dłużej z powodu rozważań regionalnych.
Czy operator ostatecznie zostanie uwzględniony we wszystkich poziomach subskrypcji chatgpt?
Tak, Openai planuje rozszerzyć dostęp do poziomów Plus, Team i Enterprise.
Czy programiści będą mogli budować niestandardowe narzędzia za pomocą modelu CUA w przyszłości?
Tak, Openai planuje wydać model CUA w API dla programistów do tworzenia własnych agentów.
Z którymi firmami współpracuje z operatorem i jak to przynosi korzyści użytkownikom?
Openai współpracuje z firmami takimi jak Doordash, Instacart i Uber, aby zoptymalizować funkcjonalność operatora, jednocześnie szanując warunki świadczenia usług.
Wyróżniony obraz obrazu: Openai