Hugging Face wydał Open Computer Agent, bezpłatne, przeżywane przez chmurę narzędzie AI, które może wykonywać zadania na wirtualnym komputerze Linux wstępnie z aplikacjami takimi jak Firefox. Agent, dostępny za pośrednictwem Internetu, może zostać poproszony o wykonanie zadań, takich jak poruszanie się po Mapach Google lub wyszukiwanie informacji.
Podobne do operatora Openai, Otwórz agent komputerowy Działa, otwierając niezbędne programy i ustalając wymagane kroki w celu wykonania zadania. Jednak w testowaniu Techcrunch walczyło z bardziej skomplikowanymi prośbami, takimi jak wyszukiwanie lotów i często spotykane testy Captcha, których nie mógł rozwiązać.
Użytkownicy mogą również doświadczać czasu oczekiwania od sekund do minut z powodu wirtualnej kolejki, w zależności od popytu. Aymeric Roucher, członek zespołu Agentów Hugging Face, powiedział, że celem jest wykazanie, że otwarte modele AI stają się coraz bardziej zdolne i tańsze w obsłudze infrastruktury w chmurze.
„W miarę jak modele wizji stają się bardziej zdolne, stają się w stanie zasilać złożone przepływy pracy agencji”, Aymeric Roucher, stwierdzono W poście na X. ”[Some of these models] Wsparcie wbudowane, tj. [the] możliwość zlokalizowania dowolnego elementu na obrazie przez jego współrzędne, [and] zatem [can] Kliknij dowolny element [in a virtual machine]. ”
Roucher zauważył, że postępy w modelach wizji, takie jak QWEN-VL, umożliwiają złożone agentowe przepływy pracy, obsługując wbudowane uziemienie, umożliwiając im lokalizowanie i interakcję z elementami na obrazie. Wydanie ma na celu zaprezentowanie potencjału otwartych modeli AI.
Rozwój technologii agencyjnej przyciąga znaczne inwestycje, ponieważ przedsiębiorstwa chcą zwiększyć wydajność. Badanie KPMG wykazało, że 65% firm eksperymentuje z agentami AI oraz projektami rynków i rynków, które segment agentów AI wzrośnie z 7,84 miliarda dolarów w 2025 r. Do 52,62 mld USD do 2030 r.