OpenAI ma wystrzelony Możliwości wideo w czasie rzeczywistym w ChatGPT, ulepszające zaawansowany tryb głosowy dzięki zrozumieniu wizualnemu. Ta funkcja, która została udostępniona 12 grudnia, umożliwia użytkownikom interakcję z sztuczną inteligencją za pośrednictwem aparatu i otrzymywanie pomocy kontekstowej. Integracja oznacza znaczny postęp w możliwościach konwersacyjnych sztucznej inteligencji, szczególnie w przypadku osób subskrybujących ChatGPT Plus, Team lub Pro.
OpenAI rozszerza ChatGPT o możliwości wideo w czasie rzeczywistym
Zaawansowany tryb głosowy obejmuje teraz analizę wideo w czasie rzeczywistym i funkcje udostępniania ekranu. Użytkownicy mogą kierować telefony na obiekty, aby uzyskać natychmiastową reakcję, lub udostępnić ekran, aby uzyskać szczegółowe wyjaśnienia dotyczące ustawień lub problemów. Ten dodatek opiera się na poprzednich możliwościach, zapewniając bardziej interaktywne doświadczenia użytkownika. OpenAI zademonstrował tę funkcję podczas transmisji na żywo, prezentując jej zdolność do angażowania się w swobodne rozmowy i dostarczania spostrzeżeń na podstawie danych wizualnych.
Jeśli chodzi o dostępność, wdrażanie rozpoczęło się 12 grudnia i potrwa przez następny tydzień. Jednak europejscy użytkownicy wraz z abonentami ChatGPT Enterprise i Edu mogą napotkać opóźnienia; ci użytkownicy otrzymają dostęp na początku przyszłego roku. To rozszerzenie wskazuje, że OpenAI koncentruje się na ulepszaniu interakcji użytkownika ze sztuczną inteligencją, co jest zgodne z jej nadrzędnym celem, jakim jest zapewnienie zaawansowanych możliwości w ramach pakietu produktów.
Integracje z iOS 18.2
W równoległym rozwoju Apple niedawno wprowadzony iOS 18.2, który zawiera kilka funkcji ChatGPT w Siri, narzędziach do pisania i inteligencji wizualnej. Integracja z Siri pozwala asystentowi głosowemu rozpoznawać zapytania spoza jego zasięgu i przekierowywać je do ChatGPT. Użytkownicy zostaną powiadomieni i muszą zatwierdzić tę czynność, zanim będzie ona kontynuowana.
W przypadku użytkowników urządzeń iPhone 16 funkcja Visual Intelligence umożliwia skierowanie aparatu na obiekty lub sytuacje w celu uzyskania informacji za pośrednictwem ChatGPT lub Google. Co więcej, funkcja Narzędzia do pisania zawiera teraz nowe narzędzie „Utwórz”, umożliwiające tworzenie treści od podstaw przy użyciu możliwości ChatGPT. Funkcje te, kładące nacisk na użyteczność i kontrolę użytkownika, zostały zaprojektowane tak, aby odpowiadały limitom użytkowania ChatGPT, zapewniając zorganizowane doświadczenie.
Aktualizacje z „12 dni OpenAI”
OpenAI zorganizowało kampanię o nazwie „12 dni OpenAI”, która rozpocznie się 5 grudnia i obejmuje codzienne sesje transmitowane na żywo, prezentujące nowe funkcje lub produkty. Dyrektor generalny Sam Altman opisał kampanię jako mieszankę znaczących aktualizacji i drobnych ulepszeń. Wśród godnych uwagi zapowiedzi znalazło się wprowadzenie nowego głosu Świętego Mikołaja w zaawansowanym trybie głosowym, który użytkownicy mogą aktywować za pomocą ikony płatka śniegu.
Dodatkowo kampania odsłonięty Sora, nowy model wideo OpenAI, teraz dostępny dla CzatGPT Pro i użytkowników Plusa. Model ten może generować treści tekstowe i wideo, znacznie poszerzając możliwości twórcze dostępne dla użytkowników. Inne godne uwagi aktualizacje obejmowały ogłoszenie Canvas dla wszystkich użytkowników Internetu, wcześniej funkcja beta, umożliwiająca bardziej zintegrowane zarządzanie projektami.
Patrząc w przyszłość, OpenAI planuje rozszerzyć swoją ofertę, w tym pełną wersję modelu językowego o1, mającą na celu dalsze zwiększanie możliwości wnioskowania. Celem firmy jest szersze udostępnienie narzędzia Reinforcement Fine-Tuning, którego aplikacje są obecnie poszukiwane przez instytuty badawcze i uniwersytety w celu dostrajania modeli sztucznej inteligencji do konkretnych zadań.
Autor wyróżnionego obrazu: OpenAI