Openai uwalnia aplikację Sora 2, iOS z rzeczywistymi wkładkami

Openai ogłosił wydanie Sora 2, flagowego modelu generowania wideo i audio. Nowy model, który ma zwiększoną dokładność fizyczną, większą kontrolę użytkownika i możliwość wstawienia elementów w świecie rzeczywistym do wygenerowanych scen, jest wdrażany za pośrednictwem nowej aplikacji społecznościowej na iOS o nazwie „Sora”. To wydanie oznacza znaczący krok naprzód w stosunku do oryginalnego modelu Sora wprowadzonego na rynek w lutym 2024 r. Openai opisuje ten postęp jako potencjalny „moment GPT-3.5 dla wideo”, co wskazuje na znaczny skok możliwości i wydajności.

Kluczowe ulepszenia w Sora 2

Sora 2 wprowadza kilka głównych postępów w stosunku do swojego poprzednika, zbliżając się do celu stworzenia funkcjonalnego symulatora świata.

Zwiększona dokładność fizyczna: Poprzednie modele wideo były często „nadmiernie optymistyczne”, lekceważenie realistycznej fizyki w celu wypełnienia wiersza użytkownika. Sora 2 pokazuje bardziej ugruntowaną symulację fizycznych przepisów, dokładnie modelując wyniki, takie jak nieudany strzał w koszykówkę odbijający się z tablicy, zamiast teleportować się w obręcz.
Zaawansowana sterowalność użytkownika: Model może przestrzegać skomplikowanych instrukcji wielu strzałów przy jednoczesnym utrzymaniu stanu wygenerowanego świata w różnych scenach i kątach aparatu, umożliwiając bardziej złożone i spójne narracje wideo. Pokazuje również biegłość w różnych stylach estetycznych, w tym realistycznych, filmowych i anime.
Integracja elementów w świecie rzeczywistym: Użytkownicy mogą teraz wstrzykiwać elementy z rzeczywistego świata w wygenerowane środowiska. Nagrywając wideo osoby, zwierzęcia lub obiektu, model może umieścić ten element w dowolnej scenie generowanej przez Sora, dokładnie przedstawiając jej wygląd i głos.

Funkcja aplikacji społecznej i kamei Sora

Openai wdraża nowy model za pośrednictwem aplikacji Social iOS zaprojektowanej do tworzenia i udostępniania treści wideo. Główną cechą aplikacji jest „sceny”, która operacjonalizuje zdolność modelu do wstawienia elementów świata rzeczywistych. Aby utworzyć kameę, użytkownik rejestruje krótki klip wideo i audio w aplikacji, który przechwytuje ich podobieństwo i głos do użytku w pokoleniach. Użytkownicy mają pełną kontrolę nad swoim osobistym podobieństwo i mogą zdecydować, kto może korzystać z ich kamei. Mogą również odwołać dostęp lub usunąć każdy film zawierający ich kameę w dowolnym momencie.

Skoncentruj się na dobrostanie użytkowników i bezpieczeństwo

Uruchamiając aplikację, OpenAI przedstawia środki w celu rozwiązania problemów takich jak uzależnienie cyfrowe i izolacja społeczna.

Filozofia Feed: Algorytm kanałów aplikacji został zaprojektowany w celu „maksymalizacji tworzenia, a nie konsumpcji”, priorytetów treści od osób, które obserwuje użytkownik, a treści mogą zainspirować ich własną pracę twórczą. Openai stwierdza, że „nie jest optymalizowanie czasu spędzonego w karmieniu”.
Bezpieczeństwo nastolatków: Szczególne zabezpieczenia dla nastoletnich użytkowników zawierają domyślne dzienne limity liczby pokoleń, które mogą wyświetlić, oraz surowsze uprawnienia dotyczące korzystania z ich kamei. OpenAI uruchamia również kontrole rodzicielskie za pośrednictwem CHATGPT w celu zarządzania ustawieniami kont nastolatków.
Umiar: Oprócz zautomatyzowanych systemów bezpieczeństwa firma zwiększa swoje zespoły ludzkich moderatorów w celu przeglądu potencjalnych przypadków zastraszania.

Dostępność i dostęp

Aplikacja Sora iOS jest teraz dostępna do pobrania w Stanach Zjednoczonych i Kanadzie, z planami ekspansji na inne kraje. Dostęp jest wprowadzany w systemie zaproszonym, aby zachęcić użytkowników do przyłączenia się do ich przyjaciół.

Wycena: Usługa będzie początkowo bezpłatna, z „hojnymi limitami na początek”. Openai stwierdził, że jego jedynym obecnym planem monetyzacji jest ostatecznie umożliwienie użytkownikom płacenia za dodatkowe pokolenia, jeśli popyt przekroczy dostępne zasoby obliczeniowe.
Sora 2 Pro: Subskrybenci Chatgpt Pro będą mieli dostęp do eksperymentalnej wersji modelu o nazwie Sora 2 Pro, która będzie dostępna na stronie Sora.com.
Dostęp do API: Openai planuje wydać SORA 2 za pośrednictwem interfejsu API dla programistów. Poprzedni model, Sora 1 Turbo, pozostanie dostępny.

Openai postrzega szybką poprawę modeli wideo za kluczowy krok w kierunku rozwoju ogólnego systemu światowego i agentów robotycznych, przedstawiając Sora 2 jako „znaczący postęp w kierunku tego celu”.

Polecane wizerunki

Tags: Openai Sora 2 Wyróżniony

Openai uwalnia aplikację Sora 2, iOS z rzeczywistymi wkładkami

Related Posts

Qwen Code v0.5.0 firmy Alibaba przekształca terminal w pełny ekosystem deweloperski

ChatGPT ewoluuje w pakiet biurowy z nowymi blokami formatowania

Google NotebookLM przedstawia "Tryb wykładu" na 30-minutową naukę sztucznej inteligencji

Amazon dodaje Angi, Expedia, Square i Yelp do Alexa+

Robotaxis Waymo może otrzymać asystenta samochodowego Gemini AI

Dlaczego NVIDIA pomija procesor Intel 18A w swoich układach AI nowej generacji

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Openai uwalnia aplikację Sora 2, iOS z rzeczywistymi wkładkami

Kluczowe ulepszenia w Sora 2

Funkcja aplikacji społecznej i kamei Sora

Skoncentruj się na dobrostanie użytkowników i bezpieczeństwo

Dostępność i dostęp

Related Posts

Qwen Code v0.5.0 firmy Alibaba przekształca terminal w pełny ekosystem deweloperski

ChatGPT ewoluuje w pakiet biurowy z nowymi blokami formatowania

Google NotebookLM przedstawia "Tryb wykładu" na 30-minutową naukę sztucznej inteligencji

Amazon dodaje Angi, Expedia, Square i Yelp do Alexa+

Robotaxis Waymo może otrzymać asystenta samochodowego Gemini AI

Dlaczego NVIDIA pomija procesor Intel 18A w swoich układach AI nowej generacji

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us