Openai ogłosił wydanie Sora 2, flagowego modelu generowania wideo i audio. Nowy model, który ma zwiększoną dokładność fizyczną, większą kontrolę użytkownika i możliwość wstawienia elementów w świecie rzeczywistym do wygenerowanych scen, jest wdrażany za pośrednictwem nowej aplikacji społecznościowej na iOS o nazwie „Sora”. To wydanie oznacza znaczący krok naprzód w stosunku do oryginalnego modelu Sora wprowadzonego na rynek w lutym 2024 r. Openai opisuje ten postęp jako potencjalny „moment GPT-3.5 dla wideo”, co wskazuje na znaczny skok możliwości i wydajności.
Kluczowe ulepszenia w Sora 2
Sora 2 wprowadza kilka głównych postępów w stosunku do swojego poprzednika, zbliżając się do celu stworzenia funkcjonalnego symulatora świata.
- Zwiększona dokładność fizyczna: Poprzednie modele wideo były często „nadmiernie optymistyczne”, lekceważenie realistycznej fizyki w celu wypełnienia wiersza użytkownika. Sora 2 pokazuje bardziej ugruntowaną symulację fizycznych przepisów, dokładnie modelując wyniki, takie jak nieudany strzał w koszykówkę odbijający się z tablicy, zamiast teleportować się w obręcz.
- Zaawansowana sterowalność użytkownika: Model może przestrzegać skomplikowanych instrukcji wielu strzałów przy jednoczesnym utrzymaniu stanu wygenerowanego świata w różnych scenach i kątach aparatu, umożliwiając bardziej złożone i spójne narracje wideo. Pokazuje również biegłość w różnych stylach estetycznych, w tym realistycznych, filmowych i anime.
- Integracja elementów w świecie rzeczywistym: Użytkownicy mogą teraz wstrzykiwać elementy z rzeczywistego świata w wygenerowane środowiska. Nagrywając wideo osoby, zwierzęcia lub obiektu, model może umieścić ten element w dowolnej scenie generowanej przez Sora, dokładnie przedstawiając jej wygląd i głos.
Funkcja aplikacji społecznej i kamei Sora
Openai wdraża nowy model za pośrednictwem aplikacji Social iOS zaprojektowanej do tworzenia i udostępniania treści wideo. Główną cechą aplikacji jest „sceny”, która operacjonalizuje zdolność modelu do wstawienia elementów świata rzeczywistych. Aby utworzyć kameę, użytkownik rejestruje krótki klip wideo i audio w aplikacji, który przechwytuje ich podobieństwo i głos do użytku w pokoleniach. Użytkownicy mają pełną kontrolę nad swoim osobistym podobieństwo i mogą zdecydować, kto może korzystać z ich kamei. Mogą również odwołać dostęp lub usunąć każdy film zawierający ich kameę w dowolnym momencie.
Skoncentruj się na dobrostanie użytkowników i bezpieczeństwo
Uruchamiając aplikację, OpenAI przedstawia środki w celu rozwiązania problemów takich jak uzależnienie cyfrowe i izolacja społeczna.
- Filozofia Feed: Algorytm kanałów aplikacji został zaprojektowany w celu „maksymalizacji tworzenia, a nie konsumpcji”, priorytetów treści od osób, które obserwuje użytkownik, a treści mogą zainspirować ich własną pracę twórczą. Openai stwierdza, że „nie jest optymalizowanie czasu spędzonego w karmieniu”.
- Bezpieczeństwo nastolatków: Szczególne zabezpieczenia dla nastoletnich użytkowników zawierają domyślne dzienne limity liczby pokoleń, które mogą wyświetlić, oraz surowsze uprawnienia dotyczące korzystania z ich kamei. OpenAI uruchamia również kontrole rodzicielskie za pośrednictwem CHATGPT w celu zarządzania ustawieniami kont nastolatków.
- Umiar: Oprócz zautomatyzowanych systemów bezpieczeństwa firma zwiększa swoje zespoły ludzkich moderatorów w celu przeglądu potencjalnych przypadków zastraszania.
Dostępność i dostęp
Aplikacja Sora iOS jest teraz dostępna do pobrania w Stanach Zjednoczonych i Kanadzie, z planami ekspansji na inne kraje. Dostęp jest wprowadzany w systemie zaproszonym, aby zachęcić użytkowników do przyłączenia się do ich przyjaciół.
- Wycena: Usługa będzie początkowo bezpłatna, z „hojnymi limitami na początek”. Openai stwierdził, że jego jedynym obecnym planem monetyzacji jest ostatecznie umożliwienie użytkownikom płacenia za dodatkowe pokolenia, jeśli popyt przekroczy dostępne zasoby obliczeniowe.
- Sora 2 Pro: Subskrybenci Chatgpt Pro będą mieli dostęp do eksperymentalnej wersji modelu o nazwie Sora 2 Pro, która będzie dostępna na stronie Sora.com.
- Dostęp do API: Openai planuje wydać SORA 2 za pośrednictwem interfejsu API dla programistów. Poprzedni model, Sora 1 Turbo, pozostanie dostępny.
Openai postrzega szybką poprawę modeli wideo za kluczowy krok w kierunku rozwoju ogólnego systemu światowego i agentów robotycznych, przedstawiając Sora 2 jako „znaczący postęp w kierunku tego celu”.





