OpenAI ma wystrzelony Sora, model sztucznej inteligencji przekształcający tekst na wideo, udostępniający go użytkownikom w USA i wielu innych krajach. Zaprezentowana w lutym Sora umożliwia użytkownikom generowanie filmów na podstawie podpowiedzi tekstowych, animowanie obrazów i remiksowanie filmów. Działa w ramach wielopoziomowego modelu subskrypcji, oferując ograniczony dostęp osobom niebędącym subskrybentami.
Jak teraz korzystać z OpenAI Sora?
Sora jest dostępna przez Sora.com dla użytkowników ChatGPT, oferując różne możliwości w zależności od poziomów subskrypcji. Abonenci ChatGPT Plus mogą stworzyć do 50 filmów w rozdzielczości do 720p, natomiast abonenci ChatGPT Pro płacą 200 dolarów miesięcznie za nieograniczone generowanie wideo, rozdzielczość 1080p i dodatkowe funkcje, takie jak jednoczesne przesyłanie i pobieranie bez znaku wodnego. Publiczna dostępność produktu następuje po tygodniu zawieszenia usługi z powodu nieautoryzowanego dostępu backdoorem stworzonego przez artystów protestujących przeciwko praktykom OpenAI.
OpenAI podkreśliło, że filmy generowane za pośrednictwem Sory będą zawierać widoczne znaki wodne i metadane C2PA umożliwiające identyfikację pochodzenia sztucznej inteligencji. Użytkownicy muszą potwierdzić, że przesłane treści nie obejmują osób nieletnich, treści dla dorosłych ani materiałów chronionych prawem autorskim. Niewłaściwe korzystanie z platformy może prowadzić do blokowania kont, ponieważ OpenAI dąży do zrównoważenia ekspresji twórczej środkami zapobiegającymi nielegalnym działaniom.
Podczas wydarzenia inaugurującego OpenAI zaprezentowano funkcjonalności Sory, w tym stronę „eksploracji”, na której użytkownicy mogą oglądać filmy utworzone przez innych, oraz funkcję „scenorysów”, która umożliwia tworzenie filmów na podstawie kolejnych podpowiedzi. Usługa obejmuje również narzędzie do „remiksowania” umożliwiające modyfikowanie wyników generowanych przez sztuczną inteligencję i łączenie efektów wizualnych. Jednak OpenAI przyznało, że możliwości Sory nie są bezbłędne, powołując się na reakcje wczesnych testerów: od imponujących po wykazujące „dziwne wady wizualne”.
Choć w wersji Turbo może pochwalić się wyższą wydajnością w porównaniu z lutową wersją zapoznawczą, Sora zmaga się z realistyczną fizyką i złożonymi działaniami przez dłuższy czas. OpenAI zdaje sobie sprawę z tych ograniczeń, ale podkreśla ich zamiar zapewnienia społeczeństwu czasu na zbadanie możliwości tej technologii i współtworzenie norm odpowiedzialnego użytkowania w miarę rozwoju możliwości generowania wideo.
Wideo: OpenAI
Przejrzystość i bezpieczeństwo pozostają kluczowymi elementami wdrożenia Sory. Każdy film wygenerowany przez Sorę zawiera metadane C2PA umożliwiające weryfikację jego pochodzenia, a także widoczne znaki wodne umożliwiające rozróżnienie treści AI. OpenAI wdrożyło także zaawansowane zabezpieczenia blokujące szkodliwe nadużycia, w tym treści takie jak materiały przedstawiające wykorzystywanie seksualne dzieci (CSAM) i fałszywe treści o charakterze seksualnym. Na razie funkcja umożliwiająca przesyłanie podobizny jest dostępna tylko dla małej grupy testerów i podlega ścisłym zasadom moderacji. OpenAI planuje udoskonalić swoje wysiłki w zakresie łagodzenia skutków deepfake przed dalszym rozszerzeniem dostępu, wykorzystując spostrzeżenia z red-teamingu i partnerstwa z organizacjami pozarządowymi, aby zapewnić bezpieczne i godne zaufania środowisko.
YouTube żąda odpowiedzi na temat danych treningowych Sory
Nie jest jasne, czy Sora będzie dostępna w Wielkiej Brytanii lub w innych częściach Europy, ponieważ OpenAI radzi sobie z kwestiami zgodności związanymi z przepisami dotyczącymi praw autorskich i ochrony danych. Firma przeszła kontrolę swoich praktyk, w tym roszczeń ze strony artystom zarzucającym wykorzystywanie w związku z testowaniem modelu Sora.
Podsumowując, narzędzie OpenAI do konwersji tekstu na wideo, Sora, oferuje takie możliwości, jak generowanie filmów na podstawie podpowiedzi tekstowych, animowanie obrazów i remiksowanie treści generowanych przez sztuczną inteligencję, dzięki czemu tworzenie wideo jest bardziej dostępne i interaktywne. Nie jest to jednak pozbawione ograniczeń – Sora zmaga się z realistyczną fizyką, długotrwałymi, skomplikowanymi akcjami i czasami powoduje defekty wizualne. Chociaż wersja Turbo oferuje szybsze generowanie i wyższe rozdzielczości, te niedoskonałości podkreślają jej wczesny charakter. OpenAI wdrożyło zabezpieczenia, w tym znaki wodne i metadane, aby zapewnić przejrzystość i zapobiegać nadużyciom, mając na celu zrównoważenie kreatywności z odpowiedzialnym wykorzystaniem sztucznej inteligencji w miarę ewolucji technologii.
Premiera Sory podkreśla ciągłe obawy w dziedzinie generowania wideo AI, gdzie możliwości szybko się rozwijają, ale mogą prowadzić do niewłaściwego wykorzystania do dezinformacji lub deepfakes. OpenAI zobowiązało się do ograniczenia niektórych form treści, blokując przesyłanie plików zawierających nagość lub szkodliwe przedstawienia.
Autor wyróżnionego obrazu: OpenAI