Openai udostępnił programistom ulepszony generator obrazu za pośrednictwem interfejsu API, umożliwiając im zintegrowanie technologii z ich aplikacjami i usługami. Ten ruch nastąpił po wprowadzeniu funkcji w Chatgpt pod koniec marca, generując znaczne zainteresowanie i wykorzystanie.
Nowy generator obrazu, napędzany modelem AI „GPT-IMAGE-1”, może tworzyć obrazy w różnych stylach, przestrzegać niestandardowych wytycznych i renderować tekst. Jest to natywnie multimodalny model, który może wykorzystać światową wiedzę do tworzenia realistycznych obrazów. Deweloperzy mogą generować wiele obrazów jednocześnie i kontrolować jakość i szybkość generowania.
Openai wdrożył środki bezpieczeństwa, aby zapobiec generowaniu treści, które narusza jej zasady. Model obejmuje zabezpieczenia podobne do tych stosowanych w funkcji generowania obrazu Chatgpt, a programiści mogą dostosować wrażliwość moderacji, aby odpowiadać ich potrzebom. Czułość można ustawić na „Auto” w celu standardowego filtrowania lub „niskiego” dla mniej restrykcyjnego filtrowania, przy czym te ostatnie ogranicza mniej kategorii potencjalnie nieznacznej treści.
Zdobądź filtr studio Ghibli tutaj: 5 narzędzi AI, które nadal działają
Wszystkie obrazy utworzone za pomocą GPT-IMAGE-1 są oznaczone wodoodpornymi metadanami C2PA, co czyni je identyfikowalnymi jako generowane przez AI przez obsługiwane platformy i aplikacje. Ceny usługi oparte są na tokenach wejściowych i wyjściowych, a koszty od 2 centów do 19 centów za wygenerowany obraz, w zależności od jakości i wielkości obrazu.
Kilka firm, w tym Adobe, Airtable, Wix, Instacart, Godaddy, Canva i Figma, już korzysta lub eksperymentuje z GPT-Image-1. Na przykład platforma projektowa Figma pozwala teraz użytkownikom generować i edytować obrazy za pomocą modelu, podczas gdy Instacart testuje ją pod kątem generowania obrazów dla przepisów i list zakupowych.