Dostępna na platformie Amazon Bedrock oferta Amazon Nova obejmuje Nova Micro, wysoce wydajny model zamiany tekstu na tekst, Nova Lite, Nova Pro i Nova Premier — modele multimodalne, które przetwarzają tekst, obrazy i filmy w celu generowania treści tekstowych.
Amazon zaprezentował także dwa dodatkowe modele: Płótno Amazon Novazaprojektowane do tworzenia efektów wizualnych o studyjnej jakości, oraz Kołowrotek Amazon Novaktóry generuje filmy wideo o profesjonalnej jakości.
Rohit Prasad, starszy wiceprezes Amazon Artificial General Intelligence, podkreślił wyjątkową perspektywę Amazon, mówiąc:
„W Amazon używamy prawie 1000 aplikacji AI. Dzięki temu wiemy na wysokim poziomie, gdzie programiści w dalszym ciągu stają przed wyzwaniami. Nasze nowe modele Amazon Nova mają na celu pomóc programistom zarówno w Amazonie, jak i poza nim pokonać te bariery. Oferują wyjątkową inteligencję i możliwości generowania treści, jednocześnie zwiększając opóźnienia, efektywność kosztową, personalizację, generowanie wspomagane wyszukiwaniem (RAG) i funkcjonalności oparte na agentach.
Amazon Nova: Inteligencja i szybkość w działaniu
Linia Nova obejmuje cztery modele: Amazon Nova Micro przewodów charakteryzujących się wyjątkowo niskimi opóźnieniami i kosztami, dzięki czemu idealnie nadaje się do zastosowań tekstowych wymagających szybkich reakcji. Pozostałe trzy modele przesuwają granice multimodalnej sztucznej inteligencji:
- Amazon Nova Lite to opłacalna opcja przetwarzania obrazów, wideo i tekstu z niezwykłą szybkością.
- Amazon NovaPro łączy dokładność, szybkość i efektywność kosztową w przypadku szerokiego zakresu zadań, oferując zaawansowane możliwości w wielu modalnościach.
- Premier Amazona Nova jest najpotężniejszym modelem multimodalnym firmy Amazon, doskonale radzącym sobie ze złożonymi zadaniami rozumowania i służącym jako idealny „nauczyciel” przy opracowywaniu mniejszych, wyspecjalizowanych modeli.
Amazon Nova Micro, Nova Lite i Nova Pro są już dostępne do ogólnego użytku, a Nova Premier zostanie uruchomiona w pierwszym kwartale 2025 r.
Wyniki testów porównawczych wydajności
Modele Nova zostały rygorystycznie przetestowane w oparciu o standardy branżowe. Wyniki pokazują, że modele te niezmiennie radzą sobie z wiodącymi alternatywami lub je przewyższają.
- Amazon Nova Micro zapewnił konkurencyjne wyniki, dorównując lub przewyższając Meta LLaMa 3.1 8B w 11 testach porównawczych i Google Gemini 1.5 Flash-8B w 12 testach. Dzięki wiodącej w branży prędkości wyjściowej wynoszącej 210 tokenów na sekundę idealnie nadaje się do zastosowań wymagających szybkiej reakcji.
- Amazon Nova Lite wykazał dobre wyniki w testach porównawczych, w tym dokładność w zadaniach tekstowych oraz zrozumienie wideo, wykresów i dokumentów, wyróżniając się w testach VATEX, ChartQA i DocVQA.
- Amazon NovaPro zaprezentował swoje możliwości, przewyższając OpenAI GPT-4o w 17 z 20 testów porównawczych i zapewniając wyjątkowe wyniki w zakresie przepływów pracy RAG, wykonywania instrukcji i zadań opartych na agentach.
Obsługa zadań o długim kontekście, wielojęzycznych i multimodalnych
Modele Amazon Nova Micro, Lite i Pro obsługują ponad 200 języków. Nova Micro obsługuje konteksty wejściowe do 128 000 tokenów, podczas gdy Nova Lite i Nova Pro obsługują do 300 000 tokenów lub 30-minutowe przetwarzanie wideo. Amazon planuje rozszerzyć tę liczbę do ponad 2 milionów tokenów na początku 2025 roku.
Ekonomiczne i szybkie działanie
Modele Amazon Nova zostały zaprojektowane tak, aby zapewnić wyjątkową szybkość i efektywność kosztową. W porównaniu do innych najskuteczniejszych modeli w swoich klasach inteligencji na Amazon Bedrock, Nova Micro, Nova Lite i Nova Pro są co najmniej 75% bardziej opłacalne oferując jednocześnie najszybszą wydajność.
Bezproblemowa integracja z Amazon Bedrock
Modele Amazon Nova integrują się bezpośrednio z Amazon Bedrock, w pełni zarządzaną usługą AWS, która zapewnia klientom dostęp do podstawowych modeli wiodących dostawców sztucznej inteligencji i samego Amazona za pośrednictwem jednego wywołania API. Dzięki Bedrock programiści mogą łatwo testować i oceniać modele Nova wraz z innymi opcjami, aby określić najlepsze dopasowanie do swoich zastosowań.
Personalizacja poprzez dostrajanie
Modele Amazon Nova obsługują spersonalizowane dostrajanie, umożliwiając klientom poprawę dokładności, kierując modelami przykładami z własnych danych. Modele uczą się, co jest najważniejsze dla klienta – czy to tekst, obrazy czy filmy – a Amazon Bedrock dostarcza następnie dostosowane, dopracowane odpowiedzi.
Wydajna destylacja dla mniejszych, wyspecjalizowanych modeli
Oprócz dostrajania Nova obsługuje destylacja modelowaumożliwiając transfer wiedzy z dużych modeli o dużej wydajności do mniejszych, szybszych i bardziej opłacalnych modeli bez utraty dokładności.
Zwiększanie dokładności dzięki generowaniu ze wspomaganiem wyszukiwania
Modele Amazon Nova płynnie integrują się z Bazy wiedzy Amazon Bedrockumożliwiając generowanie wspomagane wyszukiwaniem (RAG) dostarczanie odpowiedzi w oparciu o własne dane organizacji z zachowaniem najwyższego poziomu dokładności.
Zoptymalizowany pod kątem zastosowań agentowych
Zaprojektowane, aby wyróżniać się w zadaniach wieloetapowych, modele Nova są zoptymalizowane pod kątem aplikacji opartych na agentach, wymagających interakcji z zastrzeżonymi systemami i danymi za pośrednictwem wielu interfejsów API.
Treści wizualne o jakości produkcyjnej
Płótno Amazon Nova generuje obrazy o profesjonalnej jakości na podstawie tekstu lub podpowiedzi graficznych, z wbudowanymi elementami sterującymi do edycji, dostosowywania kolorów i układów. Zintegrowane zabezpieczenia obejmują znak wodny i moderację treści, aby zapewnić odpowiedzialne korzystanie ze sztucznej inteligencji. W ocenach Nova Canvas uzyskała lepsze wyniki niż modele takie jak OpenAI DALL·E 3 i Stable Diffusion.
Kołowrotek Amazon Nova umożliwia klientom tworzenie wysokiej jakości filmów z tekstu i obrazów. Zaprojektowany do celów reklamowych, marketingowych i edukacyjnych, umożliwia kontrolę nad stylami wizualnymi, tempem i efektami kamery. Nova Reel konsekwentnie przewyższała konkurencję, a recenzenci woleli jej produkcję od Runway Gen-3 Alpha. Chociaż obecnie obsługuje filmy sześciosekundowe, w nadchodzących miesiącach Nova Reel rozszerzy się na generację filmów dwuminutowych.
Patrząc w przyszłość: modele mowy i multimodalne do multimodalnych
W pierwszym kwartale 2025 r. Amazon planuje wypuścić m.in model mowy na mowę zaprojektowany, aby przekształcić aplikacje AI w naturalne interakcje głosowe. Model będzie interpretował język mówiony, ton i tempo, aby zapewnić reakcje podobne do ludzkich przy minimalnym opóźnieniu.
Dodatkowo Amazon opracowuje m.in model multimodalny na multimodalny zdolne do przyjmowania tekstu, obrazów, dźwięku i wideo jako danych wejściowych i wytwarzania wyników w dowolnym z tych modalności. Model ten, przewidziany na połowę 2025 r., uprości aplikacje wymagające tłumaczenia treści, edycji i zrozumienia multimodalności.
Wczesna adopcja
Kilka wiodących organizacji wdraża już modele Nova:
- SOK ROŚLINNY integruje modele Nova z SAP AI Core, aby wspierać rozwiązania oparte na sztucznej inteligencji w automatyzacji, personalizacji i planowaniu łańcucha dostaw.
- Deloitte’a wykorzystuje zaawansowane możliwości personalizacji Nova, aby dostarczać dostosowane do potrzeb usługi generatywnej sztucznej inteligencji na całym świecie.
- Dentsu Digital Inc. wykorzystuje Nova Reel do usprawnienia kreatywnej produkcji wideo, skracając czas trwania kampanii z tygodni do dni.
- Musixmatch włącza Nova Reel do swojej platformy, aby pomóc wschodzącym artystom w generowaniu wysokiej jakości teledysków.
- 123RF upraszcza procesy projektowania dla twórców treści dzięki Nova Canvas i Nova Reel.
- Caylent wykorzystuje modele Nova do przyspieszenia procesów rozumienia wideo dla klientów z branży mediów, sportu i handlu detalicznego.
- Technologie Palantira integruje Nova Pro z systemem Ontology w celu usprawnienia procesów decyzyjnych opartych na sztucznej inteligencji w różnych branżach.
- Shutterstock włącza Nova Canvas do generatora obrazów AI, aby zaoferować intuicyjne rozwiązanie do tworzenia wysokiej jakości treści wizualnych.
AWS opublikowało szczegółowe informacje Karty usług AI w przypadku modeli Nova, zapewniając przejrzystość przypadków użycia, ograniczeń i odpowiedzialnych praktyk AI: