Firma Anthropic ogłosiła wprowadzenie na rynek dwóch nowych modeli sztucznej inteligencji: ulepszonego Claude 3.5 Sonnet i nowego Claude 3.5 Haiku. Ulepszony Claude 3.5 Sonnet oferuje wszechstronne ulepszenia, ze znacznym wzrostem możliwości kodowania. Nowy Claude 3.5 Haiku oferuje zaawansowane funkcje AI w przystępnej cenie, dorównując wydajnością poprzedniemu flagowemu modelowi Anthropic, Claude 3 Opus, zachowując przy tym podobną prędkość i koszt jak jego poprzednik.
Klaudiusz 3.5 Sonet
Ulepszony Claude 3.5 Sonnet opiera się na sukcesie swojego poprzednika, zapewniając zwiększoną wydajność w różnych zadaniach, zwłaszcza w kodowaniu. Anthropic podkreśliło, że Claude 3.5 Sonnet przoduje w zadaniach związanych z inżynierią oprogramowania, wykazując wyraźną poprawę w testach porównawczych, takich jak Zweryfikowano na ławce SWEgdzie poprawił się z 33,4% do 49,0%, przewyższając inne modele na rynku.
Model spisał się również dobrze w przypadku agentycznego użycia narzędzi, poprawiając wyniki w Ławka TAU z 62,6% do 69,2% w segmencie detalicznym i z 36,0% do 46,0% w segmencie linii lotniczych. Według wczesnych testerów, takich jak GitLab i Cognition, ulepszenia te stanowią znaczący krok naprzód w zakresie kodowania i automatyzacji opartej na sztucznej inteligencji, z lepszymi możliwościami wnioskowania i minimalnym dodatkowym opóźnieniem.
Klaudiusz 3.5 Haiku
Claude 3.5 Haiku został zaprojektowany tak, aby oferować najnowocześniejszą wydajność przy jednoczesnym utrzymaniu niskich kosztów. Model osiąga wysokie wyniki w testach porównawczych, takich jak SWE-bench Verified, osiągając 40,6%, co przewyższa wielu agentów korzystających z innych najnowocześniejszych modeli, w tym oryginalnego Claude 3.5 Sonnet i GPT-4o. Model ma służyć aplikacjom wymagającym szybkiej i niezawodnej sztucznej inteligencji, takim jak produkty skierowane do użytkownika i zadania wymagające spersonalizowanych doświadczeń.
Anthropic wypuści Claude 3.5 Haiku pod koniec tego miesiąca, początkowo dostępny jako model tekstowy z planami obsługi wprowadzania obrazu w przyszłości. Będzie dostępny za pośrednictwem API Anthropic, Amazon Bedrock i Vertex AI Google Cloud.
Claude AI firmy Anthropic jest teraz na Twoim iPadzie
Korzystanie z komputera jest dostępne w ramach eksperymentalnej publicznej wersji beta
Anthropic też wprowadzony nową eksperymentalną funkcję o nazwie „korzystanie z komputera” dostępną w publicznej wersji beta. Programiści mogą poinstruować Claude 3.5 Sonnet, aby używał komputerów jak człowiek — patrzał na ekrany, poruszał kursorami i pisał. Ta funkcja jest wciąż w fazie eksperymentalnej, z pewnymi ograniczeniami, ale programiści tacy jak Replit i The Browser Company zaczęli już badać, w jaki sposób mogłaby ona zautomatyzować złożone procesy składające się z wielu kroków.
Ta funkcja ma na celu nauczenie AI ogólnych umiejętności obsługi komputera, dzięki czemu będzie ona bardziej wszechstronna w wykonywaniu zadań, które wcześniej wymagały niestandardowych narzędzi. Programiści mogą uzyskać dostęp do tej wersji beta za pośrednictwem interfejsu API Anthropic i innych głównych platform chmurowych. Chociaż wstępne wyniki są obiecujące, Anthropic przyznaje, że technologia wciąż się rozwija, co stwarza wyzwania w wykonywaniu niektórych typowych zadań komputerowych, takich jak przewijanie i przeciąganie.
Firmy takie jak Asana, Canva, Cognition i DoorDash eksperymentują z nowymi funkcjami, badając potencjał sztucznej inteligencji w automatyzacji procesów, które tradycyjnie wymagały udziału człowieka. Wczesne testy przeprowadzone przez amerykański Instytut Bezpieczeństwa AI i brytyjski Instytut Bezpieczeństwa wykazały, że zaktualizowany Claude 3.5 Sonnet spełnia standardy bezpieczeństwa Anthropic i nadaje się do użytku publicznego.
Anthropic zajmuje się także potencjalnymi zagrożeniami związanymi ze zdolnością sztucznej inteligencji do interakcji z komputerami. Aby zapewnić odpowiedzialne wdrażanie, firma wdrożyła nowe środki bezpieczeństwa umożliwiające identyfikację nadużyć, w tym klasyfikatory wykrywające potencjalnie szkodliwe działania. Anthropic zachęca programistów do korzystania z funkcji beta do zadań niskiego ryzyka, dopóki technologia będzie dojrzewać.
Wydanie przez firmę Anthropic udoskonalonych rozwiązań Claude 3.5 Sonnet i Claude 3.5 Haiku podkreśla dążenie firmy do rozszerzania możliwości sztucznej inteligencji przy jednoczesnym zachowaniu standardy bezpieczeństwa. Dodanie możliwości eksperymentalnego wykorzystania komputera stanowi nowatorski krok naprzód w zakresie potencjału sztucznej inteligencji do wykonywania zadań ogólnego przeznaczenia, dając programistom nowe możliwości eksploracji.
Kredyty obrazkowe: Antropiczny