Antropic ma wystrzelony Claude 3.7, pierwszy na świecie model AI zdolny do wytworzenia standardowego wyjścia lub kontrolowanej ilości „rozumowania” w celu rozwiązania złożonych problemów. Ten model hybrydowy został zaprojektowany w celu zwiększenia interakcji użytkowników i programistów poprzez umożliwienie równowagi między reakcjami instynktownymi a metodycznym rozumowaniem.
Antropic zaprezentuje Claude 3.7: Pierwszy model rozumowania hybrydowego AI

Michael Gerstenhaber, przewód produktu w Anthropic, stwierdził: „ [user] Ma dużą kontrolę nad zachowaniem – jak długo myśli, i może handlować rozumowaniem i inteligencją czasem i budżetem. ” Claude 3.7 wprowadza funkcję „Scratchpad”, która wyświetla proces rozumowania modelu, czerpiąc inspirację z popularnego chińskiego modelu AI Deepseek. Ta funkcjonalność pomaga użytkownikom w zrozumieniu podejścia modelu do rozwiązywania problemów, ułatwiając szybkie dostosowania.
Dianne Penn, kierownik ds. Badań w antropiku, podkreśliła skuteczność Scratchpad w tandemie z możliwością regulowanego rozumowania. Użytkownicy mogą poinstruować model, aby przeznaczył więcej czasu na rozdzielczość problemu, jeśli początkowe próby nie dają pożądanego awarii.

Hybrydowa struktura Claude 3.7 odróżnia go od konkurentów. Podczas gdy Openai wydało model rozumowania o nazwie O1 we wrześniu 2024 r., A później bardziej niezawodna wersja o nazwie O3, oba wymagają od użytkowników przełączania między modelami w celu uzyskania dostępu do funkcji rozumowania. Claude 3.7 Anthropica pozwala na bezproblemowe przełączanie między konwencjonalnymi odpowiedziami a rozszerzonym rozumowaniem, co jest znaczącą przewagą.
Model hybrydowy jest zgodny z ramami rozumowania opisanymi przez zdobywcę nagrody Nobla Daniela Kahneman w swojej książce „Thinking, Fast and Slow”, oferujący zarówno instynktowne, jak i celowe procesy poznawcze. Standardowe modele, takie jak duże modele językowe (LLM), zazwyczaj generują natychmiastowe odpowiedzi, ale mogą zaważyć się zadaniami wymagającymi dokładnego rozumowania, takich jak obliczenia arytmetyczne.
Aby zwiększyć możliwości Claude 3.7, antropic zastosował uczenie się wzmocnienia, aby przeszkolił model z dodatkowymi danymi koncentrującymi się na aplikacjach biznesowych, takich jak kodowanie i zapytania prawne. Penn zauważył, że „rzeczy, na które wprowadziliśmy ulepszenia, to […] Podmioty techniczne lub osoby wymagające długiego rozumowania. ” Model przewyższył O1 Openai w określonych ramach, takich jak SWE-Bench podczas rozwiązywania złożonych wyzwań kodowania.
Claude AI może teraz doskonale odzwierciedlać twój styl pisania
Kod Claude
Firma wprowadziła Claude Code, nowe narzędzie zaprojektowane w celu pomocy w zadaniach kodowania AI, które dobrze sobie radzą w złożonych scenariuszach. „Model jest już dobry w kodowaniu” – dodał Penn. „[But] Dodatkowe myślenie byłoby dobre w przypadkach, które mogą wymagać bardzo skomplikowanego planowania – jak patrzysz na wyjątkowo dużą bazę kodu dla firmy. ”

Sonet Claude 3.7 jest dostępny we wszystkich planach Claude – Free, Pro, Team i Enterprise – podobnie jak poprzez API API, Amazon Bedrock i Vertex AI Google Cloud. Model utrzymuje taką samą strukturę cenową, co jego poprzednicy: 3 tokeny wejściowe 3 USD i 15 USD za milion tokenów wyjściowych, które obejmują tokeny myślenia.
Anthropic opracował sonet Claude 3.7 z filozofią, która integruje rozumowanie jako podstawowy element modelu. Działa zarówno jako zaktualizowany zwykły LLM, jak i model rozumowania, umożliwiając użytkownikom wybór, kiedy chcą bezpośrednich odpowiedzi lub dłuższe, bardziej odblaskowe odpowiedzi. W trybie rozszerzonego myślenia Claude 3.7 udoskonala swoje odpowiedzi, zwiększając wydajność zadań z matematyki, fizyki, instrukcji i kodowania.
Korzystając z Sonet Claude 3.7 za pośrednictwem interfejsu API, użytkownicy mogą kontrolować swój „myślenie” budżetu, określając maksymalną liczbę tokenów. Ta elastyczność pozwala użytkownikom na priorytety prędkości w porównaniu z jakością wyniku.
Ostatnie oceny Claude wskazują na przywództwo w możliwościach kodowania na wielu platformach. Kursor uznał Claude jako najlepszy w klasie dla rzeczywistych zadań kodowania, z postępami w zarządzaniu skomplikowanymi bazami kodowymi. Cognition zgłosiło doskonałą wydajność w planowaniu zmian kodu, podczas gdy Vercel odnotował swoją dokładność w nawigacji złożonych przepływów pracy agenta. Replit skutecznie wykorzystała Claude do opracowania wyrafinowanych aplikacji internetowych, a testy przeprowadzone przez Canva ujawniły, że Claude konsekwentnie dostarcza kod gotowy do produkcji o lepszej jakości projektu i znacznie mniejszej liczbie błędów.
Kod Claude, obecnie w ograniczonym podglądzie badawczym, funkcjonuje jako narzędzie do współpracy, które może odczytać, edytować kod, uruchamiać testy i interakcje z GitHub, usprawniając proces kodowania. Wczesne testy wykazały, że kod Claude może wykonywać zadania podczas jednej sesji, która zwykle wymaga szeroko zakrojonego ręcznego wysiłku. Przyszłe ulepszenia koncentrują się na niezawodności narzędzi, długiej obsługi poleceń i lepszej wydajności.
Antropic podkreślił swoje zaangażowanie w rozwój Sonet Claude 3.7, ze szczególnym uwzględnieniem bezpieczeństwa, bezpieczeństwa i niezawodności. Claude 3.7 dokonał dostrzegalnych rozróżnień między łagodnymi i szkodliwymi żądaniami, osiągając 45% zmniejszenie niepotrzebnych odmów w porównaniu z jego poprzednikiem. Towarzysząca karta systemowa opisuje oceny bezpieczeństwa, które mogłyby skorzystać na innych inicjatywach badawczych AI i odnoszące się do pojawiających się ryzyka, w tym szybkich ataków wtrysku.
Claude 3.7 Sonnet i Claude Code reprezentują znaczny postęp w stosunku do systemów AI, które mogą skutecznie wspierać ludzkie możliwości poprzez integrację głębokiego rozumowania i autonomicznej współpracy.
Wyróżniony obraz Kredyt: antropiczny