Google otworzył dla publiczności swój najnowszy pakiet modelu AI, Gemini 2.0, co stanowi znaczący krok w dążeniu do zaawansowanych agentów AI. Suite obejmuje eksperymentalne GEMINI 2.0 Pro, zaprojektowane do kodowania i złożone zadania, a także myślenie Flash Gemini 2.0, teraz dostępne w aplikacji Gemini.
Rodzina Gemini 2.0 jest teraz otwarta dla wszystkich
GEMINI 2.0 Pro Experimental jest opisywany jako najbardziej zdolny model Google, doskonały kodowanie i obsługa skomplikowanych podpowiedzi. Ma okno kontekstowe 2 milionów tokenów, co umożliwia przetwarzanie około 1,5 miliona słów jednocześnie. Model może wywoływać narzędzia, takie jak wyszukiwanie Google i wykonywać kod w imieniu użytkowników. Początkowo drażniona w aplikacji Gemini w zeszłym tygodniu, jest teraz dostępna za pośrednictwem platform programistycznych AI Google, Vertex AI i Google AI Studio, a także z zaawansowanymi subskrybentami Gemini w aplikacji Gemini.
Gemini 2.0 Flash, wprowadzony w grudniu, jest teraz ogólnie dostępny. Odpowiedziany jako „model konia roboczy”, jest zoptymalizowany pod kątem zadań o wysokiej częstotliwości i deweloperów kosztów 10 centów za milion tokenów za dane wejściowe tekstu, obrazu i wideo. Ponadto Google zaprezentował Gemini 2.0 Flash-Lite, jego najbardziej opłacalny model, który pasuje do wydajności jego poprzednika, Gemini 1.5 Flash, po tej samej cenie i prędkości. Flash-Lite kosztuje 0,75 centów za milion tokenów.
Skoncentruj się na agentach AI
. uwolnienie Dopasowuje się do szerszej strategii Google postępowania agencji AI – modele zdolne do autonomicznego wykonywania złożonych, wieloetapowych zadań. W grudniowym poście na blogu Google podkreślił skupienie się na opracowywaniu modeli, które „rozumieją więcej o otaczającym cię świecie, myślą o wielu krokach i podejmuje działania w Twoim imieniu”. GEMINI 2.0 wprowadza nowe możliwości multimodalne, w tym natywne obrazy i wyniki audio, a także użycie narzędzi, zbliżając Google do jego wizji uniwersalnego asystenta.
To pchanie umieszcza Google w bezpośredniej konkurencji z innymi gigantami technologicznymi i startupami, takimi jak Meta, Amazon, Microsoft, Openai i Anthropic, z których wszystkie inwestują mocno Agentic AI. Na przykład agenci AI antropiku mogą poruszać się w komputerach podobnie jak ludzie, wykonując zadania z dziesiątkami lub setkami kroków. Openai niedawno wydało Operatora, agenta zdolnego do automatyzacji zadań, takich jak planowanie wakacyjne i zamawianie spożywcze, a głębokie badania kompilują złożone raporty dla użytkowników.
W grudniu Google uruchomił także własne narzędzie do głębokich badań, które funkcjonuje jako asystent badawczy badający tematy i opracowując szczegółowe raporty. Dyrektor generalny Sundar Pichai podkreślił znaczenie egzekucji nad byciem pierwszym, stwierdzając na grudniowym spotkaniu strategicznym: „Myślę, że o to chodzi w 2025 roku”.
Konkurencja z Deepseek
Wydania Google przychodzą wśród rosnącej uwagi na Deepseek, chińskiego startupu AI, którego modele rywalizują lub przewyższają wiodące amerykańskie firmy. Model R1 Deepseek zyskał znaczną przyczepność ze względu na przystępność cenową i wydajność. Aby to przeciwdziałać, Google sprawia, że swój model myślenia Flash Gemini 2.0 jest bardziej dostępny za pośrednictwem aplikacji Gemini, potencjalnie dążąc do zwrócenia większej uwagi na jej oferty.