Dataconomy PL
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy PL
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy PL
No Result
View All Result

Domniemane buforowanie ma na celu obniżenie kosztów API Gemini o 75%

byKerem Gülen
9 maja 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Google ma wystrzelony Nowa funkcja w API Gemini o nazwie „Implicit Buging”, który, jak twierdzi firma, może obniżyć koszty o 75% dla twórców stron trzecich, korzystając z najnowszych modeli AI, Gemini 2.5 Pro i 2.5 Flash.

Funkcja automatycznie umożliwia oszczędności kosztów, gdy żądanie API GEMINI do modelu uderza w pamięć podręczną, eliminując potrzebę ręcznej konfiguracji wymaganej przez poprzednią jawną metodę buforowania. Według Google, niejawne buforowanie jest wywoływane, gdy żądanie podziela wspólny prefiks z poprzednim żądaniem, a wymagana minimalna szybka liczba tokenów wynosi 1024 dla 2,5 Flash i 2048 dla 2,5 Pro.

Logan Kilpatrick, członek zespołu Gemini, ogłoszony Uruchomienie 8 maja 2025 r., Stwierdzając, że funkcja może zapewnić znaczne oszczędności dla programistów. Google zaleca, aby programiści umieścili powtarzający się kontekst na początku żądań i dołączyli do zmiany kontekstu na końcu, aby zwiększyć szanse na ukryte trafienia pamięci podręcznej.

Buforowanie to powszechnie przyjęta praktyka w branży AI, która ponownie wykorzystuje dane lub wstępnie obliczone dane w celu zmniejszenia wymagań i kosztów obliczeniowych. Poprzednia jawna metoda buforowania Google wymagała od deweloperów ręcznego zdefiniowania podpowiedzi o wysokiej częstotliwości, co często spowodowało dodatkową pracę, a czasem zaskakująco duże rachunki za interfejs API dla niektórych użytkowników.

Niektórzy programiści wyrazili niezadowolenie z wyraźnego wdrożenia buforowania Gemini 2.5 Pro, co skłoniło zespół Gemini do przeprosin i zobowiązania do wprowadzenia zmian. Nowa domyślna funkcja buforowania dotyczy tych obaw poprzez automatyzację procesu buforowania i przekazywanie oszczędności kosztów dla programistów, gdy nastąpi uderzenie pamięci podręcznej.

Chociaż Google twierdzi, że domyślne buforowanie może zapewnić 75% oszczędności kosztów, firma nie zapewniła stron trzecich skuteczności funkcji. W związku z tym faktyczne oszczędności kosztów mogą się różnić w zależności od tego, w jaki sposób programiści korzystają z tej funkcji.


Polecane wizerunki

Tags: APIbliźniętaGoogle

Recent Posts

  • Brad Smith świadczy Microsoft zablokował aplikację Deepseek dla pracowników
  • Chrome wdraża lokalną sztuczną inteligencję, aby wykryć nowe pojawiające się oszustwa internetowe
  • Uczenie maszynowe oparte na modelach (MBML)
  • Śledzenie wydajności ML
  • Apple opracowuje nowe frytki dla inteligentnych okularów i komputerów Mac

Recent Comments

Brak komentarzy do wyświetlenia.
Dataconomy PL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

Social icon element need JNews Essential plugin to be activated.
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.