GPT-4o mini to najnowszy, ekonomiczny model OpenAI, z którego będzie korzystać darmowy ChatGPT. Ma on na celu ulepszenie swoich poprzedników pod względem wydajności i efektywności. Ponadto, możliwości generowania obrazu!
Chociaż OpenAI nie ujawniło dokładnego rozmiaru modelu, GPT-4o mini można porównać z innymi małymi modelami AI, takimi jak Haiku Claude’a I Gemini 1.5 Flash. Porównamy je w tym artykule, aby dowiedzieć się, który jest lepszy. Ale najpierw zrozumiemy, co GPT-4o mini oferuje lepiej.
Czym jest GPT-4o mini?
GPT-4o mini to najnowszy model AI firmy OpenAI, zaprojektowany w celu zastąpienia powszechnie stosowanego CzatGPT 3.5z którego korzysta darmowy ChatGPT. Oferuje on lepszą wydajność, szybsze czasy reakcji i nowe funkcjonalności, takie jak generowanie obrazów, będąc jednocześnie bardziej opłacalnym. Model jest wszechstronny i odpowiedni do różnych zastosowań, od tworzenia treści i rozwiązywania problemów po złożoną analizę danych i generowanie kodu. Oto jego ulepszone testy porównawcze:
- MMLU (Massive Multitask Language Understanding)Model uzyskał wynik 82%, co odzwierciedla jego doskonałe zdolności rozumowania w różnych kwestiach.
- MGSM (połączenie szkół podstawowych z matematyki):Uzyskując wynik 87%, GPT-4o mini wyróżnia się w rozumowaniu matematycznym, co czyni go doskonałym narzędziem do rozwiązywania problemów logicznych i generowania kodów.

Dobra wiadomość: GPT-4o mini może generować obrazy
GPT-4o mini może przetwarzać zarówno tekst, jak i obrazy, w przeciwieństwie do swojego poprzednika, ChatGPT 3.5, który był ograniczony do tekstu. Ta podwójna zdolność umożliwia bardziej kompleksowe i dokładne przetwarzanie informacji, umożliwiając modelowi zrozumienie i generowanie treści z wielu źródeł jednocześnie. A więc, co jeszcze?
GPT-4o mini dostarcza odpowiedzi w ciągu do 10 sekund, co stanowi znaczną poprawę w porównaniu z 20-sekundowym czasem odpowiedzi ChatGPT 3.5. Model ten ma medianę przepustowości 202 tokenów na sekundę, ponad dwukrotnie szybciej niż poprzednie modele, co czyni go idealnym do aplikacji wymagających szybkich odpowiedzi.
Model może przetwarzać do 128 000 tokenów na raz, co odpowiada długości przeciętnej książki. To duże okno kontekstowe zapewnia spójność i trafność w długich interakcjach lub podczas pracy z obszernymi dokumentami.

Cena mini API GPT-4o jest jego mocną stroną
Jedną z najbardziej godnych uwagi cech GPT-4o mini jest jego opłacalność:
- Cennik interfejsu API GPT-4o mini: Model wyceniono na 15 centów za milion tokenów wejściowych i 60 centów za milion tokenów wyjściowych. Ta struktura cenowa jest o 60% tańsza niż GPT-3.5 Turbo, dzięki czemu zaawansowane możliwości AI są bardziej dostępne dla szerszej publiczności.
Niższy koszt uruchomienia nowego modelu OpenAI otwiera drzwi do szerszej adopcji w różnych branżach i regionach, szczególnie korzystne dla małych i średnich przedsiębiorstw lub deweloperów z ograniczonymi budżetami. Czy zatem GPT-4o mini jest wystarczająco wydajny, mimo że jest opłacalny?
Porównanie modeli OpenAI: GPT-4 Turbo vs GPT-4 vs GPT-4o vs GPT-4o mini vs GPT-3.5 Turbo
Najpierw zapoznajmy się z pozycją GPT-4o mini w bibliotece OpenAI:
Model | Dokładność (%) | MMLU | Jakość GP | UPUSZCZAĆ | MGSM | MATEMATYKA | Ocena człowieka | MMMMU | MathVista |
Turbosprężarka GPT-4 | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59.4 | 56,7 | 63,8 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69.1 | 0,0 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70.2 | 56.3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
Porównanie modeli AI ujawnia, że GPT-4 Turbo prowadzi z najwyższą ogólną wydajnością, uzyskując 91% w dokładności, 56% w MMLU, 93,5% w MATH i 79% w MGSM. GPT-4 jest tuż za nim, nieznacznie pozostając w tyle w większości kategorii. GPT-4o mini, chociaż mniej wydajny niż GPT-4 i GPT-4 Turbo, nadal wykazuje znaczące możliwości, szczególnie ze znaczącą dokładnością 82% i wysoką wydajnością w zadaniach matematycznych (MGSM 70,2%, MATH 87,2%). GPT-4o wyróżnia się również jako solidny wykonawca, szczególnie wyróżniając się w GPQA (83,4%) i DROP (90,5%). Natomiast GPT-3.5 Turbo wykazuje znacznie niższą wydajność we wszystkich metrykach, podkreślając postępy poczynione w kolejnych modelach.
GPT-4o mini kontra Gemini Flash kontra Claude Haiku
Czas porównać GPT-4o mini z konkurencją:
Model | Dokładność (%) | MMLU | Jakość GP | UPUSZCZAĆ | MGSM | MATEMATYKA | Ocena człowieka | MMMMU | MathVista |
Bliźnięta Zaawansowane | 87,0 | 52,0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
Bliźnięta | 85,0 | 50,0 | 80,0 | 88,0 | 72,0 | 88,5 | 65,0 | 55,0 | 60,0 |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59.4 | 56,7 | 63,8 |
Haiku Claude’a | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50.2 | 46.4 | 0,0 |
Błysk Bliźniąt | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58.4 | 0,0 |
Gemini Advanced i Gemini prowadzą w ogólnej wydajności, przy czym Gemini Advanced uzyskało najwyższy wynik w MMLU (52%) i osiągnęło dobre wyniki w GPQA (82%), DROP (90%) i MATH (90%). Ale chociaż nowy model OpenAI jest im bliski, nie są jego naturalnymi konkurentami.
Gdy spojrzymy na Claude Haiku i Gemini Flash, mają niższe wskaźniki wydajności. Claude Haiku ma szczególnie problemy w MGSM (40,9%) i MMMU (46,4%), a Gemini Flash pokazuje umiarkowane wyniki, ale brakuje mu wyników MathVista.

PodsumowującGPT-4o mini stanowi przekonującą alternatywę dla wcześniejszych modeli, takich jak GPT-3.5 Turbo i nowszych konkurentów, takich jak Claude Haiku i Gemini Flash. Choć nie jest tak zaawansowany jak GPT-4 Turbo lub Gemini Advanced, GPT-4o mini wyróżnia się ulepszoną wydajnością. Jego podwójna zdolność do przetwarzania tekstu i obrazów, w połączeniu z dużym oknem kontekstowym i konkurencyjną ceną, pozycjonuje go jako wszechstronny i dostępny wybór zarówno dla firm, jak i programistów. Pomimo silnej konkurencji ze strony modeli, takich jak Gemini Advanced, nowy model OpenAI oferuje zrównoważone połączenie wydajności i przystępności cenowej, zapewniając jego znaczenie w ciągle ewoluującym krajobrazie AI.
Źródło wyróżnionego obrazu: Eray Eliaçık/Bing