Microsoftu ogłoszony w poniedziałek chip Maia 200 umożliwiający skalowanie wnioskowania AI, wyposażony w ponad 100 miliardów tranzystorów zapewniający większe prędkości i wyższą wydajność niż Maia 100 z 2023 r. Maia 200 zapewnia ponad 10 petaflopów przy 4-bitowej precyzji i około 5 petaflopów przy 8-bitowej wydajności. Microsoft nazywa go krzemowym koniem pociągowym zaprojektowanym specjalnie do zadań wnioskowania AI. Proces ten polega na uruchomieniu wyszkolonych modeli sztucznej inteligencji w celu wygenerowania wyników, niezależnie od fazy szkoleniowej, podczas której te modele są tworzone. W miarę rozwoju operacji sztucznej inteligencji wnioskowanie stanowi obecnie coraz większą część całkowitych wydatków na przetwarzanie danych, co motywuje do wysiłków zmierzających do jego usprawnienia. Firma pozycjonuje Maia 200 tak, aby ograniczyć zakłócenia operacyjne i zużycie energii we wdrożeniach sztucznej inteligencji. Pojedynczy węzeł wyposażony w chip obsługuje największe obecne modele AI, pozostawiając miejsce dla znacznie większych. Microsoft stwierdził: „W praktyce jeden węzeł Maia 200 może bez wysiłku obsługiwać największe dzisiejsze modele, pozostawiając dużo miejsca na jeszcze większe modele w przyszłości”. To wydanie jest zgodne ze schematem stosowanym przez główne firmy technologiczne opracowujące niestandardowe procesory w celu zmniejszenia zależności od procesorów graficznych Nvidii, które dominują w obciążeniach AI. Procesory graficzne Nvidia stały się kluczem do sukcesu sztucznej inteligencji, zachęcając do alternatywnych rozwiązań w zakresie zarządzania wydatkami na sprzęt. Google oferuje jednostki przetwarzające tensor, czyli TPU, nie jako samodzielne chipy, ale jako zasoby obliczeniowe w chmurze. Amazon dostarcza chipy akceleratora Trainium AI wraz z premierą Trainium 3 trzeciej generacji w grudniu. Opcje te pozwalają firmom przenieść część obciążeń ze sprzętu Nvidia, obniżając ogólne koszty. Microsoft twierdzi, że Maia 200 przewyższa konkurencję pod względem kluczowych wskaźników. Osiąga trzykrotnie większą wydajność w FP4 niż chipy Trainium trzeciej generacji firmy Amazon. Jego wydajność w 8PR przewyższa wydajność procesorów TPU siódmej generacji Google, jak szczegółowo opisano w poniedziałkowym komunikacie prasowym firmy. Chip obsługuje już wewnętrzne wysiłki AI. Obsługuje modele opracowane przez zespół Superinteligence firmy Microsoft. Operacje chatbota Copilot również opierają się na sprzęcie Maia 200. Od poniedziałku Microsoft rozszerzył zaproszenia dla użytkowników zewnętrznych. Programiści, pracownicy naukowi i pionierskie laboratoria AI mogą teraz uzyskać dostęp do zestawu programistycznego Maia 200, aby zintegrować go ze swoimi zadaniami.





