Microsoft je zvanično predstavio svoj najnoviji akcelerator za vještačku inteligenciju, Maia 200, namjenski dizajniran čip koji ima za cilj ubrzavanje AI inferencije i smanjenje troškova pokretanja velikih jezičkih modela (LLM) na velikoj skali. Novi procesor nasljednik je Maia 100 čipa iz 2023. godine i već se implementira u Microsoftove Azure data centre, počevši od Sjedinjenih Američkih Država. Kompanija ističe da će Maia 200 pokretati najnovije AI modele, uključujući i OpenAI-jev GPT-5.2.

 

Napredan 3nm proizvodni proces i prilagođena arhitektura

 

Prema informacijama iz zvaničnog bloga, Maia 200 je izrađen u TSMC-ovom 3nm proizvodnom procesu i sadrži više od 140 milijardi tranzistora. Čip koristi prilagođenu memorijsku i komunikacionu arhitekturu, optimizovanu isključivo za inferenciju. Ovakav dizajn omogućava bržu obradu podataka i konstantno „snabdijevanje“ AI modela informacijama, čime se smanjuju kašnjenja i povećava ukupna efikasnost.

 

Fokus na niskoprecizno računanje

 

Jedna od ključnih prednosti Maia 200 čipa je podrška za niskoprecizne formate računanja, kao što su FP4 (4-bitni) i FP8 (8-bitni) proračuni. Ovi formati omogućavaju brže generisanje odgovora uz manju potrošnju energije u poređenju sa klasičnim, visoko preciznim izračunima. Microsoft navodi da Maia 200 postiže preko 10 petaFLOPS performansi u FP4 režimu i više od 5 petaFLOPS u FP8 režimu, što ga čini idealnim za savremene LLM modele i AI sisteme u realnom vremenu.

 

Velika memorijska propusnost za zahtjevne AI zadatke

 

Maia 200 dolazi sa 216 GB HBM3e memorije velike propusnosti, koja nudi do 7 TB/s brzine prenosa podataka, kao i sa 272 MB ugrađene SRAM memorije. Ova kombinacija omogućava brzo učitavanje i obradu velikih količina podataka, što je često usko grlo u AI zadacima. Ugrađena SRAM memorija dodatno smanjuje latenciju pri pristupu manjim, ali ključnim skupovima podataka.

 

Skalabilnost na nivou data centara

 

Na sistemskom nivou, Maia 200 je projektovan za lako skaliranje u velikim AI klasterima. Svaki čip podržava dvosmjernu propusnost od 2,8 TB/s, a do 6.144 akceleratora može se povezati putem standardne Ethernet mreže. Ovakva arhitektura omogućava efikasno raspoređivanje velikog broja čipova unutar rackova i čvorova, uz visok protok podataka i kontrolisanu potrošnju energije.

 

Bolje performanse po uloženom dolaru

 

Jedan od glavnih ciljeva razvoja Maia 200 bio je poboljšanje odnosa performansi i cijene, posebno važno za infrastrukturu namijenjenu inferenciji. Microsoft tvrdi da novi čip donosi oko 30 odsto bolje performanse po dolaru u poređenju sa hardverom koji se trenutno koristi u njihovoj AI infrastrukturi.

 

Razvojni alati za Maia platformu

 

Pored hardvera, Microsoft je najavio i probnu verziju Maia softverskog razvojnog kompleta (SDK). SDK uključuje Triton kompajler, podršku za PyTorch, optimizovanu biblioteku kernela i alate za niskonivojsko programiranje. To programerima omogućava da razvijaju, prilagođavaju i optimizuju AI modele posebno za Maia 200 platformu.