Microsoft Maia 200: Novi AI čip donosi bržu inferenciju i niže troškove u Azure cloudu

Microsoft je zvanično predstavio svoj najnoviji akcelerator za vještačku inteligenciju, Maia 200, namjenski dizajniran čip koji ima za cilj ubrzavanje AI inferencije i smanjenje troškova pokretanja velikih jezičkih modela (LLM) na velikoj skali. Novi procesor nasljednik je Maia 100 čipa iz 2023. godine i već se implementira u Microsoftove Azure data centre, počevši od Sjedinjenih Američkih Država. Kompanija ističe da će Maia 200 pokretati najnovije AI modele, uključujući i OpenAI-jev GPT-5.2.

Napredan 3nm proizvodni proces i prilagođena arhitektura

Prema informacijama iz zvaničnog bloga, Maia 200 je izrađen u TSMC-ovom 3nm proizvodnom procesu i sadrži više od 140 milijardi tranzistora. Čip koristi prilagođenu memorijsku i komunikacionu arhitekturu, optimizovanu isključivo za inferenciju. Ovakav dizajn omogućava bržu obradu podataka i konstantno „snabdijevanje“ AI modela informacijama, čime se smanjuju kašnjenja i povećava ukupna efikasnost.

Fokus na niskoprecizno računanje

Jedna od ključnih prednosti Maia 200 čipa je podrška za niskoprecizne formate računanja, kao što su FP4 (4-bitni) i FP8 (8-bitni) proračuni. Ovi formati omogućavaju brže generisanje odgovora uz manju potrošnju energije u poređenju sa klasičnim, visoko preciznim izračunima. Microsoft navodi da Maia 200 postiže preko 10 petaFLOPS performansi u FP4 režimu i više od 5 petaFLOPS u FP8 režimu, što ga čini idealnim za savremene LLM modele i AI sisteme u realnom vremenu.

Velika memorijska propusnost za zahtjevne AI zadatke

Maia 200 dolazi sa 216 GB HBM3e memorije velike propusnosti, koja nudi do 7 TB/s brzine prenosa podataka, kao i sa 272 MB ugrađene SRAM memorije. Ova kombinacija omogućava brzo učitavanje i obradu velikih količina podataka, što je često usko grlo u AI zadacima. Ugrađena SRAM memorija dodatno smanjuje latenciju pri pristupu manjim, ali ključnim skupovima podataka.

Skalabilnost na nivou data centara

Na sistemskom nivou, Maia 200 je projektovan za lako skaliranje u velikim AI klasterima. Svaki čip podržava dvosmjernu propusnost od 2,8 TB/s, a do 6.144 akceleratora može se povezati putem standardne Ethernet mreže. Ovakva arhitektura omogućava efikasno raspoređivanje velikog broja čipova unutar rackova i čvorova, uz visok protok podataka i kontrolisanu potrošnju energije.

Bolje performanse po uloženom dolaru

Jedan od glavnih ciljeva razvoja Maia 200 bio je poboljšanje odnosa performansi i cijene, posebno važno za infrastrukturu namijenjenu inferenciji. Microsoft tvrdi da novi čip donosi oko 30 odsto bolje performanse po dolaru u poređenju sa hardverom koji se trenutno koristi u njihovoj AI infrastrukturi.

Razvojni alati za Maia platformu

Pored hardvera, Microsoft je najavio i probnu verziju Maia softverskog razvojnog kompleta (SDK). SDK uključuje Triton kompajler, podršku za PyTorch, optimizovanu biblioteku kernela i alate za niskonivojsko programiranje. To programerima omogućava da razvijaju, prilagođavaju i optimizuju AI modele posebno za Maia 200 platformu.

Microsoft Maia 200: Novi AI čip donosi bržu inferenciju i niže troškove u Azure cloudu

Napredan 3nm proizvodni proces i prilagođena arhitektura

Fokus na niskoprecizno računanje

Velika memorijska propusnost za zahtjevne AI zadatke

Skalabilnost na nivou data centara

Bolje performanse po uloženom dolaru

Razvojni alati za Maia platformu

Komentari Otkaži

IT mixer

Microsoft Maia 200: Novi AI čip donosi bržu inferenciju i niže troškove u Azure cloudu

Napredan 3nm proizvodni proces i prilagođena arhitektura

Fokus na niskoprecizno računanje

Velika memorijska propusnost za zahtjevne AI zadatke

Skalabilnost na nivou data centara

Bolje performanse po uloženom dolaru

Razvojni alati za Maia platformu

Ryzen 9 9950X3D2 se pojavio u Geekbench bazi

AMD Ryzen X3D procesori i dalje dominiraju gejming scenom

Cijene DDR5 RAM-a eksplodirale – sada su više od 4× veće nego u septembru 2025.

Komentari Otkaži

IT mixer