Na konferenciji AI Infra Summit 2025, NVIDIA je predstavila Rubin CPX, novi akcelerator posebno dizajniran za rastuće zahtjeve dugokontextualnih AI sistema. Za razliku od ostatka nadolazeće Rubin GPU porodice, koja se oslanja na višeslojne čipove, CPX se izdvaja kao jednodijelni, monolitni dizajn.
Ta arhitektura donosi impresivne brojke: 30 petaFLOPS-a NVFP4 performansi i podršku za 128 GB GDDR7 memorije. NVIDIA navodi da je CPX optimizovan za zadatke gdje modeli moraju imati produžene “attention” kapacitete — od analize miliona tokena izvornog koda do obrade sati video ili audio sadržaja.
Poseban adut čipa je integrisani video podsistem, sa četiri NVENC i četiri NVDEC bloka, što eliminiše potrebu za posebnim enkoderima ili dekoderima u AI radnim tokovima koji uključuju video. Kompanija tvrdi i da CPX donosi trostruko ubrzanje u obradi “attention” slojeva u odnosu na trenutni GB300 Blackwell Ultra, naglašavajući njegovu ulogu u skaliranju inference procesa u realnom vremenu.
Iako NVIDIA nije otkrila zvanične podatke o propusnosti memorije, kombinacija 512-bitne magistrale i 30 Gbps GDDR7 memorije sugeriše kapacitet od gotovo 1,8 TB/s — dovoljno da izbalansira i teške računske prefill operacije i propusno-intenzivnu generaciju tokena.
Rubin CPX će se implementirati kroz Vera Rubin NVL144 CPX platformu, koja spaja tradicionalne Rubin GPU-ove sa CPX modelima, nudeći fleksibilnu ravnotežu performansi za različite AI radne zadatke. Kompletni rack sistemi, pod imenom Kyber, projektovani su da dostignu do 8 eksaFLOPS-a ukupne snage i 1,7 PB/s memorijske propusnosti. Mrežnu osnovu čine ConnectX-9 adapteri sa 1600G konekcijom i Spectrum6 prekidači kapaciteta 102,4T, uz co-packaged optics rješenja za efikasno skaliranje u velikim data centrima.
NVIDIA pozicionira Rubin CPX kao specijalizovano rješenje za inference u narednoj generaciji AI sistema — naročito onih koji prelaze sa jednostavne generacije teksta na agente za višestepeno rezonovanje. Fokusiranjem na context prefill i održavanje dugoročne memorije, čip direktno odgovara na dvostruke zahtjeve: intenzivni paralelni proračuni i trajna propusnost za generisanje tokena.
Rubin CPX biće dostupan krajem 2026. godine, nakon lansiranja šire Rubin GPU linije ranije iste godine.