Nvidia predstavila Nemotron 3 Super za autonomne AI agente
Nvidia predstavila je novi open-source model vještačke inteligencije namijenjen radu sa složenim agentnim (agentic) sistemima. Novi model nazvan Nemotron 3 Super razvijen je da izvršava kompleksne zadatke koji uključuju više AI agenata, napredno planiranje i višestepeno zaključivanje.
Model koristi hibridnu Mixture-of-Experts (MoE) arhitekturu i kombinira visoku preciznost zaključivanja sa optimizovanom potrošnjom računarskih resursa. Prema navodima kompanije, Nemotron 3 Super već koriste pojedine AI firme, uključujući Perplexity, za razvoj novih agentnih platformi. Model je takođe objavljen na javnim repozitorijima kako bi ga programeri mogli preuzeti i pokretati lokalno.
Dio Nemotron 3 porodice modela
Nemotron 3 Super pripada širem ekosistemu modela Nemotron 3. Dostupan je putem Nvidijinog sajta, platforme Hugging Face, kao i servisa OpenRouter.
Kompanija planira da model integriše i u enterprise infrastrukturu kao što su Dell Enterprise Hub i Dell AI Factory, gdje će biti optimizovan za lokalne instalacije u kompanijama.
Cilj modela je da olakša razvoj složenih AI sistema u kojima više agenata sarađuje na rješavanju problema, poput analize velikih dokumenata, automatizacije programiranja ili istraživačkih zadataka.
Tehničke specifikacije Nemotron 3 Super modela
Nemotron 3 Super donosi niz naprednih tehničkih rješenja koja omogućavaju obradu velikih količina podataka i dugih konteksta.
Ključne specifikacije:
-
Ukupno parametara: 120 milijardi
-
Aktivni parametri tokom inferencije: oko 12 milijardi
-
Arhitektura: hibridni Mamba-Transformer sa Latent MoE pristupom
-
Kontekst: do 1 milion tokena
-
Generisanje teksta: Multi-Token Prediction (MTP) tehnologija
-
Podržani jezici: engleski, njemački, francuski, italijanski, japanski, španski i kineski
-
Minimalni hardver: od 2 do 8 Nvidia H100 GPU-a, zavisno od verzije modela
Hibridna arhitektura kombinuje Transformer attention slojeve i Mamba sekvencijske slojeve, što omogućava bržu obradu dugih tekstova i bolju efikasnost pri radu sa ogromnim kontekstom.
Dizajniran za dug kontekst i kompleksne AI zadatke
Jedan od najvećih izazova u razvoju agentnih AI sistema je takozvana “eksplozija konteksta”. Kada više AI agenata međusobno komunicira, svaki korak zahtijeva slanje kompletnog konteksta, što značajno povećava broj tokena i troškove računanja.
Nemotron 3 Super rješava taj problem zahvaljujući kontekstnom prozoru od čak 1 milion tokena, što omogućava analizu ogromnih količina podataka – uključujući čitave kodne baze, duge dokumente ili višednevne interakcije AI agenata.
Nvidia navodi da ova arhitektura može postići do pet puta veću propusnost u odnosu na prethodnu generaciju Nemotron modela.
Otvoreni model i javno objavljeni podaci za treniranje
Nvidia je objavila model sa otvorenim težinama (open weights) i permisivnom licencom, što znači da kompanije i istraživači mogu prilagoditi model vlastitim potrebama.
Trening modela obavljen je na ogromnom skupu podataka koji uključuje više od 10 triliona tokena, uz dodatne faze post-treninga i reinforcement learning optimizacije. Kompanija planira objaviti i kompletnu metodologiju treniranja, uključujući okruženja za evaluaciju i recepte za testiranje performansi.
Namjena: AI agenti, programiranje i analiza dokumenata
Nemotron 3 Super prvenstveno je razvijen za:
-
AI agente koji autonomno izvršavaju zadatke
-
analizu velikih dokumenata i istraživačke sisteme
-
asistente za programiranje i analizu koda
-
automatizaciju poslovnih procesa
-
cyber-security analizu i obradu prijetnji
Zbog ogromnog konteksta i optimizovane MoE arhitekture, model je posebno pogodan za dugoročno planiranje i složene višekoračne zadatke.



