Nvidia predstavila Nemotron 3 Super za autonomne AI agente

 

Nvidia predstavila je novi open-source model vještačke inteligencije namijenjen radu sa složenim agentnim (agentic) sistemima. Novi model nazvan Nemotron 3 Super razvijen je da izvršava kompleksne zadatke koji uključuju više AI agenata, napredno planiranje i višestepeno zaključivanje.

Model koristi hibridnu Mixture-of-Experts (MoE) arhitekturu i kombinira visoku preciznost zaključivanja sa optimizovanom potrošnjom računarskih resursa. Prema navodima kompanije, Nemotron 3 Super već koriste pojedine AI firme, uključujući Perplexity, za razvoj novih agentnih platformi. Model je takođe objavljen na javnim repozitorijima kako bi ga programeri mogli preuzeti i pokretati lokalno.

 

Dio Nemotron 3 porodice modela

 

Nemotron 3 Super pripada širem ekosistemu modela Nemotron 3. Dostupan je putem Nvidijinog sajta, platforme Hugging Face, kao i servisa OpenRouter.

Kompanija planira da model integriše i u enterprise infrastrukturu kao što su Dell Enterprise Hub i Dell AI Factory, gdje će biti optimizovan za lokalne instalacije u kompanijama.

Cilj modela je da olakša razvoj složenih AI sistema u kojima više agenata sarađuje na rješavanju problema, poput analize velikih dokumenata, automatizacije programiranja ili istraživačkih zadataka.

 

Tehničke specifikacije Nemotron 3 Super modela

 

Nemotron 3 Super donosi niz naprednih tehničkih rješenja koja omogućavaju obradu velikih količina podataka i dugih konteksta.

Ključne specifikacije:

  • Ukupno parametara: 120 milijardi

  • Aktivni parametri tokom inferencije: oko 12 milijardi

  • Arhitektura: hibridni Mamba-Transformer sa Latent MoE pristupom

  • Kontekst: do 1 milion tokena

  • Generisanje teksta: Multi-Token Prediction (MTP) tehnologija

  • Podržani jezici: engleski, njemački, francuski, italijanski, japanski, španski i kineski

  • Minimalni hardver: od 2 do 8 Nvidia H100 GPU-a, zavisno od verzije modela

Hibridna arhitektura kombinuje Transformer attention slojeve i Mamba sekvencijske slojeve, što omogućava bržu obradu dugih tekstova i bolju efikasnost pri radu sa ogromnim kontekstom.

 

Dizajniran za dug kontekst i kompleksne AI zadatke

 

Jedan od najvećih izazova u razvoju agentnih AI sistema je takozvana “eksplozija konteksta”. Kada više AI agenata međusobno komunicira, svaki korak zahtijeva slanje kompletnog konteksta, što značajno povećava broj tokena i troškove računanja.

Nemotron 3 Super rješava taj problem zahvaljujući kontekstnom prozoru od čak 1 milion tokena, što omogućava analizu ogromnih količina podataka – uključujući čitave kodne baze, duge dokumente ili višednevne interakcije AI agenata.

Nvidia navodi da ova arhitektura može postići do pet puta veću propusnost u odnosu na prethodnu generaciju Nemotron modela.

 

Otvoreni model i javno objavljeni podaci za treniranje

 

Nvidia je objavila model sa otvorenim težinama (open weights) i permisivnom licencom, što znači da kompanije i istraživači mogu prilagoditi model vlastitim potrebama.

Trening modela obavljen je na ogromnom skupu podataka koji uključuje više od 10 triliona tokena, uz dodatne faze post-treninga i reinforcement learning optimizacije. Kompanija planira objaviti i kompletnu metodologiju treniranja, uključujući okruženja za evaluaciju i recepte za testiranje performansi.

 

Namjena: AI agenti, programiranje i analiza dokumenata

 

Nemotron 3 Super prvenstveno je razvijen za:

  • AI agente koji autonomno izvršavaju zadatke

  • analizu velikih dokumenata i istraživačke sisteme

  • asistente za programiranje i analizu koda

  • automatizaciju poslovnih procesa

  • cyber-security analizu i obradu prijetnji

Zbog ogromnog konteksta i optimizovane MoE arhitekture, model je posebno pogodan za dugoročno planiranje i složene višekoračne zadatke.