Nvidia Nemotron 3 Super: Open-source AI model sa 120 milijardi parametara i kontekstom od 1 milion tokena

Nvidia predstavila Nemotron 3 Super za autonomne AI agente

Nvidia predstavila je novi open-source model vještačke inteligencije namijenjen radu sa složenim agentnim (agentic) sistemima. Novi model nazvan Nemotron 3 Super razvijen je da izvršava kompleksne zadatke koji uključuju više AI agenata, napredno planiranje i višestepeno zaključivanje.

Model koristi hibridnu Mixture-of-Experts (MoE) arhitekturu i kombinira visoku preciznost zaključivanja sa optimizovanom potrošnjom računarskih resursa. Prema navodima kompanije, Nemotron 3 Super već koriste pojedine AI firme, uključujući Perplexity, za razvoj novih agentnih platformi. Model je takođe objavljen na javnim repozitorijima kako bi ga programeri mogli preuzeti i pokretati lokalno.

Dio Nemotron 3 porodice modela

Nemotron 3 Super pripada širem ekosistemu modela Nemotron 3. Dostupan je putem Nvidijinog sajta, platforme Hugging Face, kao i servisa OpenRouter.

Kompanija planira da model integriše i u enterprise infrastrukturu kao što su Dell Enterprise Hub i Dell AI Factory, gdje će biti optimizovan za lokalne instalacije u kompanijama.

Cilj modela je da olakša razvoj složenih AI sistema u kojima više agenata sarađuje na rješavanju problema, poput analize velikih dokumenata, automatizacije programiranja ili istraživačkih zadataka.

Tehničke specifikacije Nemotron 3 Super modela

Nemotron 3 Super donosi niz naprednih tehničkih rješenja koja omogućavaju obradu velikih količina podataka i dugih konteksta.

Ključne specifikacije:

Ukupno parametara: 120 milijardi
Aktivni parametri tokom inferencije: oko 12 milijardi
Arhitektura: hibridni Mamba-Transformer sa Latent MoE pristupom
Kontekst: do 1 milion tokena
Generisanje teksta: Multi-Token Prediction (MTP) tehnologija
Podržani jezici: engleski, njemački, francuski, italijanski, japanski, španski i kineski
Minimalni hardver: od 2 do 8 Nvidia H100 GPU-a, zavisno od verzije modela

Hibridna arhitektura kombinuje Transformer attention slojeve i Mamba sekvencijske slojeve, što omogućava bržu obradu dugih tekstova i bolju efikasnost pri radu sa ogromnim kontekstom.

Dizajniran za dug kontekst i kompleksne AI zadatke

Jedan od najvećih izazova u razvoju agentnih AI sistema je takozvana “eksplozija konteksta”. Kada više AI agenata međusobno komunicira, svaki korak zahtijeva slanje kompletnog konteksta, što značajno povećava broj tokena i troškove računanja.

Nemotron 3 Super rješava taj problem zahvaljujući kontekstnom prozoru od čak 1 milion tokena, što omogućava analizu ogromnih količina podataka – uključujući čitave kodne baze, duge dokumente ili višednevne interakcije AI agenata.

Nvidia navodi da ova arhitektura može postići do pet puta veću propusnost u odnosu na prethodnu generaciju Nemotron modela.

Otvoreni model i javno objavljeni podaci za treniranje

Nvidia je objavila model sa otvorenim težinama (open weights) i permisivnom licencom, što znači da kompanije i istraživači mogu prilagoditi model vlastitim potrebama.

Trening modela obavljen je na ogromnom skupu podataka koji uključuje više od 10 triliona tokena, uz dodatne faze post-treninga i reinforcement learning optimizacije. Kompanija planira objaviti i kompletnu metodologiju treniranja, uključujući okruženja za evaluaciju i recepte za testiranje performansi.

Namjena: AI agenti, programiranje i analiza dokumenata

Nemotron 3 Super prvenstveno je razvijen za:

AI agente koji autonomno izvršavaju zadatke
analizu velikih dokumenata i istraživačke sisteme
asistente za programiranje i analizu koda
automatizaciju poslovnih procesa
cyber-security analizu i obradu prijetnji

Zbog ogromnog konteksta i optimizovane MoE arhitekture, model je posebno pogodan za dugoročno planiranje i složene višekoračne zadatke.

Nvidia Nemotron 3 Super: Open-source AI model sa 120 milijardi parametara i kontekstom od 1 milion tokena

Nvidia predstavila Nemotron 3 Super za autonomne AI agente

Dio Nemotron 3 porodice modela

Tehničke specifikacije Nemotron 3 Super modela

Dizajniran za dug kontekst i kompleksne AI zadatke

Otvoreni model i javno objavljeni podaci za treniranje

Namjena: AI agenti, programiranje i analiza dokumenata

Komentari Otkaži

IT mixer

Nvidia Nemotron 3 Super: Open-source AI model sa 120 milijardi parametara i kontekstom od 1 milion tokena

Nvidia predstavila Nemotron 3 Super za autonomne AI agente

Dio Nemotron 3 porodice modela

Tehničke specifikacije Nemotron 3 Super modela

Dizajniran za dug kontekst i kompleksne AI zadatke

Otvoreni model i javno objavljeni podaci za treniranje

Namjena: AI agenti, programiranje i analiza dokumenata

Samsung već testira One UI 9: Android 17 stiže ranije nego što se očekivalo

Windows 11 dobija pametniju pretragu: Microsoft konačno olakšava pronalaženje datoteka

Apple objavio iOS 26.5.1: Ispravljen ozbiljan problem punjenja na iPhone 17 i iPhone Air uređajima

Komentari Otkaži

IT mixer