OpenAI je u četvrtak predstavio GPT-5.3-Codex, novi model vještačke inteligencije namijenjen naprednim agentičkim zadacima u programiranju. Kompanija sa sjedištem u San Franciscu navodi da novi model značajno proširuje mogućnosti Codexa, omogućavajući mu razvoj kompleksnih aplikacija i video-igara potpuno od nule.
OpenAI opisuje GPT-5.3-Codex kao svoj najmoćniji agentički model za kodiranje do sada, sposoban da vodi kompletne razvojne procese, otklanja greške u čitavim bazama koda, istražuje zahtjeve i implementira promjene u produkciji. Zanimljivo je da je ovo i prvi OpenAI model koji je imao aktivnu ulogu u razvoju samog sebe.
Dostupnost i platforme
U zvaničnoj objavi OpenAI je naveo da je GPT-5.3-Codex već dostupan globalno korisnicima svih plaćenih ChatGPT paketa. Model se može koristiti putem mobilnih i desktop aplikacija, komandno-linijskog interfejsa (CLI), ekstenzija za integrisana razvojna okruženja (IDE), kao i kroz web verziju. Kompanija je najavila da će uskoro omogućiti i pristup putem OpenAI API-ja.
Brži i fleksibilniji agentički rad
Novi model objedinjuje vrhunske performanse GPT-5.2-Codexa u kodiranju sa dubljim rezonovanjem i profesionalnim znanjem GPT-5.2, stvarajući jedinstven sistem. Prema navodima OpenAI-ja, GPT-5.3-Codex je oko 25 odsto brži, što ga čini pogodnijim za dugoročne projekte koji uključuju istraživanje, korištenje alata i složene korake izvršavanja.
Pročitajte još: OpenAI lansirao Codex aplikaciju za macOS: Više AI agenata za brži i efikasniji razvoj koda
Jedna od ključnih novosti je mogućnost da korisnici upravljaju modelom tokom samog zadatka. To znači da mogu tražiti izvještaje o napretku, postavljati pitanja, predlagati izmjene pravca ili diskutovati o pristupu – bez gubitka konteksta, što ranije nije bilo moguće.
Model koji je pomogao da nastane sam
OpenAI je otkrio da su rane verzije GPT-5.3-Codexa korištene tokom njegovog vlastitog razvoja. Model je pomagao Codex timu u otklanjanju grešaka tokom treninga, upravljanju implementacijama i analizi rezultata evaluacija. Prema kompaniji, ovaj vid „samopomoći“ značajno je ubrzao razvojni proces.
Rezultati na benchmark testovima
Kada je riječ o performansama, OpenAI je podijelio rezultate internih testiranja. Na SWE-Bench Pro testu, koji simulira realne softverske inženjerske zadatke na više programskih jezika, GPT-5.3-Codex je ostvario tačnost od 56,8 odsto. Time je neznatno nadmašio GPT-5.2-Codex (56,4 odsto) i GPT-5.2 (55,6 odsto).
Pročitajte još: ChatGPT Translate protiv Google Translate: Može li OpenAI ugroziti dugogodišnjeg lidera u prevođenju?
Na Terminal-Bench 2.0 testu rezultat je porastao na 77,3 odsto, u odnosu na 64,0 odsto kod prethodne verzije Codexa. U testu OSWorld-Verified, koji mjeri performanse agenata u vizuelnim desktop okruženjima za produktivne zadatke, novi model je postigao 64,7 odsto, u poređenju sa 38,2 odsto kod GPT-5.2-Codexa.
Od igara do kompletnog životnog ciklusa softvera
GPT-5.3-Codex može autonomno razvijati kompleksne web-igre čak i iz nedovoljno preciznih upita, radeći kroz iteracije koje obuhvataju milione tokena. Jedan od demonstracionih primjera uključivao je trkačku igru sa mapama, predmetima i takmičarima.
Model takođe generiše zrelije, produkcijski spremne web-stranice, automatski implementirajući funkcije poput prikaza popusta ili karusela sa svjedočanstvima korisnika. Osim samog kodiranja, GPT-5.3-Codex podržava čitav životni ciklus razvoja softvera – od pisanja PRD dokumenata i uređivanja marketinškog sadržaja, do korisničkog istraživanja, izrade prezentacija, analize tabela i nadzora sistema.
Fokus na bezbjednost i sajber-zaštitu
OpenAI ističe da je bezbjednost jedan od ključnih prioriteta novog modela. GPT-5.3-Codex je prvi model koji je kompanija svrstala u kategoriju visokih sposobnosti prema svom Okviru spremnosti (Preparedness Framework) za sajber-bezbjednosne zadatke.
Kako bi se rizici sveli na minimum, OpenAI je implementirao sveobuhvatan bezbjednosni sistem koji uključuje specijalizovanu obuku, automatizovani nadzor, kontrolu pouzdanog pristupa i primjenu obavještajnih podataka o prijetnjama.



