OpenAI je u četvrtak predstavio GPT-5.3-Codex, novi model vještačke inteligencije namijenjen naprednim agentičkim zadacima u programiranju. Kompanija sa sjedištem u San Franciscu navodi da novi model značajno proširuje mogućnosti Codexa, omogućavajući mu razvoj kompleksnih aplikacija i video-igara potpuno od nule.

OpenAI opisuje GPT-5.3-Codex kao svoj najmoćniji agentički model za kodiranje do sada, sposoban da vodi kompletne razvojne procese, otklanja greške u čitavim bazama koda, istražuje zahtjeve i implementira promjene u produkciji. Zanimljivo je da je ovo i prvi OpenAI model koji je imao aktivnu ulogu u razvoju samog sebe.

 

Dostupnost i platforme

 

U zvaničnoj objavi OpenAI je naveo da je GPT-5.3-Codex već dostupan globalno korisnicima svih plaćenih ChatGPT paketa. Model se može koristiti putem mobilnih i desktop aplikacija, komandno-linijskog interfejsa (CLI), ekstenzija za integrisana razvojna okruženja (IDE), kao i kroz web verziju. Kompanija je najavila da će uskoro omogućiti i pristup putem OpenAI API-ja.

 

Brži i fleksibilniji agentički rad

 

Novi model objedinjuje vrhunske performanse GPT-5.2-Codexa u kodiranju sa dubljim rezonovanjem i profesionalnim znanjem GPT-5.2, stvarajući jedinstven sistem. Prema navodima OpenAI-ja, GPT-5.3-Codex je oko 25 odsto brži, što ga čini pogodnijim za dugoročne projekte koji uključuju istraživanje, korištenje alata i složene korake izvršavanja.

Pročitajte još: OpenAI lansirao Codex aplikaciju za macOS: Više AI agenata za brži i efikasniji razvoj koda

Jedna od ključnih novosti je mogućnost da korisnici upravljaju modelom tokom samog zadatka. To znači da mogu tražiti izvještaje o napretku, postavljati pitanja, predlagati izmjene pravca ili diskutovati o pristupu – bez gubitka konteksta, što ranije nije bilo moguće.

 

Model koji je pomogao da nastane sam

 

OpenAI je otkrio da su rane verzije GPT-5.3-Codexa korištene tokom njegovog vlastitog razvoja. Model je pomagao Codex timu u otklanjanju grešaka tokom treninga, upravljanju implementacijama i analizi rezultata evaluacija. Prema kompaniji, ovaj vid „samopomoći“ značajno je ubrzao razvojni proces.

 

Rezultati na benchmark testovima

 

Kada je riječ o performansama, OpenAI je podijelio rezultate internih testiranja. Na SWE-Bench Pro testu, koji simulira realne softverske inženjerske zadatke na više programskih jezika, GPT-5.3-Codex je ostvario tačnost od 56,8 odsto. Time je neznatno nadmašio GPT-5.2-Codex (56,4 odsto) i GPT-5.2 (55,6 odsto).

Pročitajte još: ChatGPT Translate protiv Google Translate: Može li OpenAI ugroziti dugogodišnjeg lidera u prevođenju?

Na Terminal-Bench 2.0 testu rezultat je porastao na 77,3 odsto, u odnosu na 64,0 odsto kod prethodne verzije Codexa. U testu OSWorld-Verified, koji mjeri performanse agenata u vizuelnim desktop okruženjima za produktivne zadatke, novi model je postigao 64,7 odsto, u poređenju sa 38,2 odsto kod GPT-5.2-Codexa.

 

Od igara do kompletnog životnog ciklusa softvera

 

GPT-5.3-Codex može autonomno razvijati kompleksne web-igre čak i iz nedovoljno preciznih upita, radeći kroz iteracije koje obuhvataju milione tokena. Jedan od demonstracionih primjera uključivao je trkačku igru sa mapama, predmetima i takmičarima.

Model takođe generiše zrelije, produkcijski spremne web-stranice, automatski implementirajući funkcije poput prikaza popusta ili karusela sa svjedočanstvima korisnika. Osim samog kodiranja, GPT-5.3-Codex podržava čitav životni ciklus razvoja softvera – od pisanja PRD dokumenata i uređivanja marketinškog sadržaja, do korisničkog istraživanja, izrade prezentacija, analize tabela i nadzora sistema.

 

Fokus na bezbjednost i sajber-zaštitu

 

OpenAI ističe da je bezbjednost jedan od ključnih prioriteta novog modela. GPT-5.3-Codex je prvi model koji je kompanija svrstala u kategoriju visokih sposobnosti prema svom Okviru spremnosti (Preparedness Framework) za sajber-bezbjednosne zadatke.

Kako bi se rizici sveli na minimum, OpenAI je implementirao sveobuhvatan bezbjednosni sistem koji uključuje specijalizovanu obuku, automatizovani nadzor, kontrolu pouzdanog pristupa i primjenu obavještajnih podataka o prijetnjama.