Alibaba Qwen tim predstavio je novi napredni AI model za generisanje slika pod nazivom Qwen VLo, kao nasljednika prethodnog Qwen 2.5 vizuelno-jezičkog modela. Ovaj unaprijeđeni AI alat nudi napredno text-to-image (tekst u sliku) i image-to-image (slika u sliku) generisanje, te podržava tekstualne unose na više jezika, uključujući engleski i kineski.
Napredno AI generisanje i uređivanje slika
Za razliku od mnogih drugih AI generatora slika, Alibaba Qwen VLo može kreirati slike od nule, ali i vršiti inline uređivanje već generisanih ili unesenih slika. To ga čini idealnim alatom za dizajnere, kreatore sadržaja i firme kojima je potreban fleksibilan AI alat za obradu slika.
Novi AI model najavljen je na X-u (bivši Twitter) putem zvaničnog profila Qwen tima, a tehnički naziv modela je Qwen3-235B-A22B. Korisnici ga mogu isprobati besplatno putem Alibaba chat interfejsa — bez registracije.
Poređenje s Google Imagen i OpenAI DALL·E
Kvalitet generisanih slika Qwen VLo modela uporediv je s Google Imagen 2. Iako je preciznost praćenja instrukcija i finalni kvalitet slike nešto ispod Imagen 3 i OpenAI GPT-4o DALL·E, prednost Qwen VLo modela su brže vrijeme generisanja i veći limit korištenja, što je značajna prednost za korisnike s velikim potrebama.
Qwen VLo posjeduje poboljšano razumijevanje slika, što mu omogućava da vrši precizne izmjene bez gubljenja strukture originala. Takođe, bolje razumije nejasne ili otvorene zahtjeve, generišući slike koje više odgovaraju očekivanjima korisnika.
Snažne funkcije za kreatore
Qwen VLo nije ograničen samo na generisanje i uređivanje slika. Može obavljati i zadatke vezane za anotaciju slika, uključujući detekciju ivica, segmentaciju, mapiranje predikcija i druge napredne operacije. U budućim verzijama planirano je da model može obrađivati više slika odjednom i kombinovati ih prema uputama korisnika.
Još jedna velika prednost je poboljšano renderovanje teksta. Tokom testiranja, Qwen VLo je generisao jasan i tačan tekst u različitim fontovima, što je često izazov za druge AI alate. Model podržava slike s dinamičnim aspekt odnosima, uključujući ekstremne formate poput 4:1 i 1:3, a Alibaba planira uskoro omogućiti i generisanje slika u različitim proporcijama.
Pokretanjem Qwen VLo modela, Alibaba dodatno jača svoju poziciju u konkurentnom polju AI generisanja slika, gdje se takmiči s velikim igračima poput Google-a i OpenAI-ja. Besplatan za korištenje, uz napredne opcije uređivanja i anotacije, Qwen VLo je vrijedan alat za sve koji žele istražiti narednu generaciju AI umjetnosti, vizuelnog kreiranja sadržaja ili automatizovanog dizajna.