Stability AI je objavio svoj novi i najveći generativni AI model do sada, SDKSL 1.0, za koji tvrde da je „najbolji na svijetu“
Tim Stability AI je objavio otvoreni model SDKSL 1.0, sljedeću iteraciju u evoluciji modela generisanja teksta u sliku. Nakon ograničenog izdanja SDKSL 0.9 samo za istraživanje, puna verzija SDKSL-a je poboljšana kako bi postala najbolji svjetski model za generisanje otvorenih slika.
Stability AI je testirao SDKSL 1.0 sa postojećim modelima, a ispitanici su potvrdili da više vole ilustracije napravljene pomoću novog alata, u poređenju sa svim (već dobrim) rezultatima koje pruža Stable Diffusion, popularni AI alat za obradu slika. Ovo istraživanje je rezultat višenedeljnih podataka o preferencijama prikupljenih iz generacija eksperimentalnih modela na Discord-u i eksternog testiranja.
SDKSL trenutno sadrži čak 3,5 milijardi parametara u osnovnom modelu i dodatnih 6,6 milijardi u modelu za obradu slike. Ovo je najviše od svih sličnih javno dostupnih alata. Ova kombinacija funkcioniše na sljedeći način: u prvom koraku, manji model konvertuje tekst u sliku veličine 128×128 piksela, uz mnogo buke, a odatle preuzima drugi model, i prečišćava sliku, povećavajući je na 1.024×1 .024 piksela i precizira detalje.
Optimizovan za cloud i računare
Kažu da su modeli optimizovani za rad u cloud-u i na računarima koji imaju na raspolaganju GPU sa najmanje 8GB VRAM memorije. Za ove svrhe moguće je preuzeti novi SDKSL sa GitHub-a, a pristup je moguć i preko API-ja.
Kada su u pitanju o poboljšanja, SDKSL 1.0 nudi mogućnost generisanja još boljih fotorealističnih slika. Podešene su za veći kontrast, živopisnije i preciznije boje i realističnije prikazivanje svjetlosti i sjenke od svojih prethodnika. Različite slike mogu biti podstaknute bez ikakvog posebnog ‘osećaja’ koji model daje, obezbjeđujući apsolutnu slobodu stila.
Pored toga, SDKSL može da generiše koncepte koji su notorno teški za prikazivanje modela slika, kao što su ruke i tekst ili prostorno raspoređene kompozicije (npr. čovjek u pozadini koji juri psa u prvom planu). Postoji mogućnost i retuširanje slika, pretvaranje kompozicije u potpuno drugačiju scenu, promjenu stila i sl.
Da bi se dobili kvalitetni rezultati, novom alatu je potrebno manje riječi u promptu, tj. sistem će bolje razumjeti tekstualne komande i generisati rezultate bliže onim što korisnik očekuje.
Tim Stability AI gradi sljedeću generaciju kontrola strukture, stila i kompozicije specifičnih za zadatak, sa T2I/ControlNet specijalizovanim za SDKSL. Ove funkcije su trenutno u beta testiranju…
SDKSL 1.0 kompanije Stability AI može se isprobati u okviru njihove usluge Clipdrop, gdje se ograničen broj slika (400 dnevno) može generisati besplatno.
(IT mixer)