Google je objavio svoj sistem vještačke inteligencije (AI) koji je u stanju da kreira slike na osnovu tekstualnih uputstava
Ideja koja stoji iza ove Google tehnologije je da korisnik može da opiše situaciju kakvu želi, a da AI te informacije pretvori u sliku. Tehnologiju je osmislio i realizovao Brain Team u Google Research-u.
Ovo nije prva tehnologija text-to-image modela. Već postoje DALL-E, VQ-GAN+CLIP i još neki sistemi koji rade to isto. Međutim, Imagen, kako se Google-ov AI zove, je na osnovu DrawBench benchmarka najbolje ocijenjen od strane ljudi koji su ih testirali.
Suštinski, radi se o listi od 200 opisa, na osnovu kojih svaki AI generiše slike, koje zatim ocjenjuju ljudi, i to po osnovu dva kriterijuma – kvalitet slike i tačnost predstavljanja opisa.
Inače, Imagen još uvijek nije javno dostupan, jer Google smatra da još uvijek nije dovoljno dobar da precizno predstavi sve grafičke opise.
Jedan od razloga je i što je AI treniran na osnovu velikog broja fotografija preuzetih sa Interneta, što bi teoretski u realnim uslovima moglo da prouzrokuje različite probleme.
Iz Google-a kažu da su se trudili da uklone neprikladne fotografije, kao što su pornografija ili brutalne scene, ali da uvijek postoji šansa da je neka takva slika izbjegla cenzuru i da se našla u bazi.
Budući razvoj Imagen-a biće na polju istraživanja, a to je kako da se na odgovoran način iskoriste slike iz baze, odnosno kako da se napravi optimalan balans između slobodnog pristupa i uklanjanja neprikladnih slika.
Za sada se eksperimentiše sa ograničenim ključnim riječima, ali to u perspektivi predstavlja veliki ograničavajući faktor.
(Engadget)
Dopada vam se IT-mixer? Podržite nas putem društvenih mreža na linkovima ispod. Lajkujte našu stranicu na Facebooku, budite informisani u svakom momentu.