Google je objavio svoj sistem vještačke inteligencije (AI) koji je u stanju da kreira slike na osnovu tekstualnih uputstava

 

Ideja koja stoji iza ove Google tehnologije je da korisnik može da opiše situaciju kakvu želi, a da AI te informacije pretvori u sliku. Tehnologiju je osmislio i realizovao Brain Team u Google Research-u.

Ovo nije prva tehnologija text-to-image modela. Već postoje DALL-E, VQ-GAN+CLIP i još neki sistemi koji rade to isto. Međutim, Imagen, kako se Google-ov AI zove, je na osnovu DrawBench benchmarka najbolje ocijenjen od strane ljudi koji su ih testirali.

Suštinski, radi se o listi od 200 opisa, na osnovu kojih svaki AI generiše slike, koje zatim ocjenjuju ljudi, i to po osnovu dva kriterijuma – kvalitet slike i tačnost predstavljanja opisa.

Inače, Imagen još uvijek nije javno dostupan, jer Google smatra da još uvijek nije dovoljno dobar da precizno predstavi sve grafičke opise.

Jedan od razloga je i što je AI treniran na osnovu velikog broja fotografija preuzetih sa Interneta, što bi teoretski u realnim uslovima moglo da prouzrokuje različite probleme.

Iz Google-a kažu da su se trudili da uklone neprikladne fotografije, kao što su pornografija ili brutalne scene, ali da uvijek postoji šansa da je neka takva slika izbjegla cenzuru i da se našla u bazi.

Budući razvoj Imagen-a biće na polju istraživanja, a to je kako da se na odgovoran način iskoriste slike iz baze, odnosno kako da se napravi optimalan balans između slobodnog pristupa i uklanjanja neprikladnih slika.

Za sada se eksperimentiše sa ograničenim ključnim riječima, ali to u perspektivi predstavlja veliki ograničavajući faktor.

(Engadget)

 

Dopada vam se  IT-mixer? Podržite nas putem društvenih mreža na linkovima ispod. Lajkujte našu stranicu na Facebooku, budite informisani u svakom momentu.