Google proširuje svoje mogućnosti uređivanja slika pomoću vještačke inteligencije (AI) tako što uvodi ugrađene alate za uređivanje slika u svoju aplikaciju Gemini, vodeći AI četbot. Ova nova funkcija, najavljena ove sedmice, omogućava korisnicima da uređuju slike direktno putem konverzacije – bez potrebe za dodatnim softverom.

Prvi put predstavljena u martu 2024. putem platforme Google AI Studio, ova funkcija koristi model Gemini 2.0 Flash, koji omogućava korisnicima da kroz jednostavne tekstualne komande dodaju, uklone ili zamijene objekte, promijene pozadinu, poboljšaju elemente slike i još mnogo toga.

 

Google ulazi na tržište AI uređivanja slika

 

U poređenju s konkurencijom poput ChatGPT-a, Microsoft Copilot-a i Midjourney-a, Google je kasnio s ulaskom na tržište generisanja i uređivanja slika pomoću AI-ja. Iako je funkcija prvobitno lansirana početkom 2024, brzo je povučena nakon što su korisnici prijavili da AI generiše netačne i uvredljive slike. Google ju je ponovo uveo u decembru 2024. uz poboljšane bezbjednosne mjere u okviru Gemini 2.0 Flash modela.

 

Nova funkcija uređivanja slika u aplikaciji Gemini: Šta sve možete

 

Nova funkcija sada se integriše direktno u aplikaciju Gemini, a globalno uvođenje je već počelo. Google navodi da se funkcija postepeno uvodi i da će uskoro biti dostupna korisnicima na više od 45 jezika širom svijeta.

Korisnici mogu da otpreme sopstvene fotografije ili izaberu AI-generisane slike, a zatim koriste prirodni jezik za uređivanje. Na primjer, možete da otpremite sliku stola i zatražite od Geminija da „doda vazu s cvijećem“. Takođe možete da uređujete portrete – na primjer, da promijenite boju kose ili zamijenite pozadinu – sve kroz tekstualne komande.

 

Google odgovara na rizik od deepfake sadržaja

 

S obzirom na sve veći rizik od AI deepfake sadržaja, Google naglašava važnost odgovorne upotrebe. Model Gemini obučen je da odbije štetne, uvredljive ili obmanjujuće zahtjeve. Radi transparentnosti, sve slike koje uređuje ili generiše AI nosiće nevidljivi digitalni vodeni žig SynthID, a Google trenutno testira i vidljive vodene žigove za sav AI-generisan sadržaj.

Kako se Google Gemini AI dalje razvija, uvođenje ugrađenih alata za uređivanje slika predstavlja veliki korak ka približavanju moćne AI tehnologije običnim korisnicima. Uz sigurnosne mehanizme i podršku za veliki broj jezika, ova funkcija dodatno pozicionira Gemini kao ozbiljnog takmaca na tržištu AI aplikacija za uređivanje slika.