Amazon je najavio da Alexa digitalni asistent sada može tehnički oponašati bilo čiji glas na osnovu nekoliko klipova, oko 1 minute snimanja.
Ako funkcioniše kako je reklamirano, to bi bila tehnička prekretnica jer kompjuterski generisani glasovi zapravo ne zavaravaju ljude i još uvijek su loš izbor za video-glasove, na primjer. Demo uživo možete pogledati u videu na kraju teksta (01:02:38):
U stvarnosti, transformiše otisak/ton glasa iz tipičnog mašinski generisanog agenta kako bi odgovarao ciljanom otisku ljudskog glasa. Nije lako kvantificirati uspjeh demonstracije bez poznavanja originalnog glasa, ali izgledalo je prilično uspješno, iako je i dalje zvučalo pomalo robotski.
Odabrana rečenica je nesumnjivo dobro odabrana za demo jer je pogodna za sporo, gotovo robotsko čitanje. Tehnologija je slična umjetnoj inteligenciji koja se koristi za transformaciju vaših slika u Picassove slike, ali se primjenjuje na audio stream.
Možda zvuči zabavno da Alexa govori glasom vaše omiljene poznate ličnosti, prijatelja ili člana porodice. Međutim, internet je brzo skrenuo pažnju na korištenje glasovnih snimaka bivših članova porodice. To je slučaj upotrebe koji je jedan Amazonov izvršni direktor iznio u ovom videu.
S jedne strane, može zvučati kao iscjeljujuće iskustvo čuti glas nekog bliskog ko više nije s nama. Međutim, to je i potencijalno klizav teren sa neželjenim posljedicama. Mnogi ljudi su počeli da se pitaju da li se tehnologija može zloupotrebiti za lažno predstavljanje živih ljudi i da li imamo pravo da koristimo glasove bez pristanka.
Odgovor je vjerovatno „zavisi“, na osnovu situacije i korisnika. Međutim, jedno je sigurno: ove tehnologije postoje i biće sve bolje i bolje. Samo je pitanje vremena kada sintetizovani glasovi se neće moći razlikovati od ljudskih.