Komputery już wkrótce będą w stanie idealnie imitować nasz głos


To deepfake, który może mieć pozytywne spin-offy: sprawa Kilmera. Jak komputery nauczą się mówić naszym głosem.

Możliwość sklonowania własnego głosu będzie w przyszłości coraz bardziej dostępna. Firmy oferujące tę usługę pracują również nad dokładnością wyników: zapomnij o elektronicznych głosach, do których jesteśmy przyzwyczajeni, przyszłość sztucznego mówienia będzie coraz bardziej nie do odróżnienia od "zsyntetyzowanego" głosu danej osoby.

Tworzenie własnego głosu na komputerze: jak to zrobić

Tak to działa: aby sklonować własny głos, czyta się skrypt, a komputer go nagrywa. Czasami możesz być zmuszony do cofnięcia się i powtórzenia niektórych linijek tekstu, aby nadrobić bełkot lub dźwięki, które nie zostały idealnie zeskanowane. W sumie cały proces zajmuje tylko 30 minut, plus kilka godzin przetwarzania przez oprogramowanie. Wtedy gotowy będzie nasz własny głos, który komputer będzie mógł odtworzyć, być może "czytając" w czatach wersy, które sami napisaliśmy.

To przerażająca technologia, tak samo przerażająca jak wszystko, co zbliża możliwości maszyn do możliwości ludzi: krytyczne aspekty takich zastosowań sztucznej inteligencji będą być może jasne jako pierwsze. Jest to, w zasadzie, deepfake, ale taki, który rozwija się tylko na froncie audio. W rzeczywistości deepfakes są definiowane jako syntetyczne media, w których osoba, na obrazie lub wideo, jest sztucznie zastępowana lub klonowana, innymi słowy, sfałszowane treści i, w razie potrzeby, fake news przy użyciu innowacyjnych technik uczenia maszynowego i sztucznej inteligencji.


Dwa przykłady: przypadek Bourdaina i Kilmera

Na przykład wybór twórców filmu dokumentalnego Roadrunner: A Film About Anthony Bourdain, poświęconego zmarłemu śmiercią samobójczą kucharzowi, nie omieszkał wzbudzić kontrowersji. Przy tej okazji niektóre wersy napisane ręką amerykańskiego celebryty zostały przekształcone w voice-over przy użyciu oprogramowania do syntezy głosu. Reakcja opinii publicznej na Val Kilmera była wręcz przeciwna: głos aktora został uszkodzony w 2014 roku po tracheotomii w leczeniu raka gardła. Dzięki interwencji oprogramowania podobnego do opisanego powyżej, Val Kilmer może teraz używać wysoce efektywnej elektronicznej wersji swojego głosu. To pokazuje, że kontrowersyjna technologia syntezy mowy może mieć również zastosowania, które są powszechnie postrzegane jako pozytywne.

Giuseppe Giordano