Wystarczą 3 sekundy, by ukraść Twój głos

Lepiej uważać na głuche telefony. Nowe AI potrafi skutecznie naśladować czyjś głos i sposób mówienia, a do nauki wystarczy jej nawet 3-sekundowa próbka.

news
Arkadiusz Strzała10 stycznia 2023
7
Źrodło fot. Thomas Le / Unsplash
i
W SKRÓCIE:
  • Microsoft stworzył AI naśladujące głos na podstawie kilkusekundowej próbki.

Microsoft opublikował dokumentację swojej nowo opracowanej sztucznej inteligencji VALL-E, która potrafi imitować ludzkie głosy. Nie byłoby w tym nic dziwnego – wszak mamy już wiele systemów przetwarzających tekst na mowę (TTS). Ale AI Microsoftu może jednak całkiem skutecznie naśladować czyjś głos, tembr i emocje, ucząc się na podstawie zaledwie 3-sekundowej próbki.

Interaktywna papuga?

Wystarczy krótkie nagranie, by sieć neuronowa opracowała kodek dźwiękowy, który może „powiedzieć” dowolny tekst, a rozmówca będzie miał wrażenie, że konwersuje z prawdziwą osobą. VALL-E zostało wytrenowane na bazie 60 tys. godzin próbek mowy angielskiej. Na stronie (link wyżej) są dostępne specyfikacja i demonstracyjne nagrania audio.

VALL-E Microsoftu może zagrozić pracy aktorów podkładających głos w filmach i kreskówkach (choć raczej jeszcze nie teraz), ale nie tylko. Skoro systemy imitujące głos stały się tak zaawansowane i zarazem proste w użyciu, może pojawić się np. nowy typ oszustwa telefonicznego, polegającego na podszywaniu się pod bliskich. Odbierzemy pozornie głuchy telefon, a kilka słów wystarczy, by sieć neuronowa po drugiej stronie nauczyła się naśladować nasz głos.

Arkadiusz Strzała

Arkadiusz Strzała

Swoją przygodę z pisaniem zaczynał od własnego bloga i jednego z wczesnych forum (stworzonego jeszcze w technologii WAP). Z wykształcenia jest elektrotechnikiem, posiada zamiłowanie do technologii, konstruowania różnych rzeczy i rzecz jasna – grania w gry komputerowe. Obecnie na GOL-u jest newsmanem i autorem publicystyki, a współpracę z serwisem rozpoczął w kwietniu 2020 roku. Specjalizuje się w tekstach o energetyce i kosmosie. Nie stroni jednak od tematów luźniejszych lub z innych dziedzin. Uwielbia oglądać filmy science fiction i motoryzacyjne vlogi na YouTube. Gry uruchamia głównie na komputerze PC, aczkolwiek posiada krótki staż konsolowy. Preferuje strategie czasu rzeczywistego, FPS-y i wszelkie symulatory.

AMD zmiażdzyło Intela na rynku procesorów. Ponad 4 razy więcej sprzedanych egzemplarzy na amerykańskim Amazonie

AMD zmiażdzyło Intela na rynku procesorów. Ponad 4 razy więcej sprzedanych egzemplarzy na amerykańskim Amazonie

Gry jeszcze nigdy nie wyglądały lepiej. Ten monitor to marzenie niejednego gracza i coraz łatwiej można je spełnić

Gry jeszcze nigdy nie wyglądały lepiej. Ten monitor to marzenie niejednego gracza i coraz łatwiej można je spełnić

Ten procesor to bestia do nowych gier. W tak niskiej cenie na Amazonie to prawdziwa okazja dla gracza

Ten procesor to bestia do nowych gier. W tak niskiej cenie na Amazonie to prawdziwa okazja dla gracza

Switch 2 nie ma ekranu OLED, ale to nic - porównanie z pierwszą generacją pokazuje sporą różnicę w jakości

Switch 2 nie ma ekranu OLED, ale to nic - porównanie z pierwszą generacją pokazuje sporą różnicę w jakości

50 lat Microsoft: Bill Gates dzieli się „najfajniejszym kodem, jaki napisał”

50 lat Microsoft: Bill Gates dzieli się „najfajniejszym kodem, jaki napisał”