Stemklonen steeds belangrijker voor actoren en cybercriminelen

Stemklonen steeds belangrijker voor actoren en cybercriminelen

Door Kitti Palmai
Zakelijke verslaggever

Gepubliceerd1 dag geledenDelencloseDeel paginaKopieer linkOver delenafbeelding copyrightTim Hellerafbeelding bijschriftTim Heller is een voice-over artiest en acteur

Nu de technologie voor het klonen van spraak steeds effectiever is geworden, wordt het steeds belangrijker voor actoren… en cybercriminelen.

Toen Tim Heller zijn gekloonde stem voor het eerst hoorde, zei hij dat het zo nauwkeurig was dat “mijn kaak de grond raakte… het was verbluffend”.

Stemklonen is wanneer een computerprogramma wordt gebruikt om een ​​synthetische, aanpasbare kopie van iemands stem te genereren.

Van een opname van iemand die praat, kan de software zijn of haar stem repliceren door woorden of zinnen te spreken die u op een toetsenbord typt.

De recente vooruitgang in de technologie is zo geweest dat de door de computer gegenereerde audio nu zenuwslopend exact wordt genoemd. De software kan niet alleen uw accent oppikken, maar ook uw timbre, toonhoogte, tempo, spreekstroom en uw ademhaling.

En de gekloonde stem kan worden aangepast om elke gewenste emotie weer te geven – zoals woede, angst, geluk, liefde of verveling.

Mr Heller, een 29-jarige voice-over artiest en acteur uit Texas, doet alles, van het uitbeelden van stripfiguren, het vertellen van audioboeken en documentaires, spreken over videogames en de voice-overs op filmtrailers.

Hij zegt dat hij onlangs overging op het klonen van stemmen om zijn carrière “toekomstbestendig” te maken.

Hij zegt dat het hem in staat kan stellen meer werk veilig te stellen. Als hij bijvoorbeeld ooit dubbel wordt geboekt, kan hij aanbieden om in plaats daarvan zijn stemkloon te sturen om een ​​van de taken te doen.

“Als ik geboekt ben voor ander werk… kan ik mijn ‘dub’ positioneren [what he calls his voice clone] als een optie die klanten tijd kan besparen en een passief inkomen voor mezelf kan genereren”, zegt Heller.

Om zijn stem gekloond te krijgen ging meneer Heller naar een bedrijf in Boston, genaamd VocaliD – een van een groeiend aantal bedrijven dat nu de dienst aanbiedt.

VocaliD is opgericht door de directeur Rupal Patel, die ook hoogleraar communicatiewetenschappen en -stoornissen is aan de Northeastern University.

Prof Patel richtte het bedrijf in 2014 op als een verlengstuk van haar klinische werk om kunstmatige stemmen te creëren voor patiënten die niet kunnen praten zonder hulp, zoals mensen die hun stem hebben verloren na een operatie of ziekte.

image copyrightRupal Patelimage captionEen Amerikaanse academicus, Prof Patel is een expert in het klonen van stemmen

Ze zegt dat de technologie – die wordt geleid door kunstmatige intelligentie, software die zichzelf kan ‘leren’ en aanpassen – de afgelopen jaren enorm is vooruitgegaan. Dit heeft de aandacht getrokken van voice-over artiesten.

“We zijn ook gespecialiseerd in het maken van aangepaste stemmen met een meer divers accent”, zegt prof. Patel. “We hebben enkele transgenderstemmen gemaakt, we hebben genderneutrale stemmen gemaakt… technologie zou moeten spreken zoals wij allemaal spreken, we hebben allemaal unieke accenten en stemmen.”

Stemklonen kan ook worden gebruikt om de woorden van een acteur in verschillende talen te vertalen, wat bijvoorbeeld kan betekenen dat Amerikaanse filmproductiebedrijven geen extra acteurs meer hoeven in te huren om nagesynchroniseerde versies van hun films te maken voor overzeese distributie.

Het Canadese bedrijf Resemble AI zegt dat het gekloonde Engelse stemmen nu in 15 andere talen kan omzetten.

Chief executive Zohaib Ahmed zegt dat om een ​​kwaliteitskopie van iemands stem te genereren, de software een opname van iemand nodig heeft die slechts 10 minuten aan het woord is.

image copyrightZohaib Ahmedimage captionZohaib Ahmed’s firma kan de stem van een persoon in andere talen veranderen

“Wanneer de AI je stem leert, leert het veel eigenschappen… zoals timbre en toonhoogte en intensiteit”, zegt hij.

“Maar het leert ook duizenden andere functies [of a person’s voice] dat is misschien niet erg duidelijk voor ons.”

Maar hoewel de toenemende verfijning van het klonen van spraak een duidelijk commercieel potentieel heeft, heeft het ook geleid tot toenemende bezorgdheid dat het zou kunnen worden gebruikt bij cybercriminaliteit – om mensen te misleiden dat iemand anders praat.

Samen met door de computer gegenereerde nepvideo’s wordt spraakklonen ook wel “deepfake” genoemd. En expert op het gebied van cyberbeveiliging, Eddy Bobritsky, zegt dat er een “enorm veiligheidsrisico” is verbonden aan de synthetische stemmen.

“Als het om e-mail of sms gaat, is het al jaren bekend dat het vrij gemakkelijk is om je voor te doen als iemand anders”, zegt de baas van het Israëlische bedrijf Minerva Labs.

“Maar tot nu toe was telefoneren met iemand die je vertrouwt en goed kent een van de meest gebruikelijke manieren om ervoor te zorgen dat je de persoon echt kent.”

De heer Bobritsky zegt dat daar nu verandering in komt. “Als een baas bijvoorbeeld een werknemer belt om gevoelige informatie te vragen en de werknemer herkent de stem, dan is de onmiddellijke reactie om te doen wat hem wordt gevraagd. Het is een pad voor veel cybercriminaliteit.”

New Tech Economy is een serie die onderzoekt hoe technologische innovatie het nieuwe opkomende economische landschap vorm zal geven.

Een dergelijk geval werd zelfs in 2019 gemeld door de Wall Street Journal, waarbij een Britse manager zou zijn misleid om € 220.000 ($ 260.000; £ 190.000) over te maken aan fraudeurs die een gekloonde kopie van de stem van zijn Duitse baas gebruikten .

“Er moeten stappen worden ondernomen om met deze nieuwe technologie om te gaan en de bedreigingen die deze met zich meebrengt”, voegt de heer Bobritsky toe.

Bedrijven over de hele wereld doen dit in feite al, zoals de gespecialiseerde nieuwswebsite Venture Beat heeft gemeld.

Dergelijke bedrijven kunnen audio controleren om te zien of het nep is, op zoek naar verklikkers zoals herhaling, digitale ruis en het gebruik van bepaalde zinnen of woorden.

Ondertussen kijken ook regeringen en wetshandhavingsinstanties naar de kwestie. Vorig jaar riep Europol, de wetshandhavingsinstantie van de Europese Unie, de lidstaten op om “aanzienlijke investeringen” te doen in technologieën die deepfakes kunnen detecteren. En in de VS heeft Californië het gebruik ervan in politieke campagnes verboden.

Terug in Texas zegt Tim Heller dat hoewel hij zijn gekloonde stem nog niet heeft verkocht, “een paar verschillende klanten interesse hebben getoond”.

image copyrightTim Hellerimage captionTim Heller zegt hoeveel hij betaald krijgt voor zijn kloon is een punt van zorg

Maar vreest hij dat hij op langere termijn werk kan verliezen aan de synthetische stemmen van anderen?

“Ik maak me geen zorgen dat het me werkloos kan maken”, zegt hij. “Ik heb echt het gevoel dat er altijd een plaats zal zijn voor de echte menselijke stem. Het nut van een ‘dub’ [his clone] is niet om mij of iemand anders te vervangen, maar om op te treden als een extra hulpmiddel in mijn bedrijf.”

Rebecca Damon, uitvoerend vice-president van de Amerikaanse acteursvakbond, de Screen Actors Guild, zegt dat het andere belangrijke probleem met betrekking tot het klonen van stemmen is dat voice-over-artiesten correct voor hen worden betaald.

“Spraakklonen zou een opwindende en potentieel lucratieve nieuwe industrie kunnen zijn voor onze leden om in te werken”, zegt ze. “Het is echter van cruciaal belang voor ons, zoals altijd, dat stemartiesten eerlijk worden gecompenseerd en kunnen instemmen met hoe hun stemmen worden gebruikt.

“Daarom volgen we de ontwikkelingen op het gebied van spraakklonen nauwlettend en werken we samen met onze leden om de vangrails te identificeren die nodig zijn om deze technologie haar potentieel als een nieuw en welkom werkgebied te laten bereiken.”

Heller voegt eraan toe dat het probleem bij het bepalen van de prijs voor spraakklonen is dat “dit het ‘wilde westen’ van voice-over is”.

“Het belangrijkste, naar mijn mening, als het gaat om prijzen en contractonderhandelingen [for your artificial voice] is dat je niet alle rechten en gebruik voor altijd wegneemt”, zegt hij.

Aanvullende rapportage door Will Smale.

.