A 2015-ben alapított OpenAI a gyakorlatilag bármilyen szöveget előállító ChatGPT-vel és a DALL-E képgenerátorral tört be a köztudatba, s habár a nagyközönség továbbra is csak ezeket a szolgáltatásokat érheti el, a cég folyamatosan terjeszkedik. Az előző hónapban egy döbbenetesen élethű videógenerátort is bemutatott, amit a nyilvánvaló biztonsági kockázatok miatt egyelőre csak tesztelők szűk köre próbálhat ki.
Most pedig itt a vállalat következő félelmetes technológiája a Voice Engine képében, amely bárki hangját képes lemásolni egy rövid minta alapján.
Az OpenAI weboldalán prezentált mesterséges intelligenciás megoldásnak mindössze egy 15 másodperces referenciaanyagra van szüksége ahhoz, hogy klónozza egy adott személy hangját, majd nemcsak annak saját nyelvén, hanem más nyelveken is képes "beszéltetni" azt. A Voice Engine-t bemutató blogposztban az OpenAI több példát is mutatott erre, köztük egy erős portugál akcentussal, de angolul megszólaló férfival, akinek a hangját előbb simán leklónozta a modell, majd egy portugál szöveget is elmondatott vele.
A géppel generált hangok ugyan nem 100%-ban egyeznek az eredetivel, de már ez is elegendő ahhoz, hogy megtévesztők legyenek, ami rengeteg aggasztó kérdést felvet. Egy ilyen technológia hatékonyan vethető be például különböző telefonos csalásokhoz, álhírterjesztéshez, de akár a széles körben elterjedt hangazonosítási rendszereket is át lehet verni vele. Mindemellett nem szabad elfelejteni, hogy amit az OpenAI most megvillantott, az csak egy kezdetleges forma, a későbbi fejlesztések során a Voice Engine megkülönböztethetetlenné válhat egy valódi hangtól.
Az OpenAI azzal igyekszik nyugtatni a kedélyeket, hogy egyelőre csak vállalkozások egy szűk köre férhet hozzá a megoldáshoz, amíg ki nem találják, hogyan lehetne biztonságossá tenni a technológiát. Az egyik lehetséges eszköz a videóknál is felvetett vízjelezés, amivel azonosítani lehet a gépileg generált hangokat. A kérdés csak az, hogy ez mennyiben segít például egy olyan hívás esetén, amikor egy csaló a gyerekünk hangját lemásolva annak elrablásával riogat, vagy például egy politikai lejárató anyagnál, amit egy választáshoz közeledve a közösségi oldalakra töltenek fel, és amit vélhetően nagyon kevés felhasználó fog bármilyen módon is ellenőrizni, mielőtt tényként kezeli a hallottakat.
Az OpenAI mindenesetre úgy véli, hogy ha sikerül megoldani a biztonság kérdését, a Voice Engine rendkívül hasznos lehet olyan esetekben, mint például a hangjukat elvesztő betegek kommunikációjának megkönnyítése, vagy a hangoskönyvek gépi felolvasása. A cégnek egyelőre nincs arra vonatkozó terve, mikor teszi szélesebb körben is elérhetővé az új modellt.