Sinteza vocii a parcurs un drum lung din anii 1978 Vorbește și vrăjește jucărie, care odată a uimit oamenii cu capacitatea sa de ultimă generație de a citi cuvintele cu voce tare folosind o voce electronică. Acum, folosind modele AI de învățare profundă, software-ul poate crea nu numai voci cu sunet realist, ci și să imite în mod convingător vocile existente folosind mostre mici de sunet.
În acest sens, OpenAI tocmai a anunțat Voice Engine, un model AI text-to-speech pentru crearea de voci sintetice bazate pe un segment de 15 secunde de sunet înregistrat. A oferit mostre audio ale motorului vocal în acțiune pe site-ul său.
Odată ce o voce este clonată, un utilizator poate introduce text în Voice Engine și poate obține un rezultat vocal generat de AI. Dar OpenAI nu este încă pregătit să-și lanseze tehnologia pe scară largă. Compania a planificat inițial să lanseze un program pilot pentru ca dezvoltatorii să se înscrie la API-ul Voice Engine la începutul acestei luni. Dar după mai multă atenție asupra implicațiilor etice, compania a decis să-și reducă ambițiile pentru moment.
Comentarii recente