20 Junho 2023
A startup espanhola Voicemod lançou um software que permite a modificação de vozes para mais de 20 avatares sonoros. A empresa desenvolveu uma mesa de edição de som com inteligência artificial que possibilita a conversão instantânea da fala.
Segundo a Voicemod, seu diferencial para outras empresas do mercado é que ela transforma vozes em tempo real e com baixa latência, permitindo que os usuários conversem como fariam na vida real. O software tem acesso a um banco de dados disponíveis publicamente e atores de voz profissionais, o que resulta em uma ampla variedade de expressões vocais, frequências, tons e emoções. Através de técnicas de aprendizado de máquina, o modelo aprende a entender, analisar e prever os padrões e características da fala de uma pessoa.
O público-alvo da empresa é a indústria de entretenimento, gamers, streamers e criadores de conteúdo no Discord, Twitch, Zoom e até WhatsApp.
A empresa já disponibilizou mais de 100 vozes para serem utilizadas como base, mas o foco principal agora é o desenvolvimento do catálogo AI Humans, que tem 20 avatares sonoros que variam em personalidade, gênero e idade. Os usuários também podem personalizar o tom de cada persona, alterando a percepção do gênero e idade da voz.
Apesar de todos os benefícios dessa inovação, a empresa está ciente dos riscos que a tecnologia também carrega. Por isso, a Voicemod está desenvolvendo uma marca d'água que permita a identificação e rastreio dessas vozes, além de medidas para proteger a propriedade intelectual dos atores de voz com os quais está trabalhando.
O editor já tem mais de 40 milhões de downloads e está disponível gratuitamente, com a opção de uma versão PRO paga que desbloqueia recursos e conteúdos adicionais. A startup também trabalha em uma versão para dispositivos móveis e em parcerias B2B com empresas de jogos e plataformas de headsets de realidade virtual.
Comentários