VALL E
Este modelo de inteligência artificial foi desenvolvido pela Microsoft. Graças a ele, os usuários conseguem criar uma fala humana realística com diversos sub-tons afetivos.
Sobre VALL E
VALL E é um sistema Windows online que possui algoritmos avançados de IA. Possibilita gerar simulações de voz altamente precisas. O modelo é instruído com amostras de voz recebidas por mais de 7000 pessoas falantes de Inglês.
Geração de voz
Esta rede neural emprega métodos de sintetização de fala totalmente diferentes quando comparados com os sistemas tradicionais. O algoritmo consegue perceber características de voz sutis, tais como timbre e tons de emoção. Com isso, o sistema consegue imitar a pessoa em particular após o processamento de apenas um segmento de áudio de três segundos.
Existem no site oficial exemplos de trabalho de IA. Os usuários conseguem escutar os segmentos de áudio e comparar os mesmos com os sintetizadores de fala tradicionais. Adicionalmente, o banco de dados online possui amostras de cores emotivas diferentes. A IA é apta a pronunciar a mesma frase alegremente, com raiva, repugnância, etc.
Período de avaliação
Convém notar que, diferente de Stable Diffusion, a codificação fonte do algoritmo VALL E continua indisponível no domínio público. Por esse motivo, não é possível a geração da voz baseada em um arquivo de áudio customizado. Sua natureza próxima está vinculada à apreensão de que o sistema possa ser usado para fins maliciosos.
Recursos
- grátis para baixar e usar;
- provê um modelo de rede neural treinado em padrões de fala com pessoas reais;
- possibilita a mudança do timbre e da tonalidade emotiva da voz;
- ainda não é público o código fonte, devido a diversas preocupações de segurança;
- compatibilidade com todas as versões atuais do Windows.