vall-e-neyroset-icon

VALL E

微软开发了这种人工智能模型。借助该工具,用户可生成具有各种情感基调的现实人类语言。

关于 VALL E

VALL E是一个包含复杂人工智能算法的在线Windows服务。那个可以模仿声音,画出高品质的效果。模型由7000多名英语人士的语音样本训练。

语音生成

这种神经网络采用完全不同的语音合成方法和传统的程序不同。算法能够识别出音色和感情音等细微的语音特征。正因为如此,该服务只需处理一段3秒的音频片段,就可以模仿特定人。

在官方网站上也有人工智能工作的例子。使用者可以收听语音片段,并与传统的语音合成器进行比较。除此之外,在线数据库中包含各种情感色彩的样本。在快乐、愤怒、厌恶等诸多方面,人工智能也能说出同样的话。

试用期

有必要指出,与Stable Diffusion不同,VALL E算法的源代码尚未在公共领域可用。出于这个原因,您无法基于自定义音频文件生成声音。人们担心这种服务可能被用于恶意目的,这种担心与神经网络的密切性有关。

主要功能

  • 可以免费下载和使用;
  • 提供一个训练真实人语音模式的神经网络模型;
  • 让你改变声音的音色和情感音调;
  • 源代码由于各种安全顾虑尚未公开;
  • 兼容所有现代版本的Windows。