VALL E
微软开发了这种人工智能模型。借助该工具,用户可生成具有各种情感基调的现实人类语言。
关于 VALL E
VALL E是一个包含复杂人工智能算法的在线Windows服务。那个可以模仿声音,画出高品质的效果。模型由7000多名英语人士的语音样本训练。
语音生成
这种神经网络采用完全不同的语音合成方法和传统的程序不同。算法能够识别出音色和感情音等细微的语音特征。正因为如此,该服务只需处理一段3秒的音频片段,就可以模仿特定人。
在官方网站上也有人工智能工作的例子。使用者可以收听语音片段,并与传统的语音合成器进行比较。除此之外,在线数据库中包含各种情感色彩的样本。在快乐、愤怒、厌恶等诸多方面,人工智能也能说出同样的话。
试用期
有必要指出,与Stable Diffusion不同,VALL E算法的源代码尚未在公共领域可用。出于这个原因,您无法基于自定义音频文件生成声音。人们担心这种服务可能被用于恶意目的,这种担心与神经网络的密切性有关。
主要功能
- 可以免费下载和使用;
- 提供一个训练真实人语音模式的神经网络模型;
- 让你改变声音的音色和情感音调;
- 源代码由于各种安全顾虑尚未公开;
- 兼容所有现代版本的Windows。