VALL E

微软开发了这种人工智能模型。借助该工具，用户可生成具有各种情感基调的现实人类语言。

暂时无法下载

关于 VALL E

VALL E是一个包含复杂人工智能算法的在线Windows服务。那个可以模仿声音，画出高品质的效果。模型由7000多名英语人士的语音样本训练。

这种神经网络采用完全不同的语音合成方法和传统的程序不同。算法能够识别出音色和感情音等细微的语音特征。正因为如此，该服务只需处理一段3秒的音频片段，就可以模仿特定人。

在官方网站上也有人工智能工作的例子。使用者可以收听语音片段，并与传统的语音合成器进行比较。除此之外，在线数据库中包含各种情感色彩的样本。在快乐、愤怒、厌恶等诸多方面，人工智能也能说出同样的话。

有必要指出，与Stable Diffusion不同，VALL E算法的源代码尚未在公共领域可用。出于这个原因，您无法基于自定义音频文件生成声音。人们担心这种服务可能被用于恶意目的，这种担心与神经网络的密切性有关。

暂时无法下载