VALL E
Microsoft hat dieses Modell der künstlichen Intelligenz entwickelt. Mit seiner Hilfe können Benutzer authentische menschliche Sprache mit einer Reihe von emotionalen Untertönen erzeugen.
Über VALL E
Ein Online-Windows-Dienst namens VALL E verfügt über hochentwickelte KI-Algorithmen. Er ermöglicht es Ihnen, hervorragende Stimmimitationen zu produzieren. Für das Training des Modells wurden fast 7000 Stimmproben englischsprachiger Personen verwendet.
Stimmerzeugung
Im Vergleich zu herkömmlichen Programmen verwendet dieses neuronale Netzwerk völlig andere Sprachsynthesetechniken. Das System ist in der Lage, kleinste stimmliche Merkmale wie Timbre und emotionale Töne zu erkennen. Daher kann der Dienst nach der Analyse eines nur drei Sekunden langen Audiosegments die jeweilige Person nachbilden.
Auf der offiziellen Webseite finden Sie KI-Proben. Sie haben die Möglichkeit, sich Audioclips anzuhören und sie mit herkömmlichen Sprachsynthesizern zu vergleichen. Die Internet-Datenbank enthält auch Proben mit verschiedenen emotionalen Tönen. Die KI ist in der Lage, das Gleiche zu sagen, wenn sie sich glücklich, wütend, angewidert usw. fühlt.
Testphase
Es ist wichtig zu betonen, dass der Quellcode des VALL E Algorithmus im Gegensatz zu Stable Diffusion noch nicht öffentlich zugänglich ist. Dies macht es unmöglich, die Stimme anhand einer eindeutigen Audiodatei zu erzeugen. Die Bedenken, dass der Dienst missbraucht werden könnte, hängen mit der engen Beziehung des neuronalen Netzwerks zu den Daten zusammen.
Leistungsmerkmale
- kostenlos zu benutzen und herunterzuladen;
- liefert ein neuronales Netzwerkmodell, das mit den Sprachmustern echter Menschen trainiert wurde;
- ermöglicht es Ihnen, das Timbre und die emotionale Intonation der Stimme zu verändern;
- aufgrund verschiedener Sicherheitsaspekte ist der Quellcode derzeit nicht verfügbar;
- kompatibel mit allen aktuellen Windows-Versionen.