VALL E
이 인공지능 모델은 Microsoft에 의해 개발되었습니다. 서비스 덕분에 사용자들은 다양한 감정적인 저음으로 사실적인 사람의 말을 만들 수 있습니다.
VALL E 소개
VALL E는 복잡한 인공지능 알고리즘을 포함하는 온라인 윈도우용 서비스입니다. 사용자는 고품질의 음성 모방을 만들 기회가 있습니다. 이 모델은 7,000명 이상의 영어 사람들의 연설 샘플로 학습되었습니다.
기능
이 신경망은 기존 서비스와 비교하여 완전히 다른 음성 합성 방법으로 작동합니다. 알고리즘은 음색, 감정적인 음조와 같은 미묘한 음성 특징을 감지할 기능이 있습니다. 따라서 이 프로그램은 3초의 오디오 조각을 처리한 후 특정한 사람을 모방할 수 있습니다.
공식 웹사이트에는 인공지능 작업의 예가 있습니다. 녹음을 듣고 기존의 음성 합성기와 비교하는 것이 가능합니다. 게다가, 온라인 데이터베이스에는 다양한 감정적 색상의 샘플이 포함되어 있습니다. 인공지능은 기쁨, 분노, 혐오 등으로 같은 문구를 모방할 수 있습니다.
테스트 기간
Stable Diffusion과 달리 VALL E 알고리즘의 소스 코드는 아직 공유되지 않았다는 점에 유의해야 합니다. 그러므로 맞춤 오디오 파일을 기반으로 음성을 생성할 수 없습니다. 신경망의 폐쇄성은 소프트웨어가 악의적인 목적으로 사용될 수 있다는 우려와 관련이 있습니다.
특징
- 앱은 무료로 다운을 받아 사용할 수 있습니다;
- 실제 사람들의 음성 패턴에 학습된 신경망 모델로 작동합니다;
- 음색과 감성적인 음조 변경이 가능합니다;
- 소스 코드는 다양한 안전 문제로 인해 아직 공유되지 않았습니다;
- 모든 최신 윈도우 버전과 호환됩니다.