vall-e-neyroset-icon

VALL E

Mô hình trí tuệ nhân tạo này được phát triển bởi Microsoft. Với sự giúp đỡ của nó người dùng có thể tạo ra những đoạn đối thoại của con người vô cùng thực tế với đủ loại cung bậc cảm xúc.

Giới thiệu về VALL E

VALL E là dịch vụ trực tuyến trên Windows có chứa thuật toán AI phức tạp. Nó cho phép bạn tạo ra tiếng nói phỏng chế chất lượng cao. Mô hình được huấn luyện bằng các mẫu âm thoại từ hơn 7000 người nói tiếng Anh.

Tạo ra tiếng nói

Mạng lưới nhân tạo này sử dụng phương pháp tạo tiếng nói hoàn toàn khác biệt so với các chương trình truyền thống khác. Thuật toán có thể nhận ra những chi tiết tinh tế của tiếng nói như âm sắc và cảm xúc. Nhờ vào đó, dịch vụ có thể nhái theo giọng một người cụ thể sau khi xử lý chỉ một đoạn âm thanh dài 3 giây.

Có những mẫu ví dụ về sản phẩm của AI tại trang mạng chính thức. Người dùng có thể lắng nghe đoạn âm thanh và so sánh nó với các chương trình tạo giọng nói truyền thống. Ngoài ra, kho dữ liệu trực tuyến có chứa các mẫu ví dụ với đủ loại sắc thái cảm xúc. AI có thể nói ra cùng một câu nói với cảm xúc vui sướng, phẫn nộ, kinh tởm và nhiều cảm xúc khác.

Thời gian thử nghiệm

Một điều quan trọng cần lưu ý, khác với Stable Diffusion, mã nguồn gốc của thuật toán VALL E vẫn chưa được chia sẻ với công chúng. Vì lý do này, bạn không thể tạo ra tiếng nói dựa trên tập tin âm thanh tự chọn. Bản chất nhạy cảm của mạng lưới nhân tạo được gắn liền với mối lo ngại rằng dịch vụ có thể bị sử dụng vì những mục đích xấu xa.

Tính năng

  • miễn phí tải về và sử dụng;
  • cung cấp một mô hình mạng lưới nhân tạo được huấn luyện bằng các mẫu câu thoại của người thật;
  • cho phép bạn thay đổi âm sắc và cung bậc cảm xúc của giọng nói;
  • mã nguồn gốc vẫn chưa được chia sẻ cho công chúng vì lo ngại an ninh;
  • tương thích với tất cả các phiên bản Windows hiện đại.