vall-e-neyroset-icon

VALL E

Ten model sztucznej inteligencji został stworzony przez firmę Microsoft. Dzięki pomocy tej AI użytkownicy mogą generować realistyczną ludzką mowę z różnym zabarwieniem emocjonalnym.

O programie VALL E

VALL E to internetowa usługa Windowsa, która posiada złożone algorytmy sztucznej inteligencji. Umożliwia tworzenie wysokiej jakości imitacji głosu. Model uczył się na próbkach mowy od ponad 7000 anglojęzycznych osób.

Generowanie głosu

Ta sieć neuronowa korzysta z zupełnie innej metody syntezy mowy w porównaniu z dotychczasowymi programami. Algorytm może zauważyć subtelne cechy głosu, takie jak barwa i emocje. Usługa dzięki temu może naśladować konkretną osobę po przetworzeniu zaledwie trzysekundowego fragmentu audio.

Na oficjalnej stronie internetowej dostępne są przykłady pracy AI. Użytkownicy mają możliwość odsłuchiwania fragmentów audio i porównania ich z tradycyjnymi syntezatorami mowy. Dodatkowo internetowa baza danych posiada próbki o różnym zabarwieniu emocjonalnym. Sztuczna inteligencja umie powiedzieć to samo zdanie z radością, złością, obrzydzeniem i tak dalej.

Okres testowy

Należy zwrócić uwagę na to, że w przeciwieństwie do Stable Diffusion, kod źródłowy algorytmu VALL E nie został udostępniony publicznie. W związku z tym nie można wygenerować głosu na podstawie niestandardowego pliku audio. Zamknięty charakter sieci neuronowej wynika z obaw o to, że usługa może zostać wykorzystana do nieetycznych celów.

Zawartość

  • aplikacja jest w pełni darmowa;
  • oferuje model sieci neuronowej wytrenowany na podstawie wzorców mowy prawdziwych ludzi;
  • umożliwia zmianę barwy i ton emocji głosu;
  • kod źródłowy nie jest jeszcze publiczny z powodu obaw dotyczących bezpieczeństwa;
  • kompatybilna z każdą współczesną wersją systemu Windows.