Sztuczna inteligencja jest w stanie wygenerować głos każdej osoby na podstawie 15-sek. próbki
Urszula Lesman
OpenAI udostępniło próbki z wczesnych testów narzędzia o nazwie Voice Engine, które wykorzystuje 15-sekundową próbkę mówiącej osoby w celu wygenerowania wiernej repliki jej głosu. Firma twierdzi, że narzędzie do zamiany tekstu na głos wykorzystujące AI może pomóc w tłumaczeniu, pomaganiu dzieciom w czytaniu lub pomaganiu osobom, które utraciły zdolność mówienia. Niektórzy sceptycy obawiają się jednak, że może to również sprzyjać tworzeniu się dezinformacji lub ułatwiać popełnianie oszustw.
Jak wygenerować czyjś głos
Voice Engine jest obecnie używany tylko przez „małą grupę zaufanych partnerów”, w tym firmy z branży edukacyjnej i zajmującej się technologiami medycznymi, i na podstawie ich testów OpenAI określi, czy i w jaki sposób umożliwić jego szersze wykorzystanie. Według firmy testerzy zgodzili się nie odtwarzać głosów ludzi bez ich wyraźnej zgody i wyraźnie informować słuchaczy, że to, co słyszą, jest generowane przez sztuczną inteligencję. „Wiemy, że generowanie mowy przypominającej głosy ludzi wiąże się z poważnym ryzykiem, o którym szczególnie warto pamiętać w roku wyborczym” – stwierdziła firma OpenAI w poście na swoim blogu.
Voice Engine może wykorzystać próbkę głosu w jednym języku, aby utworzyć replikę głosu także w wielu innych językach. Firma zaprezentowała na blogu materiał przedstawiający człowieka czytającego fragment o przyjaźni, a także dźwięk wygenerowany przez sztuczną inteligencję, który brzmi tak, jakby ta sama osoba czytała ten sam fragment w języku hiszpańskim, mandaryńskim, niemieckim, francuskim i japońskim. W każdej z próbek wygenerowanych przez sztuczną inteligencję zostaje zachowany ton i akcent oryginalnego mówcy.
Wkrótce pojawi się Sora
Voice Engine pojawia się w czasie, gdy użytkownicy czekają na publiczne wydanie Sora, narzędzia wideo generowanego przez sztuczną inteligencję, które OpenAI zapowiadało w zeszłym miesiącu. Sora może tworzyć realistycznie wyglądające 60-sekundowe filmy na podstawie instrukcji tekstowych, z możliwością wyświetlania scen z wieloma postaciami, określonymi rodzajami ruchu i wyszukanymi szczegółami tła. ChatGPT OpenAI może również generować obrazy z podpowiedzi tekstowej.
Czytaj więcej
Technologie Przełomowe narzędzie sztucznej inteligencji od OpenAI. Opisz, a Sora zrobi film
Firma OpenAI, twórca ChatGPT, stworzyła nowy model Sora, który pozwala tworzyć realistyczne wideo poprzez proste wpisanie opisowego zdania, co ma się w nagraniu znaleźć. W ten sposób narzędzia AI wchodzą na nowy poziom i budzą coraz większe obawy.