Imran Khan jeszcze jako premier Pakistanu. Obecnie przebywa w więzieniu, ale uczestniczy w kampanii wyborczej
Michał Duszczyk
Khan nie mógłby bowiem sam nagrać klipu, więc wykorzystano jego przetworzony przez sztuczną inteligencję głos, by odczytywała zapisane przez polityka notatki. Za granicą już jest głośno o kolejnym kontrowersyjnym sposobie na wykorzystanie AI. Z polskiego punktu widzenia to tym bardziej ciekawa informacja, gdyż za nowatorską technologią stoi rodzimy start-up – ElevenLabs.
Polska AI spreparowała głos Imrana Khana
Khan został skazany za „zaangażowanie w działalność korupcyjną”. Ukrywał on bowiem dochody ze sprzedanych prezentów państwowych otrzymanych w czasie, gdy pełnił funkcję szefa rządu w latach 2018–2022. Chodziło o podarki w postaci biżuterii czy pozłacanego kałasznikowa. Mimo tego były pakistański premier nie zamierza wycofywać się z życia publicznego. A pomaga mu w tym polska sztuczna inteligencja. Współpracownicy Khana przy jej pomocy opracowali czterominutowy klip – w filmie, który został wyemitowany podczas „wirtualnego wiecu” w Pakistanie, słychać dubbing. To właśnie głos AI imitujący Imrana Khana. Na swoim kanale w X opublikował go Jibran Ilyas, odpowiedzialny za media społecznościowe partii Khana (znanej jako PTI).
Sprawę opisuje „The Guardian”, który wskazuje, że głos powstał dzięki ElvenLabs – bot polskiego start-upu przerobił zapiski byłego premiera na dźwięk w taki sposób, że ciężko słuchaczom zorientować się, że nie mają do czynienia z oryginałem. Wątpliwości rozwiał jednak napis pod materiałem, który wyjaśnia, że mamy do czynienia z generatorem mowy AI.
Jak informuje serwis The Verge, aby uniemożliwić społeczeństwu oglądanie materiałów Khana rząd Pakistanu zamknął dostęp do Facebooka, Instagrama, X i YouTube. Mimo tego „wirtualny wiec” zgromadził ponad 500 tys. wyświetleń w serwisie YouTube, a tysiące osób transmitowało go także na innych platformach mediów społecznościowych.
Start-up ElevenLabs ważnym graczem w AI
ElevenLabs wyrobił sobie już globalną markę – dzięki jego technologii generowania mowy za pomocą sztucznej inteligencji, można tworzyć dubbing do filmów, asystentów głosowych i awatary, czy tzw. nagrania deepfake. Za pomocą sztucznej inteligencji polskiej firmy można sklonować bowiem dowolny głos i sprawić, że przemówi w różnych językach i wypowie dowolne kwestie. Ów przełomowy projekt stworzyli Piotr Dąbkowski, absolwent uniwersytetów Oxford i Cambridge, a także Mateusz Staniszewski, który ukończył wydział matematyki w Imperial College London.
Niedawno w ten najbardziej rozpoznawalny polski startup w branży sztucznej inteligencji zainwestowali giganci z Doliny Krzemowej. Do spółki, która swoją platformę uruchomiła ledwie w styczniu br., popłynęło 19 mln dol. Finansowanie w rundzie A zapewnili m.in. Nat Friedman (były szef GitHuba, obecnie doradca w Midjourney), Daniel Gross (twórca firmy Cue, którą dekadę temu przejął Apple) oraz Andreessen Horowitz, założyciel jednego z największych funduszy VC (jednocześnie zapewnił on sobie miejsce w zarządzie spółki). Wśród aniołów biznesu, którzy wsparli ElevenLabs są także np. współtwórca Instagrama Mike Krieger, jeden z założyciel Oculus VR Brendan Iribe, a także Mustafa Suleyman, guru branży AI i współzałożyciel Deepmind (startup przejęty przez Google). Do rundy dołączył ponadto np. Storytel (szwedzka platforma strumieniowania audiobooków).