Wiele języków może zostać zmaginalizowanych przez AI. Konsekwencje mogą być dramatyczne
Michał Duszczyk
Większość stosowanych dziś generatywnych systemów AI opiera się o najbardziej popularne języki – zdecydowanie lepiej rozumieją więc kontekst mowy i niuanse takich języków jak angielski, czy chiński. A to – jak uważają założyciele start-upu Silo AI – zagrożenie dla „suwerenności językowej” w przypadku wielu mniej popularnych języków i dialektów.
Viking ochroni języki przed sztuczną inteligencją
Fińska firma, która reklamuje się jako największe na Starym Kontynencie prywatne laboratorium sztucznej inteligencji, chce stanąć w ich obronie, bo uważa, że liczne chatboty dyskryminują lokalną mowę. Spółka uruchamia więc projekt Viking, w ramach którego udostępni własny model – Nordic LLM, przeznaczony właśnie dla rodziny języków europejskich. Ów projekt, mający za zadanie chronić różnorodność językową, na razie skupi się na językach nordyckich, integrując ze swoim chatbotem: duński, fiński, islandzki, norweski oraz szwedzki. Peter Sarlin, współzałożyciel Silo AI, tłumaczy, że projekt Viking skupi się na uwzględnieniu niuansów tych języków, ale też odzwierciedleniu wartości i kultury nordyckiej. Wyzwanie jest dość trudne, bo wszystkie te języki charakteryzują tzw. niskie zasoby. To oznacza, że brakuje danych językowych potrzebnych do szkolenia wysokowydajnych LLM.
Według ekspertów to wielkie wyzwanie w świecie chatbotów. Rozwój technologii LLM zagraża bowiem przyszłości takich języków w świecie cyfrowym. W dalszej kolejności, brak prawidłowego tłumaczenia maszynowego może pozbawić lokalne społeczności do dostępu usług (np. spersonalizowanej opieki medycznej, czy nowoczesnej edukacji), a w efekcie prowadzić do wymierania takich języków. Silo AI ruszyło właśnie ze swoim przedsięwzięciem, by – w miarę jak sztuczna inteligencja rozprzestrzenia się, a różnorodność językowa i dziedzictwo kulturowe mogą zanikać – postawić tamę takim czarnym scenariuszom.
Jak chronić język polski
Silo AI podkreśla, iż Nordic LLM charakteryzuje się „niezrównaną biegłością” w językach nordyckich, ale przy tym nie zaniedbuje jęz. angielskiego. Testy mają wskazywać, iż wyniki w tym zakresie są porównywalne z innymi otwartymi modelami, jak Mistral, czy Llama (Meta).
Fiński start-up nie chce poprzestawać wyłącznie na językach nordyckich i już zapowiada, że rozszerzy projekt o inne języki urzędowe Unii Europejskiej, a więc także i polski. Ich integrację z własnych modelem zapowiada jeszcze na koniec br.