Polska stworzyła serię modeli sztucznej inteligencji (AI) znanych jako PLLuM (Polish Large Language Model), które umożliwiają przetwarzanie i generowanie tekstu w języku polskim, jak donosi Ministerstwo Cyfryzacji. Model będzie dostępny dla wszystkich, a jego integracja z administracją ma kosztować państwo 19 mln zł.
/ 123RF/PICSEL
Ministerstwo wyjaśniło, że modele, zaprojektowane przez polskich specjalistów z dziedziny IT i lingwistyki, mają na celu rozwijanie umiejętności cyfrowych i wspieranie innowacji w administracji publicznej i sektorze biznesowym. „Tworzymy podwaliny pod inteligentne usługi publiczne i innowacje, które będą naprawdę pomocne zarówno dla administracji, jak i biznesu” – stwierdziło Ministerstwo Cyfryzacji.
70 miliardów parametrów
Model języka został stworzony przez grupę ponad 50 ekspertów. PLLuM wykorzystuje od 8 do 70 miliardów parametrów, co pozwala mu generować treści w języku polskim z dużą dokładnością. Wykorzystuje organiczne dane, które zostały opracowane ręcznie, a nie oparte na innych modelach językowych. „Wyszkolony na zasobach języka polskiego, skutecznie radzi sobie ze złożonością fleksji i zawiłą składnią, produkując precyzyjne treści”, jak zauważono w komunikacie.
Reklama
Rodzina modeli PLLuM obejmuje między innymi model oparty na strukturze MoE (Mixture of Experts), charakteryzujący się dobrze wyważonym doborem ekspertów. Ponadto posiada specjalistyczny model RAG (Retrieval Augmented Generation), który oferuje możliwości wyszukiwania informacji. „PLLuM pokazuje, że możemy tworzyć nowoczesne technologie na własnych warunkach, w naszym języku, dla dobra naszych obywateli” – zauważył wicepremier i minister cyfryzacji Krzysztof Gawkowski, cytowany w komunikacie.
Litera prawa i etyki
PLLuM opiera się na etycznym pozyskiwaniu danych. Wersje komercyjne wykorzystują wyłącznie treści od właścicieli, którzy udzielili licencji konsorcjum. Ponieważ zasoby te są zgodne z ustawą o prawach autorskich i prawach pokrewnych oraz przepisami UE, można je wykorzystać do zbudowania w pełni otwartego modelu. Modele naukowe, udostępniane na licencjach, które zabraniają komercyjnego wykorzystania, opierają się na publicznie dostępnych zestawach danych, takich jak te z organizacji non-profit Common Crawl.
Koszt projektu wyniósł 14,5 mln zł. Dodatkowe 19 mln zł zostanie przeznaczone na wdrożenie modelu w administracji publicznej i wspieranie współpracy z nowymi partnerami, do których należą Centralne Centrum Informatyczne (COI) oraz Cyfronet – ośrodek obliczeń o wysokiej wydajności. „Rozwój PLLuM to inwestycja w cyfrowe państwo” – stwierdził wiceminister cyfryzacji Dariusz Standerski.
Inicjatywa ta jest realizowana na wniosek Ministerstwa Cyfryzacji, które jest właścicielem wyników i nadzoruje rozwój PLLuM. Lider konsorcjum, Centrum Badań nad Bezpieczeństwem SI w NASK, będzie zarządzać integracją PLLuM z usługami administracji publicznej. W skład konsorcjum wchodzą również Politechnika Wrocławska, Instytut Informatyki Polskiej Akademii Nauk, Instytut Slawistyki Polskiej Akademii Nauk, Centrum Przetwarzania Informacji OPI-PIB i Uniwersytet Łódzki.
Odtwarzacz wideo wymaga włączonej obsługi JavaScript w przeglądarce. Wydarzenia 24