MC: Więcej, szybciej, po polsku. Rodzina modeli PLLuM się powiększa (komunikat)

- Ministerstwo Cyfryzacji informuje: Więcej, szybciej, po polsku. Rodzina modeli PLLuM się powiększa

Udostępniamy 11 nowych modeli PLLuM - polskich, otwartych modeli językowych zaprojektowanych z myślą o administracji publicznej, biznesie i użytkownikach indywidualnych. Modele rozumieją język urzędowy, obsługują ponad 20 gatunków tekstów administracyjnych i działają na otwartych licencjach zgodnych z wymogami AI Act. To największa porcja modeli PLLuM uwolniona na w pełni otwartych licencjach.

– PLLuM odnajduje się w polskim kontekście prawnym i kulturowym, precyzyjniej niż modele zagraniczne. Jest otwarty i dostępny dla wszystkich. Już dzisiaj znajduje zastosowanie w sprawa urzędowych, rozmowach w mObywatelu, a także w wielu firmach i jednostkach badawczych. Dzisiaj rozwijamy rodzinę modeli, za co dziękuję całemu konsorcjum HIVE – powiedział wiceminister cyfryzacji Dariusz Standerski.

Co wyróżnia nowe modele PLLuM?

1. Lepsza znajomość języka polskiego – zarówno w codziennej, jak i urzędowej formie, wraz z polskim kontekstem kulturowym, historycznym i prawnym.

2. Lepsze przystosowanie do pracy w administracji publicznej. Modele potrafią m.in.:

• generować teksty w ponad 20 gatunkach urzędowych,

• wspierać zadania biurowe i operacyjne,

• rozumieć kontekst procedur administracyjnych,

• upraszczać język urzędowy,

• pracować na wzorach dokumentów prawnych.

3. Lepsze działanie w systemach opartych na RAG.

4. Bezpieczniejsze odpowiedzi – na podstawie analizy rzeczywistych interakcji użytkowników w PLLuM Chat.

– Chcemy, żeby PLLuM był coraz lepszy i znajdował zastosowanie w kolejnych miejscach. Zbudowaliśmy nie tylko modele językowe, ale i unikalne kompetencje w polskim ekosystemie AI – mówi dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK Szymon Łukasik.

Cztery kategorie wagowe

Nowa rodzina PLLuM obejmuje cztery rozmiary modeli, dopasowane do różnych potrzeb i możliwości technicznych:

4B – najmniejszy i najszybszy, działa nawet przy ograniczonej mocy obliczeniowej, najlepiej sprawdza się po dostosowaniu do konkretnego zadania.

8B i 12B – dobry kompromis między szybkością a jakością, polecane do wdrożeń produkcyjnych, np. jako silnik w systemach RAG.

70B – największy model, najlepiej radzi sobie ze złożonymi zadaniami, bez konieczności dodatkowego dostosowania.

Modele 4B, 8B i 12B dostępne są w trzech wariantach: bazowym (do eksperymentów i dostrajania), instrukcyjnym (do konkretnych zadań) i dialogowym (z zabezpieczeniami przed szkodliwymi treściami).

Model 70B dostępny jest w wariantach instrukcyjnym i dialogowym.

Wszystkie modele opublikowano na otwartych licencjach z pełną dokumentacją zgodną z AI Act – obejmuje ona opis modeli, źródła danych oraz metody treningu i oceny jakości.

Jak trenowano modele:

Modele powstały w ramach projektu HIVE AI, zrealizowanego w 2025 roku przez konsorcjum pod kierownictwem NASK, z udziałem ACK Cyfronet AGH, Instytutu Podstaw Informatyki PAN, OPI PIB, Instytutu Slawistyki PAN, Uniwersytetu Łódzkiego i Politechniki Wrocławskiej.

Zbiór danych treningowych objął około 7 milionów tekstów w języku polskim – wyselekcjonowanych pod kątem jakości, legalności i transparentności źródeł. Dane pochodziły z umów licencyjnych, domeny publicznej (m.in. Monitor Polski, Dziennik Ustaw, stenogramy parlamentarne) oraz zasobów na licencjach Creative Commons.

Pretrening zaprojektowano w paradygmacie curriculum learning – model uczył się stopniowo, przechodząc od danych prostszych do bardziej złożonych. Na potrzeby dostrajania opracowano ok. 17,5 tys. nowych instrukcji organicznych, w tym ponad 6 tys. dialogów wieloturowych. Łącznie, wraz z danymi z projektu PLLuM z 2024 roku, wykorzystano ok. 80 tys. ręcznie tworzonych instrukcji.

Więcej informacji na stronie: https://pllum.org.pl/.

UWAGA: komunikaty publikowane są w serwisie PAP bez wprowadzania przez PAP SA jakichkolwiek zmian w ich treści, w formie dostarczonej przez nadawcę. Nadawca komunikatu ponosi odpowiedzialność za jego treść – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe.(PAP)

kom/ wms/ dafa/

Pobierz tekst

bezpośredni link do materiału

Data publikacji	21.05.2026, 13:10
Źródło informacji	MC
Zastrzeżenie	Za materiał opublikowany w serwisie PAP MediaRoom odpowiedzialność ponosi – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe – jego nadawca, wskazany każdorazowo jako „źródło informacji”. Informacje podpisane źródłem „PAP MediaRoom” są opracowywane przez dziennikarzy PAP we współpracy z firmami lub instytucjami – w ramach umów na obsługę medialną. Wszystkie materiały opublikowane w serwisie PAP MediaRoom mogą być bezpłatnie wykorzystywane przez media.

Polityka i społeczeństwo

MC: Więcej, szybciej, po polsku. Rodzina modeli PLLuM się powiększa (komunikat)

Pobierz materiał i Publikuj za darmo

Pobierz materiał i Publikuj za darmo

bezpośredni link do materiału

Newsletter

Najnowsze

Prawo.pl: nieoczywiste granice dopuszczalności w reklamach dla dzieci

George Sand (1804-1876). W kalejdoskopie życia i sztuki - wystawa czasowa

Rozporządzenie PPWR. Darmowy Generator deklaracji zgodności opakowań od RLG Polska

Mikropoświadczenia - nowa waluta umiejętności

Wajda Generation: Agnieszka Holland w The Academy Museum of Motion Pictures

MF: Plany wdrożenia kolejnych e-usług Krajowej Administracji Skarbowej (komunikat)

MRiRW: Rozmowy z Kazachstanem o handlu produktami rolno-spożywczymi i dostępie do rynku (komunikat)

MON: Wizyta wiceminister obrony M. Sobkowiak-Czarneckiej w USA (komunikat)

Skillcation. Co drugi Polak zapłaci więcej, by nauczyć się czegoś nowego

Accertify i Liminal publikują wyniki pierwszego empirycznego badania, które dowodzi skuteczności połączenia wysiłków w zakresie zwalczania oszustw i cyberbezpieczeństwa - i określa, jak tego właściwie dokonać

Kalendarium

Polecamy wideo

Raport PSEW: rocznie marnujemy 1,4 TWh energii z OZE, straty ograniczy połączenie energetyki z ciepłownictwem

Endokrynolog: otyłość jest chorobą, a nie defektem kosmetycznym

TGE, Enea Operator, Energa-Operator, PGE Dystrybucja uruchomią platformę usług elastyczności

Polecamy foto

Forum Ekonomiczne w Karpaczu - tylko do końca lipca niższe opłaty rejestracyjne

McDonald’s Polska: chcemy dbać o przyszłość zabytków

FEV collaborates with Microsoft on efficient AI model approach for in car applications built on NVIDIA

Z Parlamentu Europejskiego

PAP MediaRoom

Redakcja

Dział Handlowy

Dział Obsługi Medialnej