Bielik, polski model AI wchodzi do biznesu
Model Bielik to tworzony w Polsce na polskich treściach model sztucznej inteligencji na licencji open-soruce. Korzystanie z niego jest darmowe, a możliwości ograniczone tylko wyobraźnią i dostępem do danych.
Generatywna sztuczna inteligencja, której popularność zapoczątkował ChatGPT pod koniec 2022 roku, jest używana w coraz większej liczbie zastosowań. To już nie tylko czatboty odpowiadające z mniejszą lub większą skutecznością na pytania i prowadzące rozmowy To już konkretne rozwiązania, które znajdują zastosowanie w biznesie, a także wchodzą do przemysłu i produkcji.
Duże modele językowe oraz modele multimodalne, czyli takie, które mogą przetwarzać także obrazy i dźwięki, znajdują komercyjne zastosowania przede wszystkim w automatyzacji procesów i wspieraniu pracowników w ich zadaniach. To na przykład wewnętrzni asystenci w firmach, którzy pomagaj w pracy z dokumentami, obsługa klienta i helpdesk czy tworzenie treści marketingowych.
Bielik, open-source’owy model tworzony na języku polskim
Choć uwaga świata skupia się na największych graczach z branży AI, takich jak OpenAI, Google czy Microsoft, to popularność zdobywają tzw. małe lub średnie modele językowe. To prostsze i mniej zdolne wersje modeli AI, które pomimo tego mają nad nimi kilka przewag. Takim modelem jest między innymi Bielik tworzony przez Fundację Spichlerz/SpeakLeash.
Bielik to rodzina małych i średnich modeli językowych. Największy z nich, Bielik-11B-v2.3, ma 11 mld parametrów. Dla porównania szacuje się, że GPT-4o ma kilkaset miliardów parametrów (OpenAI nie ujawnia tej liczby). Dzięki kompaktowemu rozmiarowi Bielik nie wymaga potężnych centrów obliczeniowych do działania, a w zależności od wersji model można uruchomić na domowym komputerze lub laptopie. To znacznie ogranicza koszty wdrożenia AI w firmie.
Dzięki możliwości uruchomienia modelu lokalnie znika także obawa o prywatność danych. Te nie są bowiem wysyłane na zewnętrzne serwery znajdujące się często w innym kraju, a są przetwarzane lokalnie. Odpadają także koszty związane z dostępem do modeli komercyjnych. Używanie Bielika kosztuje tyle, ile prąd potrzebny do zasilania sprzętu, na którym działa.
Bielik tworzony jest z nastawieniem na znajomość języka polskiego i polskiej kultury. Dzięki temu radzi sobie dużo lepiej z naszym językiem lepiej niż porównywalne, zagraniczne modele. Lepiej rozumie polski kontekst i mowę.
Bielik już pracuje
Jednak jednym z największych atutów Bielika jest społeczność działając w ramach Fundacji SpeakLeash. To grupa pasjonatów, którzy ciągle usprawniają model, tworzą nowe narzędzia i aplikacje, zbierają dane i prowadzą wdrożenia modelu. Dzięki temu Bielik już “pracuje”. Oto kilka przykładów.
Model działa w ramach systemu “Proste Pismo” do tworzenia czytelnych i łatwo zrozumiałych pism na podstawie dokumentów urzędowych. System jest rozwijany przez Poznańskie Centrum Superkomputerowo-Sieciowe, które jest partnerem polskiego rządu w czasie prezydencji Polski w Unii Europejskiej. Można więc powiedzieć, że Bielik pracuje już w Brukseli.
Bielik działa też w GaiusLex. To inteligentny asystent, który pomaga w zadaniach z zakresu prawa. Szybko i przystępnie dostarcza informacji o przepisach, sprawach i opiniach.
Z kolei w narzędziu Azurro Matena Analyzer Bielik służy do opisywania materiałów wideo na podstawie ich treści. Dodaje tagi, które ułatwiają wyszukiwanie konkretnych osób, scen i obiektów, a także tworzy opisy, które pozwalają łatwo zorientować się w treści materiału, bez konieczności jego oglądania.
Potencjalne zastosowania
Powyższe to tylko kilka rzeczywistych przykładów wykorzystania Bielika w zastosowaniach biznesowych. Lista nie jest jednak zamknięta i w najbliższym czasie będziemy widzieć nowe pomysły wykorzystania małych i średnich modeli językowych działających lokalnie do wsparcia biznesu i usług. Poniżej kilka pomysłów, które już teraz znajdują się w różnych etapach wcielania w życie.
Pomocnik lekarza w zbieraniu wywiadu medycznego i w wypełnianiu dokumentacji medycznej.
Narzędzie do automatycznego generowania opisów produktów na strony sklepów internetowych na podstawie opisu technicznego. Takie narzędzie mogłoby być dodatkowo połączone z systemem do zarządzania stanem magazynowym, aby jeszcze dalej zautomatyzować proces.
Asystent do pomocy lub samodzielnego tworzenia materiałów marketingowych.
Automat do przetwarzania i strukturyzowania różnorodnych danych, np. informacji od kierowców firm logistycznych przesyłanych SMS-ami, w celu zautomatyzowania systemu śledzenia tras.
“Wyszukiwarka” i pomocnik pracujący z dużymi zasobami dokumentów firmowych, instrukcji, faktur, itp. Dzięki umieszczeniu takiego inteligentnego pomocnika w infrastrukturze firmy nie grozi wyciek danych i informacji.
Asystent managera lub kierownika w tworzeniu planów pracy, a następnie w monitorowaniu ich postępów.
Ograniczeniem jest wyobraźnia i dostęp do danych
Obecnie znajdujemy się na samym progu zmian, jakie przyniesie sztuczna inteligencja. Ograniczeniem w jej zastosowaniach są dziś wyobraźnia i dostęp do danych. Z tych dwóch rzeczy ważniejsza jest ta druga, bo to na danych tworzone są modele sztucznej inteligencji i rozwiązania, które ją wykorzystują.
Do stworzenia Bielika zebrano 40 mln dokumentów tekstowych w języku polskim. O ile do wykorzystania modelu w biznesie nie potrzeba aż tyle, to im większa ilość danych i im lepszej są jakości, tym ciekawsze i bardziej nowatorskie zadania można powierzyć modelowi.
Jeśli więc twoja firma zbiera i przechowuje dane, które mogły wydawać się po pewnym czasie bezużyteczne, to teraz może się okazać, że siedzi na żyle złota, która tylko czeka na odkopanie. A pomóc może w tym Bielik i eksperci ze Spichlerza.