Magdalena Tokaj, Kornblit & Partners: OpenAI ma ChatGPT, Google ma Gemini. Czym Bielik różni się od innych modeli językowych?
Sebastian Kondracki, współtwórca Bielik.AI, założyciel SpeakLeash: GPT czy Gemini to duże modele językowe. Mają więcej parametrów, co zazwyczaj przekłada się na ich sprawność lub moc. Bielika pozycjonujemy w klasie modeli kompaktowych.
Z reguły im więcej parametrów, tym lepiej, ale w życiu nie zawsze tak bywa.
Można to porównać do motoryzacji. Kiedyś amerykańskie samochody miały silniki po pięć litrów pojemności. Były ogromne, ale paliły bardzo dużo. Teraz małe samochody potrafią mieć taką samą moc, spalając znacznie mniej, a elektryki całkowicie już ten układ zaburzyły. Podobnie jest z mniejszymi modelami. Model kompaktowy jest zoptymalizowany pod kątem uruchomienia na własnym serwerze lub na komputerze osobistym.
Magdalena Tokaj: Własny serwer daje większe bezpieczeństwo dla wrażliwych informacji.
Sebastian Kondracki: I to jest pierwsza kluczowa różnica między Bielikiem a modelami od OpenAI, Google czy Anthropic. Bielika da się uruchomić lokalnie, a tamtych modeli nie. Dlatego można bezpiecznie analizować wrażliwe dane. Jeśli chcemy przetworzyć badania medyczne, tajemnicę adwokacką czy bankową, w przypadku globalnych dostawców musimy wysłać te dane na ich serwery. W niektórych branżach jest to zabronione przez regulacje prawne lub izby zawodowe, np. lekarskie.
Druga cecha Bielika to fakt, że jest on modelem otwartowagowym. Nasze wagi są otwarte, co oznacza, że można je modyfikować. Twórcy dużych rozwiązań zamykają do nich dostęp. Nie można ich pobrać, działają wyłącznie przez API. Obrazowo – dostajesz Bielika wyposażonego w wiedzą ogólną, a w firmie samodzielnie go możesz dostroić pod konkretną specjalizację.
Magdalena Tokaj: Czyli umożliwia budowanie przewagi konkurencyjnej dzięki specjalizacji.
Sebastian Kondracki: Tak, bo jeśli w przyszłości wszyscy prawnicy czy lekarze będą korzystać z tego samego ChataGPT to gdzie podzieje się ich przewaga? Przecież każdy może wykupić dokładnie taki sam dostęp. W przypadku Bielika firmy, które posiadają własną tożsamość biznesową i kulturę, mogą douczyć model na własnych zasobach. Taki model staje się ich wyłączną własnością i buduje ich unikalną pozycję na rynku.
Trzecia ważna rzecz to koszty. Teoretycznie możemy rozwozić pizzę flotą Audi Q7. Ktoś jednak musi zapłacić ratę leasingową. Jeśli przerzucimy koszty na klienta, nasza pizza będzie najdroższa w Warszawie. A jeśli weźmiemy je na siebie to firma zbankrutuje. Bielik to Peugeot 206 – dowiezie pizzę sprawnie i tanio.
Możemy rozwozić pizzę flotą Audi Q7. Jeśli przerzucimy koszty leasingu na klienta, nasza pizza będzie najdroższa w Warszawie. Jeśli weźmiemy je na siebie to firma zbankrutuje. Bielik to Peugeot 206 – dowiezie pizzę sprawnie i tanio.
Podobnie jest z dużymi modelami językowymi. Jeśli model potrafi pisać po starofrancusku, to cząstka tego kosztu jest ukryta w cenie, nawet gdy rozmawiamy z nim tylko po polsku. Giganci pokroju OpenAI czy Anthropic mocno dopłacają do tego interesu, by przyzwyczaić nas do swoich usług. Kiedy wszyscy zaczną z nich korzystać, ceny wzrosną i pojawi się problem.
W 90% przypadków wszechwiedza nie jest nam potrzebna, a dzięki temu model może być lżejszy i tańszy. Model kompaktowy – tak jak kompaktowy samochód – nie ma przyspieszenia Ferrari ani napędu 4×4, więc wiosną do lasu lepiej nim nie wjeżdżać. Za to na mieście, do dojazdów do pracy czy podrzucania dzieci jest idealny. Taki właśnie jest Bielik. W zadaniach biurowych, w języku polskim bije na głowę większe rozwiązania, bo jest w tym wyspecjalizowany.
Magdalena Tokaj: Bielik w wersji europejskiej obsługuje teraz ponad 30 języków. Czyli istnieje uniwersalna podstawa, na której model jest później dotrenowywany? Jak rozwiązujecie problem pozyskania danych, czy praw autorskich do utworów, które nie są domeną publiczną?
Sebastian Kondracki: Gdy zaczynaliśmy pracę od języka polskiego, kluczowym wyzwaniem okazał się właśnie brak danych potrzebnych do trenowania modeli. Polska, jak i cała Europa, ma ich stosunkowo niewiele, a dodatkowo musimy przestrzegać restrykcyjnych regulacji. Nie możemy po prostu pobrać wszystkiego z YouTube’a, wytrenować na tym modelu i twierdzić, że skoro platforma jest publiczna, to te materiały są niczyje. Od sierpnia obowiązuje nas unijny AI Act. Musimy precyzyjnie wykazać, na jakich danych trenowaliśmy i czy posiadamy do nich odpowiednie licencje.
„Czystych” jakościowych danych z licencjami nie ma na rynku zbyt wiele, dlatego nauczyliśmy się niezwykle mocno o nie dbać. Po pierwsze, bardzo dokładnie je klasyfikujemy. W przypadku małego modelu nie możemy przesadzić z jednym typem danych, na przykład prawniczymi. Gdybyśmy dali mu wyłącznie teksty prawne, model zacząłby mówić jak prawnik i przemycałby ten żargon nawet wtedy, gdybyśmy poprosili go o wygenerowanie bajki dla dzieci. Podobnie stałoby się, gdybyśmy przesadzili z wiedzą medyczną lub językiem potocznym. Musimy odpowiednio zbalansować te proporcje, aby model otrzymał wiedzę, nazwijmy ją – ogólnokształcącą.
Po drugie, dokładnie oczyszczamy dane i podnosimy ich jakość. Ponieważ często nie ma zakazu trenowania na otwartych forach internetowych, bierzemy taką dyskusję użytkowników, wyciągamy z niej samą esencję merytoryczną i tworzymy z tego poprawny językowo tekst. Jeśli jest ona opisana językiem bardzo potocznym, wulgarnym lub z błędami ortograficznymi, potrafimy to naprawić. Jeżeli zauważymy, że w Bieliku brakuje jakiejś dziedziny, np. motoryzacji, zwracamy się do hobbystów lub studentów z prośbą o pomoc w wygenerowaniu odpowiednich danych.
Widać też ogromne różnice regionalne w dostępie do danych. W Polsce mamy stosunkowo dobrą sytuację z danymi prawnymi. Sejm udostępnia akty prawne przez API, orzecznictwo sądów powszechnych jest zanonimizowane i dostępne, podobnie jak interpretacje podatkowe. Dla odmiany z danymi medycznymi jest dramatycznie. Nie mówię tu o dokumentacji pacjentów, ale o publikacjach i odkryciach naukowych.
Gdybyśmy chcieli stworzyć medyczną wersję Bielika do ćwiczeń dla studentów medycyny, to nie jesteśmy w stanie tego zrobić, bo w Polsce otwarta baza danych edukacyjno-medycznych wynosi blisko zera. Nie mamy na czym uczyć modeli. Mój syn studiuje medycynę i musi płacić ogromne pieniądze za dostęp do tych materiałów. Dla porównania: Stany Zjednoczone mają publiczną instytucję PubMed, która gromadzi artykuły i wiedzę m.in. o nowościach farmaceutycznych i medycznych. W Polsce takiego odpowiednika nie ma. Mimo to w obszarze medycznym Bielik i tak jest obecnie najlepszym modelem kompaktowym spośród wszystkich dostępnych na rynku polskim.
Wracając do języków: reguły przetwarzania danych, który wypracowaliśmy dla języka polskiego z racji ich niedoboru, postanowiliśmy sprawdzić na innych rynkach. Przyniosły świetne rezultaty. Obecnie szykujemy wersję wspierającą ponad 50 języków, w tym chiński i arabski, opierając się dokładnie na tej samej metodologii zarządzania danymi.
Globalni gracze przypominają amerykańskie koncerny samochodowe z XX wieku. Krążowniki szos były ogromne bo paliwo było tanie. OpenAI czy Anthropic dysponują ogromnymi zbiorami danych i działają w innych realiach prawnych, korzystając z zasady fair use. My musimy działać inaczej.
Stąd biorą się czasem nieporozumienia, gdy ktoś testuje Bielika i sprawdza, czy model cytuje z pamięci Pana Tadeusza. My uczymy Bielika interpretować wiersze, a nie wkuwać je na pamięć.
Magdalena Tokaj: Bielika w szkole sprawdziłby się jako asystent ucznia? W takim trybie sokratejskim – zamiast podawać odpowiedzi uczyłby samodzielnego myślenia?
Sebastian Kondracki: Oczywiście, taki model mógłby pomóc w szkole. Jeśli uczeń chce poznać treść utworu, prostszym i tańszym rozwiązaniem jest pójście do biblioteki. Bielik potrafi natomiast pomóc w analizie. Uczeń może wkleić fragment i napisać: „To jest wiersz Mickiewicza, interesuje mnie ten konkretny wers, pomóż mi go zinterpretować i pokaż strategię takiej analizy”. Z tym model poradzi sobie świetnie.
To jest kluczowa różnica, której ludzie spoza branży AI często nie rozumieją: Bielik to silnik. Musimy go odpowiednio obudować, by robił fantastyczne rzeczy. ChatGPT to już gotowy samochód, ale sam GPT to „tylko” silnik.
Bielik to silnik. Jeśli jednak włożę silnik Peugeota do lekkiej motorówki, mogę osiągnąć lepsze wyniki na wodzie niż Ferrari na drodze. Musimy go odpowiednio obudować, by robił fantastyczne rzeczy.
Porównywanie całego ChatGPT bezpośrednio do Bielika jest jak porównywanie Ferrari do silnika z Peugeota 206. To bezcelowe. Jeśli jednak włożę silnik Peugeota do lekkiej motorówki, mogę osiągnąć lepsze wyniki na wodzie niż Ferrari na drodze. Wszystko zależy od zastosowania i obudowania technologii.
Paulina Król – Książka, Kornblit & Partners: Zastanawiałam się, co tak naprawdę blokuje firmy przed wdrażaniem takiego rozwiązania. Czy barierą nie są właśnie ta wiedza i zasoby, których potrzebują po swojej stronie, aby odpowiednio obudować Bielika?
Sebastian Kondracki: Kiedyś krzywa technologiczna była prosta. Jedno narzędzie, na przykład taki Word, przydawał się w skrajnie różnych obszarach i łatwo mogliśmy przewidzieć korzyści biznesowe.
W przypadku AI ta krzywa jest postrzępiona. Oznacza to, że dwa zadania mogą wydawać się bliźniaczo podobne, a sztuczna inteligencja paradoksalnie wyłoży się na tym prostszym. Jeśli poprosimy Bielika lub ChatGPT o wygenerowanie opowiadania w stylu Prusa to efekt będzie fenomenalny. Jeśli zlecimy mu napisanie piosenki disco polo opartej na banalnych rymach, to sobie z tym nie poradzi. Jako technolog wiem, że wynika to ze specyfiki tokenizacji ze struktury podobnej do sylabicznej. Dla użytkownika jest to jednak niezrozumiałe: dlaczego algorytm radzi sobie z wybitną literaturą, a zawodzi przy prostej rymowance.
Jedynym sposobem na wdrożenie AI jest samodzielne sprawdzenie, w których procesach technologia realnie pomaga, a w których nie. Tego nie da się wyczytać z raportów konsultingowych.
Jedynym sposobem na wdrożenie AI jest samodzielne wyznaczenie granicy technologicznej we własnej firmie. Czy sprawdzenie, w których procesach technologia realnie pomaga, a w których nie. Tego nie da się wyczytać z raportów konsultingowych. Trzeba usiąść i wymyśleć to samodzielnie.
Tymczasem organizacje chcą natychmiastowego wykazania zysku z inwestycji w AI. Dodatkowo oczekują od AI stuprocentowej pewności. Kiedy jako kontrprzykład podaję technologię OCR, która opiera się na sztucznej inteligencji i ma skuteczność na poziomie np. 80%, to proponuję wtedy prosty test: dajmy te same dokumenty do ręcznego przepisania ludziom. Gwarantuję, że wskaźnik poprawności będzie znacznie niższy. A czas wykonania nieporównywalnie dłuższy.
Paulina Król – Książka: Czyli w polskich firmach brakuje kompetencji i otwartości na technologie?
Sebastian Kondracki: Jest też niska skłonność do ryzyka. Barierą jest też lęk pracowników przed zastępowalnością. To wywołuje naturalny autosabotaż wewnątrz organizacji. A ja pokazuję badania: zastąpienie człowieka botem w prostym procesie przynosi jedynie optymalizację kosztową i niewielki wzrost efektywności. Natomiast postawienie na inteligencję kolaboratywną, czyli współpracę człowieka z AI, potrafi podkręcić efektywność procesu aż siedmiokrotnie.
Magdalena Tokaj: Wyposażamy pracowników w „supermoce” bez eliminowania ich z procesu. Przestają wykonywać powtarzalne czynności manualne. Zostawiamy im zarządzanie?
Sebastian Kondracki: Zostawiamy człowiekowi to, w czym jest dobry. Realizowaliśmy taki projekt w jednym z banków, na bardzo trudnym odcinku, jakim jest obsługa reklamacji. Nie wstawiliśmy bota w miejsce pracownika. Zamiast tego usiedliśmy z zespołem i wspólnie zaprojektowaliśmy cały proces od nowa, wykorzystując potencjał sztucznej inteligencji jako asystenta. Efekt? Wskaźnik satysfakcji klientów gwałtownie wzrósł. W ten sposób zminimalizowaliśmy koszty, a zmaksymalizowaliśmy wartość biznesową: marżę i lojalność. Klienci przechodzący przez proces reklamacyjny zaczęli otwarcie polecać ten bank.
Paulina Król – Książka: Biznes to jedno, ale Bielik może też wspierać administrację publiczną. Wyobraźmy sobie taką sytuację: Bielik trafia do urzędu miasta i co dzieje się dalej? Podejrzewam, że urząd oczekiwałby podejścia: „pokażcie nam, co Bielik może nam dać i zróbcie to dla nas”. Ale to urząd powinien wyjść z inicjatywą i wiedzieć, czego chce. Czy jedną z blokad nie jest właśnie to, że podmioty oczekują gotowego narzędzia do wdrożenia?
Sebastian Kondracki: To bardzo dobry przykład. Wyjdźmy od realnych problemów i od tego zacznijmy. Uważam, że największym błędem polskich urzędów jest masowe rzucanie się na chatboty, czyli próby budowania systemów do bezpośredniej rozmowy z obywatelem. Nie jestem przekonany, czy obywatel chce rozmawiać z botem. Obywatel chce szybko załatwić swoją sprawę. Oczekuje na przykład szybkiej odpowiedzi na e-mail. Dlaczego urzędy nie potrafią tego wdrożyć? Ponieważ brakuje im prostej klasyfikacji korespondencji. Wiadomość trafia do kancelarii podawczej i utyka tam na dwa tygodnie.
Największym błędem polskich urzędów jest masowe rzucanie się na chatboty. Nie jestem przekonany, czy obywatel chce rozmawiać z botem. Obywatel chce szybko załatwić swoją sprawę. Oczekuje na przykład szybkiej odpowiedzi na e-mail.
Urzędy nie potrzebują dodatkowego kanału pogawędek, ponieważ i tak toną w dokumentacji. Zamiast chatbota, w pierwszej kolejności powinno się wdrożyć narzędzia do automatycznej strukturyzacji dokumentów. W przypadku skomplikowanej korespondencji, np. reklamacji, gdzie przygotowanie pisma zajmuje średnio 45 minut, taka oszczędność czasu przynosi ogromne korzyści.
Główną blokadą pozostaje jednak mentalność: wciąż wdrażamy sztuczną inteligencję dla efektu wizerunkowego i mody, podczas gdy podstawowe, codzienne zaległości w dokumentach rosną.
Magdalena Tokaj: Nawiązując do tematu odciążenia pracowników – czytaj obaw przed utratą pracy – jakie nowe role w urzędzie może wygenerować wdrożenie kolaboratywnej inteligencji?
Sebastian Kondracki: Z zawodu jestem programistą, a to profesja wymieniana w pierwszej trójce do zastąpienia przez AI. Ale programiści, którzy lubią kontakt z klientem i są interdyscyplinarni wygrają. Bot nie pójdzie na spotkanie biznesowe. Niedawno wieszczono narodziny zawodu prompt inżyniera, a tymczasem modele rozwijają się tak szybko, że rozmawiamy z nimi językiem naturalnym. Nie trzeba już specjalnie promptować, wystarczy po prostu rozmawiać.
Paulina Król – Książka: Wróćmy jeszcze do procesu uczenia Bielika. Czy w zespołach widać przewagę mężczyzn, czy te proporcje płci są wyrównane? Chodzi mi o to, aby Bielik w pewnym momencie nie stał się modelem o wyłącznie męskiej perspektywie.
Sebastian Kondracki: W projekcie nie stosujemy żadnych narzuconych odgórnie parytetów, ale struktura zespołów jest zróżnicowana. Pięcioosobowy zespół odpowiedzialny stricte za trenowanie modelu jest całkowicie męski. Z kolei zespół zajmujący się tworzeniem benchmarków, testów oraz zestawów danych ma przewagę kobiet. W obszarze wdrożeniowym i działaniach edukacyjnych kobiety też stanowią większość i ewidentnie to one są tam liderkami. Wśród samych założycieli Bielika także są kobiety, więc podział ten nie odbiega drastycznie od struktury płci w społeczeństwie.
Bielik jest oddolną inicjatywą opartą na dużej autonomii. Nie prowadzimy klasycznej rekrutacji. Więc jeśli w ogólnej strukturze Bielika widać przewagę mężczyzn, wynika to raczej ze społecznych błędów systemowych. Na przykład z faktu, że mężczyznom łatwiej jest wygospodarować czas na takie hobby, podczas gdy kobiety nadal są bardziej obciążone obowiązkami domowymi.
Paulina Król – Książka: A jeśli mowa o płci, to dochodzą nam jeszcze w Bieliku kwestie typu fleksyjność języka polskiego czy feminatywy…
Sebastian Kondracki: Testy przeprowadzone przez Aleksandrę Tomaszewską, obecnie dyrektorkę działu innowacji w Ministerstwie Cyfryzacji, wykazały, że większość modeli – w tym Bielik – oblewała testy językowe na rzadkich feminatywach, takich jak na przykład „pułkowniczka”. Bariera w nauce poprawnych form tkwi w samej dostępności materiałów źródłowych. Wynika to z prostego faktu: w polskim internecie i oficjalnych dokumentach ta forma niemal nie występuje. Nawet Wojsko Polskie najczęściej stosuje zwrot „pani pułkownik”. Z kolei w testach dotyczących opieki nad dziećmi modele automatycznie zamieniały formę męską na żeńską „opiekunka”, ponieważ internet jest nimi nasycony. Algorytmy po prostu odwzorowują statystykę.
Podobny problem z brakiem danych mamy na przykład z bazą tradycyjnych polskich potraw Ministerstwa Rolnictwa. Na 3,5 tysiąca przepisów zaledwie 10% posiada zdjęcia, przez co model multimodalny nie ma się na czym uczyć. Chcemy, aby ludzie przesyłali autentyczne materiały z domowych archiwów.
Dlatego ruszamy z inicjatywą „Obywatel Bielik”. Chcemy przekształcić ten projekt w ruch społeczny, w którym obywatele świadomie budują bazę wiedzy dla sztucznej inteligencji, bazując na własnych doświadczeniach, a nie na treściach z internetu. Oprócz bazy fotograficznej, zaczynamy również intensywne prace nad utrwalaniem polskich gwar.
Magdalena Tokaj: Dlaczego nasze dziedzictwo kulturowe ma takie znaczenie?
Sebastian Kondracki: Celem jest wyciągnięcie i wykorzystanie wiedzy, która naturalnie krąży między ludźmi i uratowanie modeli przed zasilaniem wyłącznie chaotycznymi treściami z sieci.
Paulina Król – Książka: Kto w takim otwartym projekcie decyduje o tym, co jest akceptowalne ,a co nie?
Sebastian Kondracki: Rozwijamy narzędzie pod nazwą Sójka, znane jako Bielik Guard. Jest to model dedykowany do wykrywania niebezpiecznych treści. Na stronie internetowej Sójki dostępna jest aplikacja, która nie wymaga rejestracji, aby móc przeglądać i oceniać treści, przypisując je do odpowiednich kategorii, takich jak na przykład agresja. Jest to niezwykle potrzebna praca. Naszym celem nie jest cenzura. Jeśli w przyszłości zechce z niego skorzystać prokuratura lub organizacje pozarządowe do wykrywania mowy nienawiści, to bardzo dobrze.
Z kolei chat.bielik.ai – wersja demonstracyjna naszego chatu – jest celowo bardzo mocno zabezpieczona i restrykcyjna. Algorytm ma odgórny zakaz generowania treści drastycznych, niezależnie od kontekstu. Jeśli użytkownik zapyta o Wołyń czy Holokaust, czat odmówi lub poda szczątkowe informacje. Nie wynika to z cenzury historycznej. Po prostu w sandboxie odcinamy wszelkie tematy związane z przemocą, ponieważ narzędzie ma pokazywać wyłącznie to, jak silnik pracuje na tekście biznesowym. Nawet dzisiaj, gdy próbowałem przetłumaczyć fragment tekstu zawierający drastyczne sformułowania, chat odmówił przetworzenia.
Magdalena Tokaj: Co zrobić, żeby modele nie halucynowały?
Sebastian Kondracki: Halucynacje da się mocno zminimalizować. Technicznym krokiem jest odpowiednia konfiguracja, żeby zmniejszyć kreatywność modelu w generowaniu odpowiedzi. W gotowych rozwiązaniach, takich jak ChatGPT, w instrukcjach systemowych często wpisuje się: „bądź przyjazny, otwarty”. To działa tak, jakbyśmy wysłali nowo zatrudnionego stażystę na bardzo ważne spotkanie biznesowe i dali mu wytyczną: „bądź dla wszystkich miły, nie odmawiaj i nie podawaj odległych terminów”. Taki stażysta, chcąc spełnić te oczekiwania zacznie w trudnych momentach halucynować, żeby zrealizować swoje zadanie.
Skuteczną obroną przed halucynacjami są wyspecjalizowane modele, które posiadają ogromną wiedzę merytoryczną w danej dziedzinie i potrafią precyzyjnie łączyć kropki.
Skuteczną obroną przed halucynacjami są właśnie wyspecjalizowane modele, które posiadają ogromną wiedzę merytoryczną w danej dziedzinie i potrafią precyzyjnie łączyć kropki. Firma Gaius-Lex dostroiła Bielika i podłączyła pod niego bazę polskiego prawa. Z jej badań wynika, że w obszarze polskiego ustawodawstwa tak obudowany Bielik ma znacznie mniejsze halucynacje niż GPT-5 Pro.
Paulina Król – Książka: Kiedy firma wdraża u siebie Bielika, bierze pełną odpowiedzialność za bezpieczeństwo na własnych serwerach. Dlaczego CTO polskiego banku miałby wybrać Bielika, a nie gotowe rozwiązanie od Microsoftu z certyfikatem bezpieczeństwa?
Sebastian Kondracki: Bielik nie jest modelem przeznaczonym do użytku domowego. Pobiera go firma software’owa, która doskonale wie, w jakim ekosystemie go osadzi, dostosowuje zabezpieczenia do konkretnego klienta i bierze za to biznesową odpowiedzialność.
Po drugie, Bielika udostępniamy na licencji Apache 2.0. Pozwala ona przedsiębiorcom na bezpłatne komercyjne wykorzystanie i budowanie własnych produktów. Warunkiem jest jednak to, że firma przejmuje pełną odpowiedzialność za to, gdzie i jak tego modelu użyje.
Ponieważ dostarczamy Bielika jako silnik, to nie wiemy, gdzie on docelowo wystąpi, dlatego nie możemy odgórnie zapewnić pełnego bezpieczeństwa. Jeśli model trafi do służb specjalnych – a korzystają one z Bielika bardzo często – musi posiadać kompletną wiedzę, w tym o składzie chemicznym substancji niebezpiecznych czy narkotyków. Jeśli jednak ten sam model miałby działać w szkole, wymagałby zupełnie innych zabezpieczeń.
Jako jedni z pierwszych w Polsce i w Europie opublikowaliśmy dokumentację w pełni zgodną z AI Act. Podmiot chcący korzystać z Bielika ma wgląd w pełną dokumentację dotyczącą procesu trenowania i źródeł danych. Daje to gwarancję bezpieczeństwa, której nie ma np. przy modelach chińskich.
Paulina Król – Książka: Czy my, jako Polska, jako Europa mamy szansę na suwerenność AI? Czy to jest wykonalne, patrząc na BigTechy z innych kontynentów?
Sebastian Kondracki: Co prawda przespaliśmy pierwszy moment, ale Europa się budzi, a w Polsce powstają świetne inicjatywy. O tę suwerenność AI-ową możemy walczyć i jesteśmy w stanie dołączyć do peletonu.
Przyszłość należy do rozproszonej sztucznej inteligencji. Jako Unia Europejska możemy tą rozproszoną siecią wygrać z monolitycznymi potęgami.
Przyszłość należy do rozproszonej sztucznej inteligencji. Będzie wykorzystywana w codziennym biznesie, w administracji publicznej, w służbie zdrowia. Na tym polu Europa ma ogromną szansę, ponieważ posiadamy wiele ośrodków naukowych, które mogą specjalizować się w konkretnych niszach. Jako Unia Europejska możemy tą rozproszoną siecią wygrać z monolitycznymi potęgami.
Magdalena Tokaj: A w kategorii niezależność technologiczna? Bardzo chwytliwie brzmi określenie „technopatriotyzm”.
Sebastian Kondracki: Tu kilka kluczowych bitew już bezpowrotnie przegraliśmy. Nie mamy własnych systemów operacyjnych ani pakietów biurowych. Nie posiadamy europejskiej chmury obliczeniowej, która mogłaby konkurować skalą adopcji z amerykańskimi BigTechami. Nie mamy nawet własnych mediów społecznościowych, które budują realną suwerenność informacyjną i technologiczną. Wszystko oddaliśmy w ręce dostawców z USA lub Chin. Obecna sytuacja geopolityczna zmusza Europę do przebudzenia, ale mamy ogromne zaległości do odrobienia.
Magdalena Tokaj: Żeby zakończyć pozytywnym akcentem – słyszę o Bieliku, że to projekt społeczny, czasem, że polityczny. Z „projektu pasjonatów” na „strategiczną infrastrukturę państwa” – jest taki pomysł na przyszłość Bielika?
Sebastian Kondracki: Często słyszymy zarzuty, że pracujemy za darmo, ale w ten sam sposób rozwinął się Linux. Fundacja SpeakLeash ma dwa główne cele: budowanie twardych kompetencji inżynieryjnych w obszarze AI w Polsce oraz promocję polskiego AI na świecie. Bielik to narzędzie do ciągłej nauki i podnoszenia kompetencji ludzi w naszej społeczności. Chcemy pokazać, że w Polsce nie robimy tylko „zakrętek do butelek”.
Nie chcemy komercjalizować Bielika. Model ma pozostać bezpłatny. Chcemy komercjalizować projekty przez spin-offy i stworzyć polski ekosystem startupów deeptechowych.
Nie chcemy komercjalizować Bielika. Model ma pozostać bezpłatny. Chcemy natomiast komercjalizować projekty poprzez spin-offy i stworzyć polski ekosystem startupów deeptechowych. Chcemy, aby Bielik stał się „wylęgarnią” innowacyjnych firm. Wierzymy, że dając im kompetencje, networking oraz markę i referencje, pomożemy im zbudować globalne biznesy. Zakładamy, że gdy odniosą sukces, wrócą do fundacji jako sponsorzy. Gdyby Bielik powstał przed sukcesem ElevenLabs, na pewno nasze drogi w obszarze deep techu by się przecięły. Gdybyśmy im wtedy pomogli, dziś ElevenLabs przy swojej wycenie mógłby wesprzeć Bielika.
Zapraszam wszystkich do naszej piaskownicy na chat.bielik.ai. Bawcie się, testujcie, tylko pamiętajcie: Bielik to silnik. To, jaką zbudujecie wokół niego motorówkę czy vana, zależy już od was.

Sebastian Kondracki, współtwórca Bielik AI, założyciel SpeakLeash
Ekspert ds. transformacji cyfrowej z naciskiem na innowacje i sztuczną inteligencję (AI). Chief Innovation Officer w firmie Deviniti. Autor książki „Python i AI dla e-commerce”, bada wpływ „otwartości” (open science, open data, open source) na kreatywność i innowacyjność.
Specjalizuje się w dużych modelach językowych (LLM) i generatywnych systemach AI w biznesie. Twórca projektu SpeakLeash (ˈspix.lɛʂ), Spichlerz – zestawu narzędzi do budowy największego w Polsce zbioru danych wysokiej jakości oraz dużego modelu językowego Bielik. Modele Bielik były licznie nagradzane w Polsce i za granicą. Pomysłodawca akcji Obywatel Bielik, której celem jest budowanie obywatelskich zbiorów danych.
Autor licznych raportów branżowych, w tym „Otwarte dane a sztuczna inteligencja” (GRAI) i „Artificial Intelligence SumUp for Business 2022”, “Przegląd polskich zasobów językowych w otwartym dostępie o znaczącym potencjale dla AI w biznesie”, “Generatywne AI w biznesie”.
Ekspert w zakresie uczenia maszynowego, przetwarzania języka naturalnego (NLP), generowania języka naturalnego oraz zastosowań GenAI w biznesie. Specjalizuje się również w inteligencji kolaboratywnej, współpracy zespołów ludzi i AI, testowaniu pomysłów biznesowych, metodach lean startup oraz zarządzaniu projektami eksploracyjnymi. Wykładowca na studiach podyplomowych, m.in. w Szkole Głównej Handlowej w Warszawie.
Członek Rady Przyszłości – ciała doradczego Prezesa Rady Ministrów, powołanego w celu przygotowywania rekomendacji działań i rozwiązań wspierających dalszy rozwój Polski. W skład Rady wchodzą naukowcy, przedstawiciele biznesu oraz eksperci specjalizujący się w obszarach takich jak sztuczna inteligencja, technologie kosmiczne, biotechnologia, technologie finansowe oraz zastosowania dual-use (o znaczeniu zarówno cywilnym, jak i wojskowym).
Kornblit Talks
Kornblit Talks to autorski cykl rozmów z liderkami i liderami opinii. Prezentujemy w nim zagadnienia dotyczące przywództwa i zarządzania talentami.
Zobacz więcej w sekcji Kornblit Talks.
Jesteśmy firmą executive search specjalizującą się w rekrutacjach na kluczowe stanowiska managerskie i eksperckie. Od dwudziestu pięciu lat pomagamy firmom w realizacji złożonych i niestandardowych projektów rekrutacyjnych.
Uważnie obserwujemy rynek pracy, analizujemy trendy demograficzne i społeczne. Dzięki temu skutecznie rekrutujemy i rekomendujemy naszym klientom najlepiej dobranych kandydatów i kandydatki.

