Pierwsza książka w historii polskiego ruchu wydawniczego w całości tłumaczona przez AI

30.01.2025 aktualizacja: 30.01.2025

4 minuty czytania

Fot. Adobe Stock

Pierwsza książka w przekładzie sztucznej inteligencji – „Od Gutenberga do Zuckerberga. Wstęp do humanistyki cyfrowej” – ma postać bezpłatnego e-booka. O współpracy w zespole badawczym, którego członkiem była Aplikacja DeepL, opowiada ekspert humanistyki cyfrowej z Uniwersytetu Wrocławskiego.

Aplikacja DeepL przetłumaczyła z języka polskiego na czeski monografię zbiorową pod red. prof. dr. hab. Adama Pawłowskiego. Książka jest dostępna tutaj.

„Była to pierwsza książka tłumaczona przez AI w historii polskiego ruchu wydawniczego. Fakt ten został potwierdzony wpisem do katalogu Biblioteki Narodowej i innych referencyjnych baz bibliograficznych, a następnie do Urzędowego Wykazu Druków Wydanych w Rzeczpospolitej Polskiej” – podkreśla prof. Pawłowski. Jak tłumaczy, tego rodzaju oficjalny zapis, wraz z numerem ISBN, jest swoistym „peselem” książki. Staje się ona dzięki temu pełnoprawnym dokumentem: trwałym pod względem formy i treści, funkcjonującym w międzynarodowym obiegu i możliwym do wyszukania przez różne systemy informacyjne.

Profesor przyznaje, że wcześniej korzystano już z oprogramowania przeznaczonego do tłumaczeń. „Jednak tym razem sytuacja była diametralnie różna: głównym aktorem procesu tłumaczenia nie był człowiek, który w razie potrzeby posiłkuje się informatyką. Tutaj całe tłumaczenie najpierw wykonała maszyna, a człowiek wkroczył do akcji dopiero na etapie »postprodukcji«, czyli redakcji przekładu maszynowego” – opowiada prof. Pawłowski.

OD OSZCZĘDNOŚCI, POPRZEZ EKSCYTACJĘ, DO ROZPOZNANIA SŁABOŚCI AI

Dwujęzyczne monografie były elementem projektu „Humanistyka Cyfrowa dla Przyszłości” prowadzonego przez Uniwersytet Wrocławski i Uniwersytet w Ołomuńcu od 2019 r. W ramach oszczędności zrezygnowano wówczas z tradycyjnego tłumaczenia i do zespołu włączono DeepL.

„Sam moment tłumaczenia był ekscytujący i wprawił mnie w stan bliski euforii. Oto czeska wersja ponad w 300-stronnicowej książki wraz z całym aparatem naukowym, pojawiła się w ciągu niecałych 10 minut! Jednak później nie było tak łatwo. Wyjściowy plik PDF ukazał słabości automatycznego przekładu, wynikające z bogactwa języka naturalnego, obejmującego metafory, skróty myślowe, referencje wewnętrzne i odwołania intertekstualne. Pracy nie ułatwiła rozbudowana struktura monografii naukowej: przypisy, cytowania, tytuły ilustracji” – opowiada prof. Pawłowski.

Naukowcy zaobserwowali też efekt wewnętrznej logistyki tego rodzaju systemów, w których małe i średnie języki tłumaczy się drogą okrężną przez angielski, a nie bezpośrednio. Badacze musieli więc zacząć od sprawdzenia wszystkich nazw własnych, które, raz były tłumaczone, a raz nie. Chodziło przede wszystkim o miejsca wydań, imiona osób, niekiedy nawet nazwiska. Ponadto system DeepL tłumaczył niektóre cytaty w języku angielskim na czeski, a inne pozostawiał w pierwotnej postaci.

KOREKTA STYLISTYCZNA PO STRONIE CZŁOWIEKA

Książka okazała się dla AI dokumentem trudnym ze względu na wielotematyczność, bogatą terminologię i aparat edytorski w postaci przypisów, bibliografii, grafik itd.

Formalnie zredagowany tekst wymagał korekty językowej i stylistycznej. „Tłumaczenie książki nie należało do najlepszych. Czasem miałem wrażenie, że pełnię rolę tłumacza, a nie tylko redaktora. Problemy często dotyczyły terminów, fachowych wyrażeń, łączliwości wyrazów, metafor oraz innych środków stylistycznych, które naukowcy wplatają w swój dyskurs” – ocenia dr Tadeáš Dohňanský z CzechLit – Czeskiego Centrum Literackiego w informacji przytoczonej przez prof. Pawłowskiego.

Niepoprawnie przetłumaczone były też opisy obrazków i wykresów. Wynikało to z nieuwzględniania szerszego kontekstu użycia konkretnego wyrazu lub zdania. W procesie redakcyjnym naturalnie wystąpiły liczne poprawki stylistyczne, co jest normalną praktyką również w przypadku tłumaczeń wykonanych przez człowieka. „Jednak sztuczna inteligencja wciąż nie radzi sobie z opisanymi wyżej problemami” – podsumowuje czeski redaktor.

EFEKT WSPÓŁDZIAŁANIA LUDZI I MASZYN

Zdaniem polskich i czeskich badaczy projekt odniósł sukces, a droga do praktyki tłumaczenia automatycznego całych utworów jest przetarta. Naukowcy zaznaczają, że programy do translacji będą z każdym rokiem lepsze.

„Obecnie trudno jest wytyczyć jasną linię podziału między tym, co ludzkie i maszynowe w przestrzeni komunikacyjnej. Tłumaczenie maszynowe jest oparte na systemie uczącym się z przekładów wykonanych przez ludzi. Na podobnej zasadzie działają wielkie modele językowe (LLMs – Large Language Models). System generujący teksty uczy się od człowieka – efekty tej nauki w postaci wytwarzanych tekstów nie są więc wyłączną kreacją maszyny. Są odtwórcze w stosunku do ogromnego korpusu treningowego” – tłumaczy prof. Pawłowski.

Podkreśla, że tekst generowany przez LLM wymaga modyfikacji przez człowieka, choć człowiek czuje się niekomfortowo jako partner maszyny, ponieważ gatunek ludzki nigdy w swoich dziejach takiego partnerstwa nie doświadczył.

„Nasz umysł antropomorfizuje więc algorytmy (są jakby umysłem) i urządzenia peryferyjne komputera (to rodzaj systemu poznawczego), a w piśmiennictwie z lat 60. funkcjonowała nawet nazwa komputera »mózg elektronowy«. A zatem LLMy »wiedzą«, »znają« jakiś temat, »rozumieją«, »tłumaczą«, a czasem nawet »słuchają« i »mówią« – w skrócie »myślą«” – wylicza naukowiec.

„Przestrzeń komunikacyjna stała się hybrydą, w której ludzie i maszyny współistnieją i współdziałają” – podsumowuje prof. Pawłowski.

Nauka w Polsce, Karolina Duszczyk

kol/ agt/

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Technologia

Podkarpackie/ Aplikacja wykrywająca uszkodzenia infrastruktury zwyciężyła w hackathonie NASA
Technologia

Prof. Włodzisław Duch w Światowej Akademii Sztucznej Świadomości

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Polacy współautorami nowej metody badania reakcji chemicznych
Nowy rok akademicki z kilkoma zmianami legislacyjnymi, ale na te kluczowe trzeba poczekać
Wiceminister nauki: zwiększenie dotacji dla NCN będzie dużym wyzwaniem
Kraków/ UJ uruchomił Jagiellońskie Centrum Sztucznej Inteligencji
Kraków/ Rozpoczął się proces w sprawie karpi uśmierconych na Uniwersytecie Rolniczym

Nowa metoda przemiany plastiku w paliwo
Tłuszcz w mózgu, a nie tylko złogi białkowe, mogą napędzać chorobę Alzheimera
Ponad 20 proc. treści o zdrowiu seksualnym na TikToku zawiera nieprawdziwe informacje
Prawie wszyscy chorzy mają te problemy przed pierwszym zawałem lub udarem
Większość filmów ekoinfluencerów na TikToku zawiera błędne informacje medyczne