Wykrywanie treści AI w artykułach naukowych jest bardzo trudne

Świat

Wykrywanie treści AI w artykułach naukowych jest bardzo trudne

05.06.2024 aktualizacja: 06.06.2024

2 minuty czytania

Fot. Adobe Stock

Modele językowe sztucznej inteligencji mogą generować abstrakty naukowe, które są bardzo trudne do odróżnienia od prac przygotowanych przez ludzi. Nie ma na razie narzędzi pozwalających wydajnie wykrywać niedozwolone użycie AI w literaturze naukowej - informuje pismo „Journal of Clinical Oncology Clinical Cancer Informatics”.

Obserwowany od pewnego czasu wzrost popularności narzędzi AI takich jak ChatGPT dotyczy także społeczności naukowej oraz przygotowywanych przez jej członków publikacji. Ponieważ sztuczna inteligencja jest coraz bardziej zaawansowana w naśladowaniu ludzkiego języka, redaktorzy czasopism naukowych mają coraz większe problemy z odróżnieniem prac przygotowanych przez ludzi i tych, które wygenerowano przy użyciu AI.

Prestiżowe wydawnictwa, takie jak „Science” czy „Nature”, próbowały ograniczyć lub zakazać stosowania sztucznej inteligencji w nadsyłanych do swoich redakcji artykułach, jednak okazało się to niemożliwe do wyegzekwowania ze względu na duże trudności w wykrywaniu języka generowanego maszynowo.

Badacze z Uniwersytetu w Chicago (USA) postanowili określić skalę tego problemu (https://doi.org/10.1200/CCI.24.00077). Sprawdzili, jak często autorzy korzystają ze sztucznej inteligencji i jak efektywnie może ona tworzyć przekonujące artykuły naukowe. Za pomocą kilku komercyjnych detektorów treści AI ocenili teksty z ponad 15 tys. abstraktów przygotowanych na doroczne spotkania Amerykańskiego Towarzystwa Onkologii Klinicznej odbywające się w latach 2021–2023.

Okazało się, że w 2023 r. było około dwukrotnie więcej abstraktów zawierających treści wygenerowane przez sztuczną inteligencję niż w latach 2021 i 2022, co - zdaniem autorów - stanowi bardzo wyraźny sygnał, że naukowcy coraz chętnie wykorzystują narzędzia AI w swoich publikacjach.

Co znamienne, użyte w badaniu detektory treści znacznie lepiej odróżniały teksty generowane przez starsze wersje chatbotów od tekstów ludzkich; zdecydowanie gorzej radziły sobie z artykułami przygotowanymi przez nowsze modele językowe lub z takimi, które zwierały zarówno fragmenty napisane przez człowieka, jak i te wygenerowane przez AI.

Ponieważ w nadchodzących latach wykorzystanie sztucznej inteligencji w pismach naukowych prawdopodobnie wzrośnie, a modele językowe będą coraz doskonalsze, autorzy omawianej publikacji ostrzegają, że kluczowe i pilne staje się wprowadzenie odpowiednich zabezpieczeń. Powinny one chronić nie tylko przed niedozwolonymi praktykami, ale także gwarantować, że w pracach naukowych będą uwzględniane wyłącznie informacje zgodne z faktami. Jest to szczególnie istotne, ponieważ modele AI mają skłonność do używania brzmiących wiarygodnie, choć niepoprawnych stwierdzeń.

Naukowcy z Chicago doszli również do wniosku, że chociaż detektory treści AI nigdy nie osiągną idealnej dokładności, można je wykorzystać jako narzędzie przesiewowe wskazujące, które treści wymagają dodatkowej kontroli ze strony recenzentów. Jednak ich zdaniem narzędzia takie nie powinny być wykorzystywane jako jedyny sposób oceny treści AI w czasopismach naukowych.(PAP)

Katarzyna Czechowicz

kap/ agt/

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Świat

Udział w ultramaratonach może przyspieszać uszkodzenie czerwonych krwinek
Świat

Fale mózgowe matki i dziecka łatwo się synchronizują

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Zachodniopomorskie/ Archeolodzy odkryli ślady zapomnianego, średniowiecznego miasta - Stolzenberg
Psycholog: nastolatki są „wplątane” w konsumpcjonizm
Badanie: skład i budowa ciała wpływają na parametry ludzkiego głosu
Prof. Jemielniak ws. wykazu czasopism: w większości tematów publikowanie po angielsku powinno być normą
Gdańsk/ Studenci stworzyli aplikację wspierającą zdrowie psychiczne

Archeolodzy odkryli część hiszpańskiego zamku w Gandawie, mówią o „archeologicznej skarbnicy”
Post przerywany nie wydaje się lepszy od typowych zaleceń
Poznano przyczynę „grawitacyjnej dziury” pod Antarktydą
Zmiany w układzie nagrody w mózgu mają związek z zespołem żałoby przedłużonej
Lasy tropikalne generują opady deszczu „warte” miliardy

Testowanie dzieci online daje inne wyniki niż badania twarzą w twarz

Dzieci poddane testom dotyczącym poziomu gramatyki osiągały wyższe średnie wyniki w badaniu twarzą w twarz niż w badaniu online – wykazały analizy Zespołu Badań nad Językiem i Humorem Instytutu Psychologii Akademii Pedagogiki Specjalnej (APS) im. Marii Grzegorzewskiej w Warszawie.