Kanada/ Lepiej nie używać ChatuGPT do diagnozowania pacjentów

21.08.2024 aktualizacja: 21.08.2024

3 minuty czytania

Adobe Stock

ChatGPT nie może być użyty jako narzędzie diagnostyczne w medycynie, bo w ponad połowie przypadków się myli – podsumowali kanadyjscy naukowcy z Uniwersytetu Zachodniego Ontario po przetestowaniu modelu na przypadkach pacjentów. ChatGPT umie jednak pisać czytelne odpowiedzi.

ChatGPT nie daje zgodnych z faktami diagnoz „mimo obszernej informacji, na której był trenowany”, a poprawne odpowiedzi dawał tylko w 49 proc. przypadków - do takich ustaleń doszli naukowcy z Shulich School of Medicine & Dentistry na Uniwersytecie Zachodniego Ontario (Western University). Artykuł o przydatności ChatGPT w diagnozach ukazał się właśnie w PLOS One.

Medyczne umiejętności ChatGPT przetestowano na 150 przypadkach pobranych z publicznej bazy danych Medscape, używanej m.in. do sprawdzania umiejętności diagnostycznych lekarzy. Testy modelu prowadzono między wrześniem 2021 a styczniem 2023 r. Tylko w 74 przypadkach (49 proc.) diagnoza sztucznej inteligencji była trafna. „ChatGPT ma problemy z interpretacją wyników laboratoryjnych, wyników obrazowania i pomijał niektóre kluczowe informacje ważne dla diagnozy” – napisali autorzy „Oceny ChatGPT jako narzędzia diagnostycznego dla studentów medycyny i klinicystów” (Evaluation of ChatGPT as a diagnostic tool for medical learners and clinicians).

„Będziemy potrzebować intensywnego nadzoru nad tym jak (sztuczna inteligencja – przyp. PAP) jest używana, by zapewnić bezpieczeństwo pacjenta i by upewnić się, że ten rodzaj technologii AI będzie rozważnie udostępniany” - komentował cytowany w komunikacie zamieszczonym na stronie Uniwersytetu Zachodniego Ontario dr Amrit Kirpalani, profesor Schulich School of Medicine & Dentistry, współautor badania. Dodał, że korzystaniu z danych dostępnych w internecie musi towarzyszyć sprawdzanie ich poprawności na podstawie badań naukowych, analizowanych przez innych badaczy oraz rozwijanie umiejętności komunikowania się z modelami AI.

Badacze zidentyfikowali przyczyny błędnych odpowiedzi, związane z tym, jak tworzone są duże modele językowe. „Konieczne jest rozważenie roli halucynacji AI, ponieważ mogą w znaczący sposób wpłynąć na trafność podawanej informacji. Halucynacje odnoszą się do odpowiedzi tworzonych przez model AI, które wydają się spójne, ale nie bazują na informacji faktycznej, pochodząc z pominięć, błędów lub przeoptymalizowania danych, na których trenowany jest model lub jego niezdolności do poprawnego rozeznawania w dwuznacznych lub niekompletnych danych wejściowych”.

Błędy w diagnozowaniu mogą pochodzić także z uprzedzeń i błędów samych lekarzy, zawartych w informacji medycznej używanej do treningu. „Znaczenie ludzkiego nadzoru jest nie do przecenienia” - podkreślili autorzy, zwracając też uwagę na takie aspekty jak określenie odpowiedzialności za ewentualne błędy wynikające z wykorzystania modeli AI.

Jednak badacze z Uniwersytetu Zachodniego Ontario wskazali też na możliwości użycia ChatGPT jako narzędzia pomocniczego.

Przy wszystkich wadach ChatGPT, które dyskwalifikują to narzędzie jako diagnostę, model w większości przypadków dawał poprawne oceny wykluczające część diagnoz różnicowych oraz poprawnie proponował dalsze kroki w tworzeniu diagnozy. Ponadto choć tylko 49 proc. diagnoz było trafnych, to już np. zdolność do odrzucania niepoprawnych opcji odpowiedzi była znacznie większa – wynosiła 74,33 proc.

Zauważono też, że model „był w stanie analizować złożone tematy medyczne i dokonywać syntezy w sposób łatwy do zrozumienia”. Autorzy pracy uznali to za korzystną opcję uzyskiwania uproszczonych wyjaśnień dla studentów medycyny i podkreślili, że z myślą właśnie o takim wykorzystaniu warto rozwijać użycie modeli AI.

Z Toronto Anna Lach(PAP)

lach/ agt/

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Technologia

NCBR: dwa projekty otrzymają 44 mln zł na stworzenie narzędzia do zarządzania ruchem turystycznym
Technologia

Dr Astro Teller: nowe technologie w dłuższej perspektywie zawsze czyniły świat lepszym

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Naukowcy: Europa Środkowo-Wschodnia - nie peryferie, ale ważny obszar dla neandertalczyków
Badaczka z Harvardu: tradycyjny format CV sprzyja uprzedzeniom i utrudnia rekrutację
Psycholog: nieufność wobec szczepień ma źródła psychologiczne
Fotografia Marka Nikodema zdobyła po raz piąty tytuł APOD NASA
Psycholog: myślenie spiskowe towarzyszy człowiekowi od wieków

Ultraprzetworzona żywność szkodzi, bo ją przetworzono
Do 2030 r. sztuczna inteligencja będzie zużywać tyle wody, ile potrzebuje 1,3 mld ludzi
Komisja Europejska zatwierdziła lek Aquipta do doraźnego zwalczania ataków migreny
Nieregularny sen przedszkolaków wiąże się z osłabieniem intelektu
Poglądy polityczne wpływają na wybór partnera

Technologia

Współautorka benchmarku OneRuler: nie pokazaliśmy wcale, że język polski jest najlepszy do promptowania
Świat

Belgia/ Coraz więcej przypadków nadużywania ChatGPT na uniwersytetach
Technologia

Debata/ Nie wiemy, czy AI będzie lepsza niż naukowcy, ale naukowcy będą lepsi z AI

Warszawa 1986. Klub Mikrokomputerowy MIKROS działający przy Zakładach Radiowych im. Marcina Kasprzaka (przedsiębiorstwo państwowe należące do Zjednoczenia Przemysłu Elektronicznego UNITRA). PAP/Maciej Musiał-AR

40 lat od debiutu pisma „Bajtek”; eksperci o początkach polskiej kultury cyfrowej

Początki polskiej informatyzacji związane były z oddolną inicjatywą obywateli i nauką programowania poprzez samodzielne przepisywanie kodów i poprawianie błędów w druku. O historii magazynu „Bajtek” rozmawiali naukowcy i twórcy pisma podczas Perspektywy Women in Tech Summit 2026 w Warszawie.