GPT-3 rozumuje równie dobrze, jak student

Świat

GPT-3 rozumuje równie dobrze, jak student

09.08.2023 aktualizacja: 09.08.2023

3 minuty czytania

Adobe Stock

Model językowy sztucznej inteligencji GPT-3 sprawdza się w rozwiązywaniu problemów logicznych równie dobrze, jak studenci - informuje czasopismo „Nature Human Behaviour”.

Psycholodzy z University of California w Los Angeles (UCLA) wykazali, że GPT-3 radzi sobie w standardowych testach na inteligencję i rozumowanie tak samo - a czasami nawet lepiej - niż większość studentów. Wyniki te skłaniają do rozważań, czy sztuczna inteligencja naśladuje ludzkie rozumowanie, czy też wykorzystuje jakiś nowy typ procesu poznawczego.

Jednak na razie, ze względu na brak dostępu do wewnętrznych mechanizmów GPT-3 zastrzeżonych przez firmę OpenAI, naukowcy nie są w stanie tego stwierdzić.

Ludzie mają zdolność radzenia sobie z zupełnie nowymi dla nich zagadnieniami i problemami, ponieważ odnoszą je do swoich poprzednich przeżyć i doświadczeń, wyciągają z nich wnioski i przenoszą na bieżące zagadnienie. Proces ten nazywa się rozumowaniem analogicznym i od dawna uważany jest za wyjątkową umiejętność człowieka.

Najnowsze badanie przeprowadzone na UCLA pokazuje, że model językowy sztucznej inteligencji GPT-3 radzi sobie mniej więcej tak samo dobrze, jak studenci college'u, jeśli chodzi o rozwiązywanie problemów wymagających rozumowania. Potwierdziły to zarówno testy na inteligencję, jak i standaryzowane testy typu SAT, będące odpowiednikiem polskiej matury.

„Nasze wyniki są imponujące, jednak trzeba pamiętać, że nadal system ten ma poważne ograniczenia - mówi dr Taylor Webb, główny autor badania. - Umie rozumować analogicznie, ale nie może robić rzeczy, które ludziom przychodzą z łatwością, np. dopasowywać narzędzi do rozwiązywania problemów związanych z przestrzenią fizyczną. Kiedy dawaliśmy mu tego typu zadania, z którymi bez problemu radzą sobie nawet dzieci, sugerował nam bezsensowne rozwiązania”.

Webb i jego współpracownicy „zlecili” modelowi AI rozwiązanie testu matryc Ravena, który wymaga od badanego przewidzenia następnego obrazu w skomplikowanym układzie kształtów. Aby umożliwić GPT-3 „zobaczenie” kształtów, obrazki przekonwertowano na format tekstowy, który model był w stanie przetworzyć. Takie podejście gwarantowało również, że sztuczna inteligencja nigdy wcześniej nie spotkała się z otrzymanymi pytaniami.

O rozwiązanie tego samego testu naukowcy poprosili również 40 studentów studiów licencjackich.

„Co zaskakujące, GPT-3 nie tylko poradził sobie równie dobrze jak ludzie, ale także popełniał podobne do nich błędy” – opowiada współautorka publikacji, prof. Hongjing Lu.

GPT-3 rozwiązał poprawnie 80 proc. problemów - znacznie powyżej średniego wyniku uzyskanego przez ludzi (ten wynosił nieco poniżej 60 proc.).

Następnie naukowcy poprosili sztuczną inteligencję o odpowiedzi na wybrane pytania z testu SAT. Warto podkreślić, że pytania te nigdy nie zostały opublikowane w internecie, co oznacza, że na pewno nie były częścią danych treningowych GPT-3. Zadania polegały m.in. na wybraniu par słów, które odnoszą się do tego samego zjawiska, np. dla słowa „kochać” parą jest „nienawidzić”, a dla „bogaty” rozwiązanie brzmi „biedny”.

Porównanie wyników GPT-3 z opublikowanymi wynikami kandydatów na studia ujawniło, że ten pierwszy poradził sobie lepiej niż większość ludzi.

W ostatnim eksperymencie naukowcy zlecili sztucznej inteligencji oraz studentom rozwiązanie analogii w oparciu o opowiadania. Należało przeczytać fragment tekstu, a następnie zidentyfikować inną historię, która ma ten sam morał (przesłanie). Tym razem technologia poradziła sobie gorzej niż ludzie. Badacze dodają jednak, że nowszy model językowy GPT-4 pokonał już te ograniczenia i w tym samym teście wypada znacznie lepiej niż GPT-3.

Badanie ujawniło także, że model sztucznej inteligencji nie radzi sobie zupełnie z rozwiązywaniem problemów wymagających zrozumienia przestrzeni fizycznej. Na przykład, jeśli GPT-3 otrzymał opis zestawu narzędzi - tekturowej tuby, nożyczek i taśmy, a jego zadaniem było opisanie, jak można je wykorzystać do przenoszenia gum do żucia z jednej miski do drugiej, proponował dziwne i nielogiczne rozwiązania.

Naukowcy bardzo chcieliby zbadać, czy modele SI rzeczywiście zaczynają „myśleć” jak ludzie, czy też ich rozumowanie jest czymś zupełnie innym, co jedynie naśladuje ludzkie myślenie. „Być może GPT-3 może myśleć jak człowiek - mówią. - Jednak z drugiej strony ludzie nie uczą się pochłaniając cały internet, więc metoda szkolenia siłą rzeczy jest zupełnie inna. Chcielibyśmy wiedzieć, jak się to naprawdę odbywa: czy tak jak u nas, czy też w zupełnie nowy, prawdziwie inteligentny sposób, co byłoby naprawdę niesamowite”.

Aby to stwierdzić, psycholodzy z UCLA musieliby mieć jednak dostęp do oprogramowania i danych wykorzystywanych do szkolenia modelu. „Byłoby to dla nas i innych badaczy bardzo przydatne” - mówią.

Katarzyna Czechowicz

kap/ bar/

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Świat

Przewlekły ból może zwiększać ryzyko nadciśnienia tętniczego u dorosłych
Świat

Koty zagrażają również owadom i pajęczakom

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Ekspert: niedofinansowane szkolnictwo wyższe będzie dryfować
PAN ogłosiła Nagrodę Polskiej Akademii Nauk – od 2026 r., dla zwycięzcy 400 tys. zł
Ekspert: o grzybicach mało się mówi, a choruje na nie ponad 100 tysięcy Polaków rocznie
Rurka nerwowa z drukarki 3D pomoże odzyskać sprawność po urazie
Prawnik: w walce z fabrykami publikacji naukowych ważne są działania uczelni

Weganie emitują prawie o połowę mniej CO2
Wielu Norwegów boi się pracy
Mózg fanów piłki wpada w ekstremalną aktywność
Praca biurowa bez bólu
Media: tysiące słoni morskich zginęło w wyniku epidemii ptasiej grypy

17.11.2025. Działania służb przy zniszczonym fragmencie torowiska na trasie Dęblin-Warszawa przy stacji kolejowej Mika, 17 bm. Premier Donald Tusk ogłosił, że doszło do aktu dywersji; eksplozja ładunku wybuchowego zniszczyła tor kolejowy. PAP/Wojtek Jargiło

Ekspertka o wojnie hybrydowej: my jesteśmy częścią systemu obronnego państwa

Wojna hybrydowa, podobnie jak terroryzm, polega na destabilizacji, wykorzystaniu strachu. To my, obywatele, poprzez naszą odporność na manipulację i strach, stanowimy najlepsze wsparcie dla bezpieczeństwa Polski i Europy - powiedziała PAP dr Paulina Piasecka z Collegium Civitas.