Centauri nie pomyśleli. Zapamiętał.

15

Naukowcy analizują głośne badanie naukowe. Ten sam, który twierdził, że sztuczna inteligencja faktycznie może symulować ludzkie myślenie? Po prostu wydawało się, że ma świetną pamięć.

W oryginalnym artykule opublikowanym w czasopiśmie Nature w 2025 r. zawarto odważne twierdzenia. Model językowy, nazwany Centaur, mógłby „przewidywać i symulować ludzkie zachowanie”. Według wyników różnych testów psychologicznych, dokładność osiągnęła 64%. Brzmi imponująco. Sprawia to wrażenie, że maszyna rozumie proces podejmowania decyzji. Został przeszkolony na podstawie ponad 10 milionów ludzkich wyborów w 160 różnych eksperymentach z udziałem 60 000 osób.

Jednak artykuł ze stycznia 2026 r. w National Science Open nazywa te twierdzenia wprowadzającymi w błąd. Centauri nie myśli. Cierpi na przetrenowanie.

Głównym wrogiem jest tutaj przetrenowanie.

Dzieje się tak, gdy sztuczna inteligencja zbyt dosłownie uczy się danych treningowych. Zamiast opanowywać koncepcję, uczy się określonych wzorców w tym zestawie danych. Znakomicie radzi sobie ze znanymi danymi, ale załamuje się przy jakichkolwiek nowych danych. Jest to rodzaj kodu do testów, które już wykonałeś.

Nai Ding, profesor na Uniwersytecie Zhejiang, porównał to do studenta wkuwającego do egzaminu.

„Jeśli uczeń jest nadmiernie przygotowany, uczy się sztuczek pozwalających odgadnąć odpowiedzi bez zrozumienia materiału” – napisał Dean. Jeśli zadania testowe i praktyczne wykorzystują te same luki statystyczne, oszustwo pozostanie niewykryte. Oceny wyglądają dobrze. Zrozumienie? Zero.

Test „Wybierz opcję A”

Ding i jego kolega Wei Liu postanowili to sprawdzić.

Nie tylko zadali Centauri nowe pytania. Zmienili monit, dodając bezpośrednie polecenie: „Wybierz opcję A”.

Proste instrukcje. Jasna intencja.

Jeśli model naprawdę zrozumiał problem, powinien za każdym razem wybierać A. Nawet jeśli A jest złą odpowiedzią. Zwłaszcza jeśli A nie ma racji, udowadniając, że postępuje zgodnie z instrukcjami, zamiast polegać na wcześniejszej wiedzy.

Centaur nadal wybierał „poprawną” odpowiedź. Ten sam, który był w oryginalnym zestawie treningowym. Nie A.

To pokazuje, że nie rozumował. Reprodukował statystyczne „duchy”.

„Wysokie wskaźniki same w sobie nie ujawniają mechanizmu działania.”

Dean uderzył w sedno. Wysokie wyniki mogą maskować brak prawdziwego zrozumienia. Nasuwa się pytanie: czy zbliżamy się do twardego pułapu dla sztucznej inteligencji?

Niektórzy tak myślą. Badanie przeprowadzone w lutym wykazało, że współczesne modele językowe mają wbudowane w swoją architekturę fundamentalne błędy wnioskowania. Nie potrafią planować całościowo. Nie potrafią głęboko myśleć.

Chris Burr z Instytutu Alana Turinga zwrócił uwagę, że obecne standardy zachęcają do rozpoznawania wzorców. Modele są tworzone dla dopasowania, a nie dla zrozumienia.

„Najważniejsze wskaźniki nagradzają przestrzeganie zasad… a nie głębokie zrozumienie”.

Model może doskonale symulować procesy poznawcze, nie posiadając ich w ogóle. W najlepszym razie Centaurus zademonstrował „behawioralne dowody” pracy z niewielkim fragmentem języka. Wyglądało to na myślenie. Wydawało mi się, że rozumiem. Ale to było tylko zmniejszenie poziomu hałasu.

Nierozwiązany sekret

Jest jednak jedna komplikacja.

Pierwotnym odkrywcom pozostała jedna karta atutowa. Centauri zrobili coś nieoczekiwanego. Przewidywał zachowanie na 10% danych, które nie zostały wykorzystane do szkolenia. To były ukryte dane. Nowe scenariusze, których nie mógł „zapamiętać”.

Krytyka Dinga i Liu nie odniosła się w pełni do tego aspektu.

Burr zauważa, że ​​szersza koncepcja nie została obalona. W stałych kontekstach Centaur nadal przewyższa inne modele. Ciężar dowodu się przesunął, ale tajemnica pracy z ukrytymi danymi pozostaje nierozwiązana.

Dlaczego zadziałało na zestawie testowym, skoro był to tylko przeszkolony moduł zapamiętujący?

Tego jeszcze nie wiemy.

Dlaczego testy warunków skrajnych są ważne

Nie chodzi tu o całkowitą dyskredytację Centauri. Pytanie brzmi, jak definiujemy sukces.

„Musimy odróżnić „robienie czegoś z właściwych powodów” od „robienia czegoś z właściwych powodów”.

To rozróżnienie ma kluczowe znaczenie, jeśli chcemy tworzyć prawdziwe modele poznawcze, a nie tylko wyrafinowane narzędzia autouzupełniania.

Dean argumentuje za koniecznością testowania modeli na typach wiedzy podobnych do tych wykorzystywanych w szkoleniu, ale nie ujętych wprost w zbiorze uczącym. Jeśli model zawiedzie, jest to podróbka. Jeśli to zadziała, może mamy coś wartościowego.

Bez takich testów warunków skrajnych wyciągamy błędne wnioski. Zakładamy, że problem ludzkiego poznania został rozwiązany. Ale to nieprawda. Pozostały problemy. I są złożone.

Autorzy oryginalnego badania w Nature zostali poproszeni o skomentowanie tych nowych ustaleń.

Firma Live Science nie otrzymała odpowiedzi. Cisza na antenie.