Az, hogy valaki az Age of Empires II logikai kapuiból és digitális kecskéiből épít fel egy neurális hálózatot, tökéletesen rávilágít az AI-t körülvevő jelenlegi hatalmas hájp és a valóság közötti szakadékra.

A kecskék kétségkívül a digitális kultúra és a mémek állandó főszereplői, legyen szó megzavart macskák lefejeléséről, vicces hangok kiadásáról vagy a hírhedt, ausztrál Kevin nevű kecske mocskos szájú YouTube-karrierjéről. Ha valaki meg akarja cáfolni azt a hangzatos állítást, hogy a nagy nyelvi modellek (LLM) valójában öntudatra ébredtek, kevés jobb módszer létezik annál, mint az érveit kecskékkel illusztrálni.
Pontosan ezt tette Adrian de Wynter, a Microsoft egyik kutatója, akit valószínűleg a konkurens technológiai vállalatoktól érkező, technológiai szingularitásról szóló hagymázas próféciák inspiráltak. A szakember idén megjelentetett tanulmányában rámutatott, hogy jelenleg teljesen hiányoznak a széles körben elfogadott kísérleti protokollok az AI öntudatának mérésére. Ennek bizonyítására az 1999-es valós idejű stratégiai klasszikus, az Age of Empires II forgatókönyv-szerkesztőjét használta fel, ahol a játékban található kecskékből épített fel alapvető logikai kapukat.
A tanulmány leírja, hogy amint sikerül működésre bírni az olyan alapvető logikai műveleteket, mint az AND, az NAND vagy az XNOR, minden rendelkezésre áll egy úgynevezett perceptron létrehozásához, ami a mesterséges intelligencia legkorábbi és legegyszerűbb formája. De Wynter egy egybites, kecskealapú logikai kapukból álló perceptront épített, ami elméletileg bizonyítja, hogy egy teljes értékű, virtuális kecskékből álló nagy nyelvi modellt is össze lehetne rakni a játékon belül.
Ezzel a kísérlettel a kutató két kulcsfontosságú pontra világított rá az antropomorf, vagyis az emberi tulajdonságok értékelésével kapcsolatban. Az első, hogy bármilyen kellően erős hordozóegység vagy háttérstruktúra képes megvalósítani egy nyelvi modellel egyenértékű entitást, legyen az az OpenAI méregdrága kódbázisa vagy egy rakás virtuális kecske az Age of Empires-ben. A második, még fontosabb tanulság szerint maga a megvalósítás módja alapvetően megváltoztatja azt, hogyan érzékeljük a rendszer tulajdonságait.

A nyelvi modellek esetében szinte lehetetlen megállni, hogy ne tulajdonítsunk emberi minőséget egy olyan szoftvernek, amely tökéletesen utánozza a humán interakciót. Az emberi történelem során a nyelvhasználat mindig az öntudattal rendelkező lények kiváltsága volt, így ha egy nyelvi modellel találkozunk, automatikusan intelligenciát feltételezünk mögötte. Ez az előfeltételezés a tudományos kutatásokat is megmérgezi, hiszen ha abból a feltételezésből indulunk ki, hogy az LLM rendelkezik vagy éppen nem rendelkezik emberi tulajdonságokkal, az már önmagában torzítja a kísérlet eredményét.
Az, hogy a gép által generált természetes nyelvi válasz belső megértést tükröz-e, valójában csak egy külső, emberi belemagyarázás. Itt jön a képbe a kísérlet igazi csattanója. Elméletileg fel lehetne építeni a ChatGPT-t az Age of Empires II-n belül is, de a felhasználók egészen biztosan máshogy tekintenének a válaszaira, ha a böngésző helyett azt látnák, hogy a monitoron virtuális kecskék szaladgálnak oda-vissza a karámokban a végeredményért.
De Wynter szerint a játékon belüli nyelvi modell emberi tulajdonságai finoman szólva is kevésbé lennének meggyőzőek, pedig maga a matematikai modell és a működés pontosan ugyanaz maradna. A tanulmány zseniálisan mutatja be, hogy az AI-nak tulajdonított emberi jellemzők jelentős része csupán az észlelő elvárásain és az illúzión alapul. Legközelebb tehát, amikor komoly életvezetési tanácsot kérünk a ChatGPT-től, érdemes felidézni a digitális kecskéket, hiszen a válaszunk valójában egy csapat virtuális, karámban rohangáló állat logikai eredményéből születik.



