turing toets en ai 10 17

Pexels/Google Deepmind, CC BY-SA

In 1950 het die Britse rekenaarwetenskaplike Alan Turing 'n eksperimentele metode voorgestel om die vraag te beantwoord: kan masjiene dink? Hy het voorgestel dat as 'n mens na vyf minute se ondervraging nie kon sê of hulle met 'n kunsmatig intelligente (KI) masjien of met 'n ander mens praat nie, dit sou bewys dat KI menslike intelligensie het.

Alhoewel KI-stelsels ver van Turing se toets geslaag het gedurende sy leeftyd, het hy dit bespiegel

“[...] oor ongeveer vyftig jaar sal dit moontlik wees om rekenaars […] te programmeer om hulle die nabootsingspeletjie so goed te laat speel dat 'n gemiddelde ondervraer nie meer as 70% kans sal hê om die regte identifikasie te maak na vyf minute van ondervraging.

Vandag, meer as 70 jaar ná Turing se voorstel, het geen KI daarin geslaag om die toets suksesvol te slaag deur te voldoen aan die spesifieke voorwaardes wat hy uiteengesit het nie. Nietemin, soos 'n paar opskrifte weerspieël, 'n paar stelsels het redelik naby gekom.

Een onlangse eksperiment drie groot taalmodelle getoets, insluitend GPT-4 (die KI-tegnologie agter ChatGPT). Die deelnemers het twee minute spandeer om met óf 'n ander persoon óf 'n KI-stelsel te gesels. Die KI is aangespoor om klein spelfoute te maak – en op te hou as die toetser te aggressief geword het.


innerself teken grafiese in


Met hierdie aansporing het die KI goeie werk gedoen om die toetsers te flous. Wanneer dit met 'n KI-bot gepaar is, kon toetsers slegs 60% van die tyd korrek raai of hulle met 'n KI-stelsel praat.

Gegewe die vinnige vordering wat behaal is in die ontwerp van natuurlike taalverwerkingstelsels, kan ons sien dat KI binne die volgende paar jaar Turing se oorspronklike toets slaag.

Maar is die nabootsing van mense werklik 'n doeltreffende toets vir intelligensie? En indien nie, wat is 'n paar alternatiewe maatstawwe wat ons kan gebruik om KI se vermoëns te meet?

Beperkings van die Turing-toets

Terwyl 'n stelsel wat die Turing-toets slaag, ons gee sommige bewys dat dit intelligent is, is hierdie toets nie 'n beslissende toets van intelligensie nie. Een probleem is dat dit "vals negatiewe" kan produseer.

Vandag se groot taalmodelle is dikwels ontwerp om dadelik te verklaar dat hulle nie menslik is nie. Byvoorbeeld, wanneer jy ChatGPT 'n vraag vra, stel dit dikwels sy antwoord vooraf met die frase "as 'n KI-taalmodel". Selfs al het KI-stelsels die onderliggende vermoë om die Turing-toets te slaag, sal hierdie soort programmering daardie vermoë ignoreer.

Die toets waag ook sekere soorte “vals positiewes”. As filosoof Ned Block uitgewys in 'n 1981-artikel kan 'n stelsel moontlik die Turing-toets slaag bloot deur hardgekodeer te word met 'n mensagtige reaksie op enige moontlike insette.

Verder fokus die Turing-toets veral op menslike kognisie. As KI-kognisie van menslike kognisie verskil, sal 'n kundige ondervraer een of ander taak kan vind waar KI's en mense verskil in prestasie.

Oor hierdie probleem het Turing geskryf:

Hierdie beswaar is 'n baie sterk een, maar ten minste kan ons sê dat as, nietemin, 'n masjien gebou kan word om die nabootsingspel bevredigend te speel, ons nie deur hierdie beswaar gepla hoef te word nie.

Met ander woorde, terwyl die slaag van die Turing-toets goeie bewyse is dat 'n stelsel intelligent is, is dit nie goeie bewyse dat 'n stelsel nie nie slim.

Boonop is die toets nie 'n goeie maatstaf van of KI's bewus is, of hulle pyn en plesier kan voel, en of hulle morele betekenis het nie. Volgens baie kognitiewe wetenskaplikes behels bewussyn 'n spesifieke groep verstandelike vermoëns, insluitend om 'n werkende geheue, hoër-orde gedagtes en die vermoë om 'n mens se omgewing waar te neem en te modelleer hoe 'n mens se liggaam daarin beweeg, te hê.

Die Turing-toets beantwoord nie die vraag of KI-stelsels al dan nie oor hierdie vermoëns beskik.

KI se groeiende vermoëns

Die Turing-toets is gebaseer op 'n sekere logika. Dit wil sê: mense is intelligent, so enigiets wat mense effektief kan naboots, is waarskynlik intelligent.

Maar hierdie idee vertel ons niks oor die aard van intelligensie nie. ’n Ander manier om KI se intelligensie te meet, behels om meer krities te dink oor wat intelligensie is.

Daar is tans geen enkele toets wat kunsmatige of menslike intelligensie gesaghebbend kan meet nie.

Op die breedste vlak kan ons aan intelligensie dink as die vermoë om 'n reeks doelwitte in verskillende omgewings te bereik. Meer intelligente stelsels is dié wat 'n wyer reeks doelwitte in 'n wyer reeks omgewings kan bereik.

As sodanig is die beste manier om tred te hou met vooruitgang in die ontwerp van algemene KI-stelsels om hul prestasie oor 'n verskeidenheid take te assesseer. Masjienleer-navorsers het 'n reeks maatstawwe ontwikkel wat dit doen.

Byvoorbeeld, GPT-4 was korrek kan antwoord 86% van die vrae in massiewe multitaak-taalbegrip – 'n maatstaf wat prestasie op meerkeusetoetse oor 'n reeks akademiese vakke op universiteitsvlak meet.

Dit het ook gunstig aangeteken in AgentBench, 'n instrument wat 'n groot taalmodel se vermoë kan meet om as 'n agent op te tree deur byvoorbeeld op die web te blaai, produkte aanlyn te koop en in speletjies mee te ding.

Is die Turing-toets nog relevant?

Die Turing-toets is 'n maatstaf van nabootsing – van KI se vermoë om menslike gedrag te simuleer. Groot taalmodelle is kundige nabootsers, wat nou weerspieël word in hul potensiaal om die Turing-toets te slaag. Maar intelligensie is nie dieselfde as nabootsing nie.

Daar is soveel tipes intelligensie as wat daar doelwitte is om te bereik. Die beste manier om KI se intelligensie te verstaan, is om sy vordering met die ontwikkeling van 'n reeks belangrike vermoëns te monitor.

Terselfdertyd is dit belangrik dat ons nie aanhou om "die doelpale te verander" wanneer dit kom by die vraag of KI intelligent is nie. Aangesien KI se vermoëns vinnig verbeter, vind kritici van die idee van KI-intelligensie voortdurend nuwe take wat KI-stelsels kan sukkel om te voltooi - net om te vind dat hulle oorgespring het nog 'n hindernis.

In hierdie omgewing is die relevante vraag nie of KI-stelsels intelligent is nie - maar meer presies, wat soorte van intelligensie wat hulle mag hê.Die gesprek

Simon Goldstein, Medeprofessor, Dianoia Institute of Philosophy, Australiese Katolieke Universiteit, Australiese Katolieke Universiteit en Cameron Domenico Kirk-Giannini, Assistent Professor in Filosofie, Rutgers Universiteit

Hierdie artikel is gepubliseer vanaf Die gesprek onder 'n Creative Commons lisensie. Lees die oorspronklike artikel.