Daboost / Shutterstock

Met die onlangse afdanking en vinnige heraanstelling van Sam Altman deur OpenAI, debatte rondom die ontwikkeling en gebruik van kunsmatige intelligensie (KI) is weer in die kollig. Wat meer ongewoon is, is dat 'n prominente tema in mediaberiggewing die vermoë van KI-stelsels om wiskunde te doen.

Blykbaar het van die drama by OpenAI verband gehou met die maatskappy se ontwikkeling van 'n nuwe KI-algoritme genaamd Q*. Daar is oor die stelsel gepraat as 'n beduidende vooruitgang en een van sy opvallende kenmerke was 'n vermoë om wiskundig te redeneer.

Maar is wiskunde nie die grondslag van KI nie? Hoe kan 'n KI-stelsel probleme ondervind met wiskundige redenasie, aangesien rekenaars en sakrekenaars wiskundige take kan verrig?

KI is nie 'n enkele entiteit nie. Dit is 'n lappieskombers van strategieë om berekeninge uit te voer sonder direkte opdrag van mense. Soos ons sal sien, is sommige KI-stelsels bekwaam in wiskunde.

Een van die belangrikste huidige tegnologieë, die groot taalmodelle (LLM's) agter KI-kletsbotte soos ChatGPT, het egter tot dusver gesukkel om wiskundige redenasie na te volg. Dit is omdat hulle ontwerp is om op taal te konsentreer.


innerself teken grafiese in


As die maatskappy se nuwe Q*-algoritme ongesiene wiskundige probleme kan oplos, kan dit goed wees 'n beduidende deurbraak wees. Wiskunde is 'n antieke vorm van menslike redenasie wat groot taalmodelle (LLM's) het tot dusver gesukkel om na te volg. LLM's is die tegnologie wat onderliggend is aan stelsels soos OpenAI se ChatGPT.

Ten tyde van die skryf daarvan is die besonderhede van die Q*-algoritme en sy vermoëns beperk, maar hoogs intrigerend. Daar is dus verskeie subtiliteite om te oorweeg voordat Q* as 'n sukses beskou word.

Wiskunde is byvoorbeeld 'n vak waarmee almal in verskillende mate besig is, en die vlak van wiskunde waarop Q* bekwaam is, bly onduidelik. Daar is egter gepubliseerde akademiese werk wat alternatiewe vorme van KI gebruik om navorsingsvlakwiskunde te bevorder (insluitend sommige geskryf deur myself, en een geskryf deur 'n span wiskundiges in samewerking met navorsers by Google DeepMind).

Hierdie KI-stelsels kan beskryf word as bekwaam in wiskunde. Dit is egter waarskynlik dat Q* nie gebruik word om akademici in hul werk te help nie, maar eerder vir 'n ander doel bedoel is.

Nietemin, selfs al is Q* nie in staat om die grense van voorpuntnavorsing te verskuif nie, is daar heel waarskynlik 'n mate van betekenis te vinde in die manier waarop dit gebou is wat prikkelende geleenthede vir toekomstige ontwikkeling kan skep.

Toenemend gemaklik

As 'n samelewing is ons toenemend gemaklik met spesialis-KI wat gebruik word om voorafbepaalde tipes probleme op te los. Byvoorbeeld, digitale assistente, gesig erkenning, en aanlyn aanbevelingstelsels sal aan die meeste mense bekend wees. Wat ontwykend bly, is 'n sg "kunsmatige algemene intelligensie" (AGI) wat breë redenasievermoëns het wat vergelykbaar is met dié van 'n mens.

Wiskunde is 'n basiese vaardigheid wat ons daarna streef om aan elke skoolkind te leer, en sal sekerlik kwalifiseer as 'n fundamentele mylpaal in die soeke na AGI. So hoe anders sou wiskundig bekwame KI-stelsels van hulp wees vir die samelewing?

Die wiskundige ingesteldheid is relevant vir 'n menigte toepassings, byvoorbeeld kodering en ingenieurswese, en dus is wiskundige redenering 'n noodsaaklike oordraagbare vaardigheid vir beide menslike en kunsmatige intelligensie. Een ironie is dat KI, op 'n fundamentele vlak, gebaseer is op wiskunde.

Byvoorbeeld, baie van die tegnieke wat deur KI-algoritmes geïmplementeer word, kom uiteindelik neer op 'n wiskundige area bekend as matriks algebra. 'n Matriks is bloot 'n rooster van getalle, waarvan 'n digitale beeld 'n bekende voorbeeld is. Elke pixel is niks meer as numeriese data nie.

Groot taalmodelle is ook inherent wiskundig. Gebaseer op 'n groot voorbeeld van teks, kan 'n masjien die waarskynlikhede leer vir die woorde wat is sal waarskynlik 'n opdrag (of vraag) van die gebruiker volg na die chatbot. As jy wil hê dat 'n vooraf-opgeleide LLM in 'n spesifieke onderwerp moet spesialiseer, kan dit fyn ingestel word op wiskundige literatuur, of enige ander leerdomein. 'n LLM kan teks genereer wat lees asof dit wiskunde verstaan.

Ongelukkig produseer dit 'n LLM wat goed is om te bluf, maar sleg met detail. Die probleem is dat 'n wiskundige stelling, per definisie, een is wat 'n ondubbelsinnige Boole-waarde (dit wil sê waar of onwaar). Wiskundige redenasie kom neer op die logiese afleiding van nuwe wiskundige stellings van dié wat voorheen vasgestel is.

duiwel se advokaat

Natuurlik gaan enige benadering tot wiskundige redenasie wat op linguistiese waarskynlikhede staatmaak, buite sy baan ry. Een manier om dit te omseil kan wees om een ​​of ander stelsel van formele verifikasie in die argitektuur in te sluit (presies hoe die LLM gebou is), wat voortdurend die logika agter die spronge wat deur die groot taalmodel gemaak word, nagaan.

'n Leidraad dat dit gedoen is, kan in die naam Q* wees, waarna waarskynlik kan verwys 'n algoritme het al in die 1970's ontwikkel om te help met deduktiewe redenasie. Alternatiewelik kan Q* verwys na Q-leer, waarin 'n model met verloop van tyd kan verbeter deur te toets vir en te beloon gevolgtrekkings wat korrek is.

Maar daar is verskeie uitdagings om wiskundig bekwame KI's te bou. Byvoorbeeld, sommige van die interessantste wiskunde bestaan ​​uit hoogs onwaarskynlike gebeure. Daar is baie situasies waarin 'n mens kan dink dat 'n patroon op klein getalle bestaan, maar dit breek onverwags af wanneer 'n mens genoeg gevalle nagaan. Hierdie vermoë is moeilik om in 'n masjien te inkorporeer.

Nog 'n uitdaging kan as 'n verrassing kom: wiskundige navorsing kan hoogs kreatief wees. Dit moet wees, want praktisyns moet nuwe konsepte uitvind en tog binne die formele reëls van 'n antieke vak.

Enige KI-metodologie wat slegs opgelei is om patrone in voorafbestaande wiskunde te vind, kan vermoedelik nooit werklik nuwe wiskunde skep nie. Gegewe die pyplyn tussen wiskunde en tegnologie, blyk dit dat dit die konsepsie van nuwe tegnologiese revolusies uitsluit.

Maar kom ons speel vir 'n oomblik duiwel se advokaat, en stel ons voor of KI wel nuwe wiskunde kan skep. Die vorige argument hierteen het 'n gebrek, deurdat daar ook gesê kan word dat die beste menslike wiskundiges ook uitsluitlik op voorafbestaande wiskunde opgelei is. Groot taalmodelle het ons al voorheen verras, en sal dit weer doen.Die gesprek

Tom oliver, Dosent, Rekenaarwetenskap en Ingenieurswese, Universiteit van Westminster

Hierdie artikel is gepubliseer vanaf Die gesprek onder 'n Creative Commons lisensie. Lees die oorspronklike artikel.