AI kan 'n restaurant of 'n haarafspraak bespreek, maar verwag nie 'n volledige gesprek nie

AI kan 'n restaurant of 'n haarafspraak bespreek, maar verwag nie 'n volledige gesprek nie Seker dat u AI-assistent 'n afspraak vir u kan bespreek, maar wat van 'n sinvolle gesprek? Shutterstock / Bas Nastassia

Google onlangs onthul sy nuutste praat AI, genaamd Duplex. Duplex klink soos 'n regte persoon, kompleet met pouses, "umms" en "ahhs".

Die tegniese reus sê dit kan met mense op die telefoon praat om afsprake te maak en sake-ure oop te maak.

Duplex skeduleer 'n afspraak vir 'n haarsalon. Google445 KB (Aflaai)

In opgeneemde gesprekke wat tydens die onthulling van Google gespeel is, het dit naatloos met die mense gesels, wat heeltemal onbewus gelyk het dat hulle nie met 'n ander persoon praat nie.

Duplex bel 'n restaurant. Google399 KB (Aflaai)

Hierdie oproepe het die tegnologie-georiënteerde gehoor op die Google wys asem en juig. In een voorbeeld het die AI selfs verstaan ​​wanneer die persoon met wie hy gesels, deurmekaar geraak het, en hy kon voortgaan om die gesprek te volg en op die regte manier te reageer as daar gesê is dat hy nie nodig het om 'n bespreking te maak nie.

Die opkoms van die AI-assistente

As u een van die tans beskikbare stemassistente gebruik het, soos Google Home, Apple se Siri of Amazon Echo, kan hierdie buigsaamheid u dalk verras. Hierdie assistente is berug moeilik om te gebruik vir enigiets anders as die standaardversoeke, soos om 'n kontak te skakel, 'n liedjie te speel, 'n eenvoudige websoek te doen of 'n herinnering te stel.


Kry die nuutste van InnerSelf


As ons met die huidige generasiesassistente praat, is ons altyd bewus daarvan dat ons met 'n AI praat en ons pas dit wat ons sê, op 'n manier wat ons hoop, maksimeer ons kanse om dit te laat werk.

Maar die mense wat met Duplex gesels het geen idee nie. Hulle het gehuiwer, agteruitgegaan, woorde oorgeslaan en selfs feite deurgaans deur 'n sin verander. Duplex het nie 'n maat mis nie. Dit het gelyk asof dit verstaan ​​wat aangaan.


Lees meer: Slim luidsprekers kan die punt wees vir tuisautomatisering


Het die toekoms dus vroeër aangebreek as wat iemand verwag het? Is die wêreld op die punt om vol aanlyn (en telefonies) AI-assistente te gesels wat gelukkig is en alles vir ons doen? Of, nog erger, sal ons skielik omring word deur intelligente AI's met hul eie gedagtes en idees wat ons as mense insluit, al dan nie?

Die antwoord is 'n definitiewe 'nee'. Om dit te verstaan, help dit om vinnig onder die enjinkap te kyk na wat die AI soos hierdie dryf.

Duplex: hoe dit werk

Dit is wat die Duplex AI-stelsel lyk soos.

tegnologie Inkomende klank word deur 'n ASR-stelsel verwerk. Dit lewer teks op wat met konteksgegewens en ander insette geanaliseer word om 'n antwoordsteks te lewer wat hardop deur die teks-tot-spraak-stelsel (TTS) gelees word. Google

Die stelsel neem 'invoer' (links) wat die stem is van die persoon met wie hy / sy praat. Die stem gaan deur outomatiese spraakherkenning (ASR) en word omgeskakel in teks (geskrewe woorde). Die ASR is self 'n gevorderde AI-stelsel, maar van 'n tipe wat reeds in algemene gebruik by bestaande stemassistente gebruik word.

Die teks word dan geskandeer om te bepaal watter tipe sin dit is (soos 'n groet, 'n stelling, 'n vraag of 'n opdrag) en haal belangrike inligting uit. Die sleutelinligting word dan deel van die konteks, wat ekstra insette is wat die stelsel op datum hou met wat tot dusver in die gesprek gesê is.

Die teks uit die ASR en die konteks word dan na die hartjie van Duplex gestuur, wat 'n kunsmatige neurale netwerk (ANN) genoem word.

In die diagram hierbo word die ANN getoon deur die sirkels en die lyne wat hulle verbind. ANN's word losweg volgens ons brein gemodelleer, wat miljarde neurone aan mekaar verbind in enorme netwerke.

Nog nie 'n brein nie

ANN's is egter baie eenvoudiger as ons breine. Die enigste ding wat hierdie een probeer doen, is om die invoerwoorde met 'n gepaste antwoord te pas. Die ANN leer deur transkripsies van duisende gesprekke van mense wat vir restaurante bespreek, getoon word.

Met genoeg voorbeelde leer dit watter soorte inset sinne u kan verwag van die persoon met wie hy praat, en watter soorte antwoorde om vir elkeen te gee.

Die teksrespons wat die ANN genereer, word dan na 'n teks-na-spraak (TTS) sintesiseerder gestuur, wat dit omskakel in gesproke woorde wat dan na die persoon op die telefoon gespeel word.

Hierdie TTS-synthesizer is weereens 'n gevorderde AI - in hierdie geval is dit meer gevorderd as die van u selfoon, want dit klink amper van 'n normale stem af.

Dit is al wat daarvoor is. Ondanks die feit dat dit moderne is, is die hart van die stelsel eintlik net 'n teksaanpassingsproses. Maar u kan vra: as dit so eenvoudig is, waarom kon ons dit nie voorheen doen nie?

'N Geleerde reaksie

Die feit is dat menslike taal, en die meeste ander dinge in die regte wêreld, te wisselend en wanordelik is om deur gewone rekenaars goed te hanteer, maar hierdie soort probleme is ideaal vir AI.

Let daarop dat die uitset wat deur die AI geproduseer word, geheel en al afhang van die gesprekke wat tydens die aanleer van die skerm vertoon is.

Dit beteken dat verskillende AI's opgelei moet word om verskillende soorte besprekings te maak - so kan een AI byvoorbeeld restaurante bespreek en 'n ander haarafsprake kan bespreek.

Dit is nodig omdat die tipe vrae en antwoorde soveel kan verskil vir verskillende soorte besprekings. Dit is ook hoe Duplex soveel beter kan wees as die algemene stemassistente, wat baie soorte versoeke moet hanteer.

Dit wil dus voorkom asof ons nie binnekort toevallige gesprekke met ons AI-assistente gaan voer nie. In werklikheid is al ons huidige AI's eintlik niks meer as patroonbypassers nie (in hierdie geval is dit ooreenstem met tekspatrone). Hulle verstaan ​​nie wat hulle hoor nie, waarna hulle kyk of wat hulle sê nie.

Patroonpassing is een ding wat ons brein doen, maar hulle doen ook soveel meer. Die sleutel tot die skep van kragtiger AI kan wees om meer van die brein se geheime te ontsluit. Wil ons? Wel, dit is nog 'n vraag.Die gesprek

Oor Die Skrywer

Peter Stratton, postdoktorale navorsingsgenoot, Die Universiteit van Queensland

Hierdie artikel is gepubliseer vanaf Die gesprek onder 'n Creative Commons lisensie. Lees die oorspronklike artikel.

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

volg InnerSelf op

Facebook-ikoonTwitter-ikoonrss-ikoon

Kry die nuutste per e-pos

Emailcloak = {af}

UIT DIE REDAKTEURS

InnerSelf Nuusbrief: September 6, 2020
by InnerSelf Personeel
Ons sien die lewe deur die lense van ons persepsie. Stephen R. Covey het geskryf: "Ons sien die wêreld nie soos dit is nie, maar soos ons is──of, soos ons gekondisioneer is om dit te sien." Hierdie week kyk ons ​​na 'n paar ...
InnerSelf Nuusbrief: Augustus 30, 2020
by InnerSelf Personeel
Die paaie waarop ons deesdae ry, is so oud soos die tye, maar tog is dit nuut vir ons. Die ervarings wat ons beleef, is net so oud soos die tyd, maar tog is dit ook nuut vir ons. Dieselfde geld vir die ...
As die waarheid so verskriklik is, is dit seer, neem dan aksie
by Marie T. Russell, InnerSelf.com
Te midde van al die gruwels wat deesdae plaasvind, word ek geïnspireer deur die hoopstrale wat deurskyn. Gewone mense staan ​​op vir wat reg is (en teen wat verkeerd is). Baseball spelers, ...
As jou rug teen die muur is
by Marie T. Russell, InnerSelf
Ek is mal oor die internet. Nou weet ek dat baie mense baie slegte dinge daaroor te sê het, maar ek is mal daaroor. Net soos ek die mense in my lewe liefhet - hulle is nie perfek nie, maar ek is in elk geval lief vir hulle.
InnerSelf Nuusbrief: Augustus 23, 2020
by InnerSelf Personeel
Almal kan waarskynlik saamstem dat ons in vreemde tye leef ... nuwe ervarings, nuwe houdings, nuwe uitdagings. Maar ons kan aangemoedig word om te onthou dat alles altyd in vloei is, ...