Praat met my rekenaar: stembeheer neem weg

As onverwagte pakkette by jou deur verskyn, wil jy dalk 'n woord met een van jou slim toestelle hê.

Vroeër hierdie maand het 'n sesjarige in Dallas haar familie gevra Amazon Echo slim spreker vir 'n poppenhuis. En Alexa, Amazon se Siri-agtige kunsmatige assistent, dadelik bestel een na hul huis.

'N San Diego TV-nuusskou het die storie opgetel en dit per ongeluk herhaal wanneer een van die nuusankers kommentaar gelewer het: "Ek is lief vir die klein dogtertjie, en sê:" Alexa gee vir my 'n poppenhuis. "" Oorverhoor dit, verskeie ander Amazon-toestelle in huise oor San Diego probeer om meer poppenhuise te koop.

CW6 San Diego nuusverslag oor Alexa se toevallige poppenhuis aankoop.

{youtube}oI2KLIULjXc{/youtube}

Die storie klink dalk bekend aan almal wat probeer het om met Apple se Siri of Microsoft se Cortana te praat. Ons toestelle het baie goed geword om na ons te luister, maar dit beteken nie altyd dat hulle verstaan ​​nie.

Navorsers by Microsoft het dit onlangs as 'n potensiële probleem aangewys met vandag se gespreksvlakke: hulle word bemark as "intelligente" assistente, met slim grappies en wêreldse kennis, maar hulle frustreer ons dikwels met hul gebrek aan gesonde verstand.


innerself teken grafiese in


in 'n klein studie, het die navorsers bevind dat die mense wat oor die tyd aan hul digitale assistente gesels het, diegene was wat met die laagste verwagtinge begin het.

Wat doen 'n stem koppelvlak eintlik?

As jy met 'n stemkoppelvlak praat, moet dit:

  • "Hoor" die geluid van jou stem en onderskei dit van agtergrond geraas
  • bepaal waar elke woord begin en eindig, ignoreer jou "umms" en "ahhs"
  • pas die klank van elke woord by 'n woord in die woordeboek, kies die regte een uit konteks as daar is homofone
  • interpreteer die betekenis van die hele sin korrek
  • Genereer 'n sinvolle en nuttige antwoord wat ooreenstem met jou versoek.

Elk van hierdie is 'n komplekse tegniese uitdaging, en verskillende tegnologie maatskappye het vordering gemaak in verskillende gebiede.

Google Nou is goed om relevante antwoorde te gee op 'n wye verskeidenheid versoeke omdat dit voordeel trek uit Google se trofee van data oor die web en jou persoonlike aktiwiteite, as jy Google-dienste gebruik.

Amazon Echo is besonder goed om jou versoeke te hoor van 'n luidruchtige kamer, danksy 'n geluid-kansellasie verre-veld mikrofoon skikking. Natuurlik is dit ook goed om aankope deur Amazon te maak.

Oor die afgelope paar jaar het steminterfaces veel beter geword in die verstaan ​​van alledaagse of "natuurlike" spraak, eerder as slegs stilstaande en versigtig bewoordde opdragte. Hulle is nog beter om eenvoudige navrae te hanteer, soos "wie speel in die Australiese Ope?", En is geneig om te sukkel met meer ingewikkelde versoeke, soos "wie speel die Australiese Ope vir die eerste keer vanjaar?" En opvolg vrae, soos "sal dit reën tydens die eindronde?".

Die situasie is selfs meer gemeng vir ander tale as Engels: terwyl Siri meer as 40 tale en dialekte ondersteun, is Alexa tot dusver slegs in Engels en Duits beskikbaar. Maar al hierdie eienskappe word geleidelik verbeter.

Waar stemvlakke stotter

Dus sal steminterfaces binnekort al ons tegnologie oorneem, soos voorspel in die film Haar? Gartner, 'n tegnologie-navorsingsfirma, het voorspel dat teen volgende jaar, 30% van ons interaksies met tegnologie gesprekke met stemgerigte koppelvlakke sal wees.

Maar stemvlakke het beperkinge, en nie almal kan deur beter tegnologie opgelos word nie.

Stem is 'n sentrale manier van interfacing met tegnologie in Spike Jonze se film haar.

{youtube}ne6p6MfLBxc{/youtube}

Ruisbesoedeling is een groot hindernis. Kan jou toestel onderskei wat jy van die agtergrondgeraas rondom jou sê? Tegnologie kan daarmee help, insluitende geluidsreduksie, persoonlike stemherkenning en liplees.

Maar wat van die agtergrond geraas wat jy skep vir ander deur te praat met jou slim toestel? Stel jou voor dat 'n persoon langs jou by die kantoor sit - of op 'n vliegtuig - met Siri gesels terwyl jy probeer lees, en jy kan sien waarom stemvlakke nie altyd sosiaal aanvaarbaar is nie.

Nog 'n stel probleme kom uit die verstandelike eise van stemvlakke. Leer om 'n stemgebaseerde stelsel te gebruik, kan moeilik wees, veral as daar geen skerm is nie, soos met Amazon Echo.

As jy ooit 'n bank of 'n telefoonmaatskappy opgeroep het, weet jy die ongelukkige kombinasie van konsentrasie en verveling wat voortspruit uit die luister na 'n gesintetiseerde stemlys, al jou opsies, terwyl jy wag vir die een wat jy nodig het en probeer om dit nie te meng nie. up. Tradisionele grafiese koppelvlakke vermy hierdie probleem deur u die beskikbare opsies te wys en u laat u keuse vinnig toe.

Nadat u stemopdragte geleer het, kan dit gebruik word om af te lei. Navorsers het daardie stemopdragte gevind ontspoor jou gedagtegang meer as 'n muis en sleutelbord.

Dit is veral gevaarlik vir in-kar stem interfaces: 'n paar studies van die Universiteit van Utah het bevind dat bestuurders was afgelei vir tot en met 27 sekondes na die gebruik van stemopdragte.

Universiteit van Utah / AAA Stigting vir Verkeersveiligheid navorsing oor bestuurder afleiding.

{vimeo}108281698{/vimeo}

Vind sy stem?

Dus stem interfaces sal waarskynlik nie heeltemal oorneem nie, maar hulle sal nuttige nisse in ons lewens vind. Hulle is reeds algemeen in motors, waar hulle hopelik minder afleidend sal word namate die tegnologie verbeter.

In die kombuis kan jy Alexa aanbeveel om jou deur 'n resep te praat of jou inkopielys by te werk terwyl jou hande besig is om te kook. In virtuele en versterkte realiteit kan stemvlakke jou die stelsel beheer wanneer jy jou hande glad nie kan sien nie.

In taalleer kan hulle gebruik word vir die beoefening van uitspraak. Belangriker nog, stem interfaces help gebruikers met motoriese gestremdhede, RSI of disleksie om hul gestremdhede te oorkom.

Stem interfaces is 'n lang verwagte tegnologie, en daar is goeie redes om te dink hulle tyd het uiteindelik gekom. Onthou net dat hulle nog nie so slim kan wees as wat hulle klink nie. En jy wil dalk 'n PIN-kode op stem aankope indien kinders daar is.

Die gesprek

Oor Die Skrywer

Fraser Allison, PhD Kandidaat in Mens-Rekenaarinteraksie, Universiteit van Melbourne

Hierdie artikel is oorspronklik gepubliseer op Die gesprek. Lees die oorspronklike artikel.

Related Items

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market en Amazon