aanlyn lê 6 29

Daar is drie dinge waarvan jy in die lewe seker kan wees: dood, belasting en leuens. Laasgenoemde blyk seker te wees uitgedruk deur die Verenigde Koninkryk se onlangse Brexit-referendum, met 'n aantal van die Verlaat veldtog se beloftes kyk meer soos Porkie pasteie as vaste waarhede.

Maar van die internet adverteer, visum aansoeke en akademiese artikels aan politieke blogs, versekeringseise en dating profiele, is daar talle plekke waar ons digitale leuens kan vertel. So, hoe kan 'n mens hierdie aanlynfibs opspoor? Wel, Stephan Ludwig van die Universiteit van Westminster, Ko de Ruyter van die City University, Londen se Cass Business School, Mike Friedman van die Katolieke Universiteit van Louvain, en joune het werklik 'n digitale leuenverklikker ontwikkel - en dit kan 'n hele leër van internet-onwaarhede ontbloot. .

In ons nuwe navorsing, het ons taalkundige aanwysings gebruik om tien duisende e-posse te vergelyk wat vooraf geïdentifiseer is as leuens met diegene wat bekend was om waarheid te wees. En uit hierdie vergelyking het ons 'n teksanalitiese algoritme ontwikkel wat misleiding kan opspoor. Dit werk op drie vlakke.

1. Woordgebruik

Sleutelwoordsoektogte kan 'n redelike benadering wees wanneer jy met groot hoeveelhede digitale data omgaan. Dus, ons het eers verskille in woordgebruik tussen die twee dokumentstelle ontdek. Hierdie verskille identifiseer teks wat waarskynlik 'n leuen bevat. Ons het gevind dat individue wat lieg, gewoonlik minder persoonlike voornaamwoorde gebruik, soos ek, jy, en hy / sy, en meer byvoeglike naamwoorde, soos briljant, vreesloos en subliem. Hulle gebruik ook minder eerste-persoon-enkelvoudse voornaamwoorde, soos ek, my, myne, met teenstrydigheid woorde, soos kan, moet, sou, sowel as meer tweede persoon voornaamwoorde (jy, jou) met prestasie woorde (verdien, held , wen).

Minder persoonlike voornaamwoorde dui op 'n skrywer se poging om hulself van hul woorde te onderskei, terwyl die gebruik van meer byvoeglike naamwoorde 'n poging is om van die leuen af ​​te lei deur 'n vlaag van oorbodige beskrywings. Minder eerste persoon enkelvoudse voornaamwoorde gekombineer met teenstrydigheid woorde dui op 'n gebrek aan subtiliteit en 'n positiewe selfbeeld, terwyl meer tweedepersoonlike voornaamwoorde gekombineer met prestasie woorde dui op 'n poging om platter ontvangers te kry. Ons het dus hierdie kombinasies van soekterme in ons algoritme ingesluit.


innerself teken grafiese in


2. Struktuur kontrole

Nog 'n deel van die oplossing lê in die ontleding van die afwyking van kognitiewe proseswoorde, soos oorsaak, want, weet en behoort - en ons het 'n verband tussen struktuurwoorde en leuens geïdentifiseer.

Lirieke kan nie misleidende e-posse uit die werklike geheue genereer nie, sodat hulle spontaneïteit vermy om opsporing te ontduik. Dit beteken nie dat leuenaars meer kognitiewe proseswoorde oor die algemeen gebruik as mense wat die waarheid vertel nie, maar hulle sluit hierdie woorde meer konsekwent in. Byvoorbeeld, hulle is geneig om elke sin na die volgende te koppel - "ons weet dit het gebeur as gevolg van hierdie, want dit behoort die geval te wees". Ons algoritme identifiseer sulke gebruik van proseswoorde in kommunikasie.

3. Kruis-e-pos benadering

Ons het ook bestudeer hoe 'n sender van 'n e-pos hul taalkundige styl verander en 'n aantal e-posse met iemand anders uitruil. Hierdie gedeelte van die studie het aan die lig gebring dat wanneer die uitruil aangaan, hoe meer die afsender geneig was om die funksie woorde te gebruik wat die ontvanger gebruik het.

Funksiewoorde is woorde wat bydra tot die sintaksis, of struktuur, eerder die betekenis van 'n sin - byvoorbeeld an, ek, na. En senders hersien die taalstyl van hul boodskappe om by die ontvanger te pas. As gevolg hiervan identifiseer en versamel ons algoritme sulke ooreenstemmende.

Opwindende aansoeke

Verbruikers waghonde kan hierdie tegnologie gebruik om 'n moontlike telling aan advertensies van 'n twyfelagtige aard te gee. Sekuriteitsmaatskappye en nasionale grensmagte kan die algoritme gebruik om dokumente te evalueer, soos visumaansoeke en landingkaarte, om die nakoming van toegangsregte en -reglemente beter te monitor. Sekretarisse van hoëronderwys eksamenkomitees en redakteurs van akademiese tydskrifte kan hul proefnemingsgereedskap verbeter om outomaties studentetoetse en akademiese artikels vir plagiaat te kontroleer.

Trouens, die potensiële toepassings gaan voort en aan. Politieke blogs kan hul sosiale media-interaksies suksesvol monitor vir tekstuele anomalieë, terwyl dating- en hersieningswebwerwe boodskappe kan klassifiseer wat deur gebruikers op grond van hul "moontliklêende" telling geskep is. Versekeringsmaatskappye kan beter gebruik maak van hul tyd en hulpbronne beskikbaar vir eis ouditering. Rekenmeesters, belastingadviseurs en forensiese spesialiste kan finansiële state en belastingaansoeke ondersoek en misleidende rookgewere vind deur middel van ons algoritme.

Mense is skrikwekkend om bewustelik misleiding te spoor. Inderdaad, menslike akkuraatheid wanneer dit kom by 'n leuen, is net 54%, skaars beter as kans. Ons digitale leuenverklikker is intussen 70% akkuraat. Dit kan aangewend word om bedrog te beveg, waar dit ookal in gerekenariseerde inhoud voorkom, en soos die tegnologie ontwikkel, kan die Pinocchio waarskuwings geheel en al geautomatiseerd word en die akkuraatheid daarvan sal nog verder toeneem. Net soos Pinocchio se neus reflektief weerspieël het, doen dit ook ons ​​digitale leuenverklikker. Fibbers pasop.

Oor Die Skrywer

Die gesprekTom van Laer, Senior Lektor in Bemarking, City University London

Hierdie artikel is oorspronklik gepubliseer op Die gesprek. Lees die oorspronklike artikel.

verwante Boeke

at InnerSelf Market en Amazon