gelukkig of hartseer 5 28

Dink aan wat jy vandag met Facebook met jou vriende gedeel het. Was dit gevoelens van "stres" of "mislukking", of dalk "vreugde", "liefde" of "opwinding"? Elke keer as ons op sosiale media plaas, verlaat ons spore van ons bui. Die gesprek

Ons emosies is waardevolle kommoditeite, en baie maatskappye ontwikkel outomatiese gereedskap om hulle te herken in 'n proses wat bekend staan ​​as sentimentanalise.

Onlangs 'n uitgelekte verslag geopenbaar dat Facebook kan identifiseer wanneer jongmense kwesbaar voel, alhoewel die maatskappy het het daarop aangedring dat dit nie die analise gebruik het nie Om gebruikers met advertensies te rig. Facebook ook verskoning gevra in 2014 vir 'n eksperiment op "emosionele besmetting" waarin poste met óf "positiewe" of "negatiewe" sentiment van gebruikersvoere gefiltreer is.

Dit is duidelik dat die vermoë om emosie uit teks op te spoor, van groot belang is vir sosiale media-maatskappye, sowel as adverteerders. Maar hoe werk sentimentanalise, hoekom is dit nuttig en wat is die gevare?

Hoe werk sentiment analise werk?

Alhoewel die besonderhede van Facebook se eie algoritme nie bekend is nie, val die meeste sentiment analise tegnieke in twee kategorieë: onder toesig of onopgedateer.


innerself teken grafiese in


Toesighoudende metodes maak staat op gelabelde data. Met ander woorde, dit is poste wat handmatig geklassifiseer is as positiewe of negatiewe sentiment.

Statistiese metodes word dan gebruik om modelle op te lei om nuwe plasings outomaties te klassifiseer gebaseer op die teenwoordigheid van vooraf geïdentifiseerde woorde of frases, byvoorbeeld "gestres" of "ontspanne".

Onbeheerde metodes, aan die ander kant, maak dikwels staat op die bou van 'n woordeboek van tellings vir verskillende woorde. Een so 'n woordeboek Ontwikkel deur my medewerkers het mense gevra om 'n 1 tot 9-gelukskaal te gee aan verskillende woorde, en dan die resultate: "reënboë", byvoorbeeld, het 8.06 behaal, terwyl "nutteloos" 2.52 kry.

 

Die algehele sentiment van 'n frase kan dan behaal word deur na al die woorde in die pos te kyk. Byvoorbeeld, die gemiddelde telling vir die pos: "My ma het altyd gesê 'die lewe is soos 'n boks sjokolade' 'is 'n bogemiddelde 6.02 volgens hierdie woordeboek, wat daarop dui dat dit 'n positiewe gevoel uitdruk.

Waarvoor word sentimentanalise gebruik?

Sentiment analise word toenemend deur bemarkers gebruik studeer neigings en maak produk aanbevelings.

Stel jou voor dat 'n nuwe selfoon vrygestel word; 'n sentiment analise van sosiale media poste oor die telefoon kan 'n maatskappy waardevolle, real-time insig gee in hoe dit presteer.

Daar is breër toepassings van sentimentanalise. Navorsers het onlangs het Donald Trump se Twitter-sentiment opgevolg oor die eerste 100-dae van sy presidentskap en gebou bots mark handel te plaas wanneer hy positief of negatief oor spesifieke maatskappye tweet.

Wetenskaplikes kan ook emosionele tendense in ander tekste volg. Byvoorbeeld, ons het sentimentanalise gebruik om die emosionele boë van meer as 1,000-films deur hul skerms te bestudeer. Die boog van die 2013 Disney-film Bevrore word hieronder getoon.

Emosionele boog vir die film Frozen.

Baie films wys soortgelyke patrone: gereelde pieke en trogs van spanning en vrylating, gevolg deur 'n besonder groot trog 80% van die pad deur die film (alle hoop is verlore!), Voor die finale besluit en gelukkige einde. Om 'n soortgelyke analise aan romans toe te pas, het ons dit gewys meeste stories volg een van ses basiese storieboë.

Ons is nog nie so goed in sentimentanalise nie

Aangesien sentimentanalise dikwels op sosiale mediaposte van mynbou staatmaak, is dit groot etiese kwessies, en hierdie debat begin eers. Tog maak die komplekse aard van taal en betekenis dit vatbaar vir foute.

Neem die frase, "Mag die krag by jou wees", wat 5.35 met behulp van ons woordeboek se analise bepaal. Vir enige Star Wars-fan is dit natuurlik 'n uiters positiewe frase, maar dit het beskeie in ons toets aangeteken omdat die woord "krag" 'n ondergemiddelde 4.0 is.

Dit is verstaanbaar wanneer u hierdie woord in isolasie gradeer, maar in konteks maak dit minder sin.

Sekere skeptisisme van die geldigheid van Facebook se sentimentanalise-vermoëns is dus geregverdig. Dit is heeltemal denkbaar om iets soos "heeltemal siek" op Facebook te beskryf, 'n frase van geslote endossement, kan lei tot 'n individu se emosionele staat wat verkeerd geklassifiseer word.

Om te verstaan ​​wanneer sentimentanalise wel en nie werk nie, is dit belangrik om die woorde wat spesifieke resultate uitoefen, te ondersoek.

Om dit te doen gebruik ons ​​"woord verskuiwing"Diagramme, soos die een hieronder vir bevrore. Dit toon aan watter woorde die klimaks van die draaiboek verdrietiger as sy gelukkige einde gemaak het: meer verwysings na "hartseer" en "vrees", maar vreemd, meer "mooi".

Plot vergelyk die klimaks van bevrore tot sy gelukkige einde. Die blou balke na die bokant van die grafiek toon die boonste bydraende woorde aan die verskil in telling.

Belofte en 'n waarskuwing

Sentimentanalise is 'n kragtige instrument, maar dit is slegs 'n jong wetenskap en moet met omsigtigheid gebruik word.

Wetenskaplikes moet gereedskap ontwikkel wat ons toelaat om onder die kap te kyk en verstaan ​​waarom sekere algoritmes die resultate lewer wat hulle doen. Dit is die enigste manier om probleme met verskillende metodes te diagnoseer, en belangriker om die publiek op te voed oor die moontlikhede en beperkings van die veld.

Sentimentanalise-navorsing is hoofsaaklik op groot, openbare datastelle gebou, veral uit sosiale media. Dit is belangrik dat diegene wat ons onbewus verskaf dat die data verstaan ​​wat dit kan en kan nie gebruik word nie, en hoe.

Oor Die Skrywer

Lewis Mitchell, dosent in Toegepaste Wiskunde, Universiteit van Adelaide. Michelle Edwards het bygedra tot hierdie artikel.

Hierdie artikel is oorspronklik gepubliseer op Die gesprek. Lees die oorspronklike artikel.

Verwante Boeke:

at InnerSelf Market en Amazon