Kako ugotovimo, kateri tviti so verodostojni
Raziskovalci na Georgia Institute of Technology so razvili nov jezikovni model, ki prikazuje, katere besede in besedne zveze pozitivno ali negativno vplivajo na verodostojnost svetovnih dogodkov, o katerih poročajo na Twitterju.
Študija, ki je pregledala 66 milijonov tweetov v zvezi s skoraj 1.400 resničnimi dogodki, kaže, da lahko besede milijonov ljudi na družbenih omrežjih ponujajo precejšnje informacije o verodostojnosti dogodka, tudi če dogodek še traja.
"V zadnjih letih je bilo veliko raziskav o verodostojnosti družbenih medijev, vendar je zelo malo znanega o tem, katere vrste besed ali besednih zvez ustvarjajo zaznavanje verodostojnosti med hitro razvijajočimi se dogodki," je povedala Tanushree Mitra, dr. kandidat, ki je vodil raziskavo.
Skupina je preučevala tvite o svetovnih dogodkih v letih 2014 in 2015, med drugim o pojavu ebole v zahodni Afriki, napadu Charlie Hebdo v Parizu in smrti Erica Garnerja v New Yorku.
Raziskovalci so prosili ljudi, naj ocenjujejo objave glede na njihovo verodostojnost (od "zagotovo natančnih" do "zagotovo netočnih"). Nato je ekipa besede podala v model, ki jih je razdelil v 15 različnih jezikovnih kategorij. Klasifikacije so vključevale pozitivna in negativna čustva, žive meje in spodbujevalce ter tesnobo.
Nato je računalniški računalnik Georgia Tech preučil besede, da bi presodil, ali so tweetovi verodostojni ali ne. Približno 68 odstotkov časa se je ujemalo z mnenji ljudi, kar je odstotek, ki je bil bistveno višji od naključne izhodiščne vrednosti 25 odstotkov.
"Tviti z obnovitvenimi besedami, kot je" neizpodbitno ", in izrazi s pozitivnimi čustvi, kot sta" nestrpen "in" grozen ", so bili ocenjeni kot zelo verodostojni," je dejal Mitra. »Besede, ki kažejo na pozitivno razpoloženje, vendar se posmehujejo nepraktičnosti dogodka, na primer" ha "," nasmeh "ali" hecanje ", so bile videti manj verodostojne. Tako so bile tudi besede o varovanju, vključno z „določeno stopnjo“ in „osumljenci“. “
Večje število retweetov je bilo povezanih z nižjimi ocenami verodostojnosti.Verjeli so, da so odgovori in ponovni tweeti z daljšo dolžino sporočil bolj verodostojni.
"Mogoče je, da daljše dolžine sporočil zagotavljajo več informacij ali razlogov, zato se nanje gleda kot na bolj zaupanja vredne," je dejala. "Po drugi strani pa bi lahko večje število retvitov, ki so bili ocenjeni manj verodostojno, predstavljalo poskus izvabljanja kolektivnega sklepanja v času krize ali negotovosti."
Čeprav model še ni primeren, raziskovalci pravijo, da bodo sčasoma morda razvili aplikacijo, ki bo lahko izračunala zaznano zanesljivost dogodka, ko se bo razvijal na družbenih omrežjih.
"V kombinaciji z drugimi signali, kot so teme dogodkov ali strukturne informacije, bi lahko bil naš jezikovni rezultat pomemben gradnik avtomatiziranega sistema," je povedal dr. Eric Gilbert, Mitrin svetovalec in docent na šoli za interaktivno računalništvo Georgia Tech.
»Twitter je del problema s širjenjem neresničnih novic po spletu. Lahko pa je tudi del rešitve. "
Vir: Georgia Institute of Technology