Modrost (izbrane) množice
Vse več podjetij izkorišča modrost svojih strank in uporabnikov - zelo izbrana množica. To počnejo z "velikimi podatki" - zbirajo zakladnice anonimnih podatkov in nato na njih izvajajo post-hoc analize.
Ta napor lahko privede do nekaj zanimivih spoznanj. Podjetja lahko tudi kažejo, da so rezultati splošni za celotno populacijo.
In prav v tem zadnjem vprašanju je problem. Ker če začnete s samoizbranim vzorcem, so vaši podatki pomembni samo za ljudi, kot so oni, ne pa tudi za celotno populacijo. To je le ena od težav pri merjenju in ukrepanju na podlagi informacij izbrane množice.
Spletne strani že skoraj 20 let izvajajo meritve "velikih podatkov". Vsakič, ko obiščete spletno mesto, na strežniku spletnega mesta pusti majhno sled podatkov. Lastniki strežnika vzamejo te podatke in jih zaženejo prek platforme za analizo podatkov (na primer Google Analytics). Lastniku spletnega mesta daje zbirne informacije o vrstah ljudi, ki obiščejo njihovo spletno mesto.
Ker je vsako spletno mesto edinstveno, so takšni vpogledi pomembni samo za to spletno mesto. Uporabnik, ki na primer obišče CNN, ima lahko malo skupnega z uporabnikom, ki obišče Match.com.
Problem Izberite množice
Pri analizi podatkov statistiki takšno vzorčenje imenujejo »samoizbrani vzorec«, kar ima za posledico težavo »pristranskosti samoizbira«. Preprosto povedano, to pomeni, da ker vaši podatki prihajajo samo od ljudi, ki uporabljajo določeno aplikacijo ali vrsto družabnih medijev, niso reprezentativni za celotno populacijo. In ker ni reprezentativen za celotno populacijo, o podatkih ne morete posploševati.
Temu pravim problem "izbrane množice". Ker če pridobivate modrost iz množice, se raje prepričajte, da je množica reprezentativna za prebivalstvo, če poskušate iz nje pridobiti splošna spoznanja.
Obstajajo celotna podjetja, ki ne delajo nič drugega kot analizirati trende in podatke s Twitterja. Če pa pogledate, kdo uporablja Twitter - in kako ga uporabljajo - bi vas takoj zaskrbelo, kaj takšni podatki v resnici pomenijo. Uporabniki Twitterja so na primer veliko mlajši od splošne populacije, starejši pa so močno premalo zastopani. Če vodite podjetje, ki na Twitterju preučuje zdravstvene trende, boste videli nekaj povsem drugega, kot če bi izvedli naključno telefonsko anketo.
Z drugimi besedami, kateri trendi na Twitterju imajo ali ne smejo imeti pomena za 80+ odstotkov Američanov, ki Twitterja ne uporabljajo.
Aplikacije niso boljše
Aplikacije pogosto radi zbirajo uporabniške podatke, jih anonimizirajo in nato uporabijo za primerjavo vaše uspešnosti z drugimi, ki prav tako uporabljajo aplikacijo. Zaradi tega naj bi se počutili, kot da ste del socialnega omrežja, ki ima skupno aplikacijo. To je odlična ideja.
Kaj pa, če samo določena oseba uporablja to aplikacijo? Kaj pa, če samo depresivni ljudje uporabljajo aplikacijo za sledenje razpoloženju, ki naj bi pomagala ljudem dvigniti depresijo, tako da jim pomaga slediti njihovemu razpoloženju in primerjati njihov napredek z drugimi, ki prav tako uporabljajo aplikacijo? Takšni rezultati bi lahko bili sami po sebi nenamerno depresivni.
Ali lahko nekoga pozitivno motivirate s socialno primerjavo? Lahko, vendar prepogosto raziskave tudi kažejo, da takšne socialne primerjave povzročajo, da se ljudje počutijo slabše kot prej. To je treba storiti izjemno previdno - nekaj, kar večina tipičnih razvijalcev aplikacij ne razume.
Ne puščajte pomembnih stvari za merjenje
Vsaka aplikacija ali storitev je tako dobra kot vsebina, ki jo izbere za merjenje. Nepristranskost - namerno ali nenamerno - lahko v svoje rezultate vnesete tako, da se odločite za merjenje - in ne za merjenje.
Pomislite tako: razmišljate o selitvi v novo mesto z manj dežja, zato pogledate le povprečno letno količino dežja za različna mesta. Pogledali bi v mesto, kot je Miami, in pomislili: "Veste, ne selim se v Miami - na leto jih dežuje skoraj 62 centimetrov! Primerjajte to s pičlimi 37 centimetri dežja, ki ga dobi Seattle. Seattle mora biti bolj sončno, manj deževno mesto. " Ker v merjenje niste vključili drugih pomembnih meritev, bi napačno izbrali na podlagi preveč omejenih informacij.
Kaj razvijalec aplikacije ali spletnega mesta meni, da je pomembno pri merjenju nečesa, v resnici morda ni tako pomembno kot nekaj, kar so izpustili. Predstavljajte si aplikacijo, ki je merila le vaš odziv na zdravila, izpustila pa je vse druge pomembne dejavnike, ki prispevajo k vašemu razpoloženju in zdravljenju.
Zdravljenje ne poteka v vakuumu z vami in z enim samim zdravilom. Poteka v bogatem, zapletenem ekosistemu, ki lahko vključuje zdravila, vključuje pa tudi veliko drugih pomembnih stvari, s katerimi si pomagate pri okrevanju. Lahko je, koliko telovadite ali ne premišljujete, ali koliko dni preživite, ne da bi vas napasla panika, ali pa vas stisne družinski član ali delo.
Skratka, nešteto je stvari, ki bi jim morale slediti aplikacije in druge dobronamerne storitve, vendar se ne. In to daje izkrivljeno perspektivo, kako je nekaj, kar se meri, povezano z razpoloženjem ali napredkom okrevanja. Zdravila so resnično pomembna pri zdravljenju mnogih ljudi, vendar morda niso - in pogosto tudi niso - najpomembnejša.