Veliki podatki: Ali lahko s pomočjo zdravstvenih aplikacij predvidimo trende prebivalstva (kot je sreča)?

Pred več kot petimi leti sem napisal članek z naslovom Zanesljivost in veljavnost v svetu Web 2.0. Govoril je o pomislekih glede zbiranja podatkov iz pristranskih vzorcev - ne da bi najprej razumeli, na kakšne načine so ti vzorci lahko pristranski.

Zdaj, ko se pojavljajo vseprisotne aplikacije - programi, ki jih je mogoče prenesti za pametne telefone ljudi -, vidim, da se pojavlja ista težava. Razvijalci in podjetniki iščejo podatke iz teh aplikacij, ne da bi razumeli osnove dobrega, zanesljivega in znanstvenega zbiranja podatkov. In zakaj je to pomembno - še posebej, ko začnete želeti analizirati vse te "velike podatke" (nekoliko neumen izraz ... na primer v epidemiologiji znanstveniki temu rečejo le "podatki").

Ali lahko te aplikacije zbirajo osebne zdravstvene podatke brez pristranskosti in jih nekako spremenijo v merjenje nečesa večjega?

Kratek odgovor: ne, ni lahko.

Seveda obstajajo ljudje, ki so del gibanja »kvantificiranega jaza« - ki želijo izslediti in izmeriti vse vidike svojega osebnega zdravja (in domnevno tudi duševnega zdravja). Toda ti ljudje so trenutno 1 izstopajoči in nikakor ne predstavljajo prebivalstva na splošno.

Takšne manjšine si lahko hitro večino prizadevajo zbrati večje nize podatkov, da bi analizirale trende na področju zdravja ali dobrega počutja. Medtem ko vam lahko analize, ki izhajajo iz tega, povedo nekaj o tej skupini ljudi, bi bilo neprimerno predlagati, da se posploši za preostalo populacijo (ki lahko demografsko in vedenjsko izgleda in deluje zelo drugače).

To se ne bo kmalu spremenilo, ker večino zdravstvenih aplikacij ljudje prenesejo, uporabijo enkrat ali dvakrat in nato opustijo. Obstaja razlog, da večina ljudi preneha uporabljati zdravstvene programe - zlasti tiste, ki naj bi delovali kot podatkovni dnevnik. Dolgčas so! Zbiranje podatkov o sebi je za nas večina le dolgočasna naloga, da se zavežemo k aktivnemu izvajanju vsak dan (ali celo vsak teden).

Zapleten odgovor: Aplikacije morajo biti pametnejše, povezane

Aplikacije za zdravje, namenjene zbiranju podatkov, na koncu ne uspejo, ker zahtevajo aktiven vnos uporabnika. To je razlog, zakaj se osebni zdravstveni zapisi v veliki meri nikoli niso odvzeli na noben smiseln način.2 Ljudje so preveč zaposleni, da bi živeli svoje življenje, da bi se mučili, če bi aplikaciji3 sporočali, kakšne so njihove dnevne meritve.

Da bi zdravstvene aplikacije na koncu uspele tam, kjer večina drugih poskusov programske opreme za osebno sledenje zdravju ni uspela, morajo pasivno zbirati svoje podatke. To pomeni, da uporabnik ne zahteva nobenega vnosa.

Seveda smo daleč od takšnih meritev, ki zagotavljajo pomembne podatke.Seveda obstajajo delujoče naprave, ki spremljajo, koliko tečete (seveda od Nike). Toda tekoča aplikacija je neuporabna, če se ne pogovarja z mojo dietno, prehransko ali vadbeno aplikacijo. Ali moja aplikacija za pozornost. To sem ena aplikacija, ki meri eno metriko v kompleksnem bitju. Preprosto ni veliko nadaljevati.

Zaupanje je ključni kamen

Sprejetje takih omrežnih aplikacij, ki si delijo vse vaše zdravstvene podatke, ima še eno, manj tehnično oviro - zaupanje. Podjetja, kot sta Facebook in Nike, na koncu odgovarjajo le enemu naboru ljudi - svojim delničarjem. To pomeni, da če bodo v njihovem najboljšem interesu analizirati vaše podatke za stvari, od katerih lahko zaslužijo, bodo to storili.

Startupi niso nič boljši, saj namesto delničarjev odgovarjajo le tveganim kapitalistom - posojilodajalcem, ki iščejo le najboljši in najhitrejši donos svoje naložbe.

Zakaj bi želel svoje zdravstvene podatke - podatke, ki bi jih lahko uporabili proti meni za prihodnjo zavrnitev zavarovanja ali določanje zavarovalnih stopenj - zaupati podjetjem, ki se malo zanimajo za zaščito moje zasebnosti?

Kar nas spet vrača na prvo točko - pristranski vzorec. Ljudje, ki z veseljem dajo vse svoje zdravstvene podatke neprofitnim podjetjem, da jih analizirajo, zberejo in sčasoma spet povežejo z vami (četudi so takšni podatki na začetku anonimizirani), niso večina ljudi. Večina nas še vedno skrbi za to, da svoje zdravstvene podatke hranimo zase, tako kot večina še vedno želi svoje finančne podatke obdržati zase.

Kam gremo od tu

Poskus zbiranja podatkov o prebivalstvu (npr. Izvajanje epidemioloških raziskav) iz zdravstvenih aplikacij ima nekaj težav in priložnosti, ki sem jih ugotovil:

  • Pristransko vzorčenje zaradi majhne manjšine ljudi, ki aktivno in neprestano uporabljajo zdravstvene programe
  • Vzorčenje in nadaljnjo uporabo bi lahko izboljšali z pasivno proti aktivno Zbiranje podatkov
  • Vzorčenje in uporabo bi lahko še izboljšali z uporabo zaupanja vrednega organa za zbiranje in shranjevanje podatkov (ne neprofitnega podjetja ali zagonskega podjetja)
  • Aplikacije, ki se med seboj zavedajo in si o meni izmenjujejo ustrezne zdravstvene podatke, so naslednja generacija - namesto trenutnega bogastva neobveščenih (neumnih?) Aplikacij

Mislim, da je super, da razvijalci pogledajo na zdravstveni problem, razvijejo zanj aplikacijo in jo objavijo po svetu. Toda te aplikacije prepogosto ne gredo nikamor, brez občinstva. Ali pa so siroti zaradi pomanjkanja zanimanja prvotni razvijalci. Nekaj ​​priljubljenih zdravstvenih aplikacij, ki pridobijo močno publiko, so izjema in ne pravilo. In tudi če so splošno sprejeti, tako kot naši elektronski sistemi zdravstvenih kartotek, se ne pogovarjajo.

Če želite povedati kaj avtoritativnega ali smiselnega o podatkih, zbranih v aplikaciji, morate pokazati, da podatki izhajajo iz reprezentativnega vzorca populacije. Če tega ne bi bilo, nam vaši podatki govorijo le o eni majhni skupini prebivalstva - tisti, ki ni videti kot večina izmed nas.

Opombe:

  1. In bo v bližnji prihodnosti [↩]
  2. In zakaj bo Google jutri končno zaprl svoj osebni zdravstveni karton. [↩]
  3. Ali še huje - in pogosteje - a celoten nabor aplikacij ki se ne zavedajo drugega in si ne morejo izmenjati podatkov med seboj [↩]

!-- GDPR -->