Slabe raziskave: priljubljeni pogoji iskanja po spolu

Ljudje imajo radi seks. Seks jim je tako všeč, veliko časa ga preživijo v spletu. Pojdi na sliko. (Lahko rečete, da se bom tukaj poglobil v resnično visoke, drobne stvari ...)

Raziskovalca Ogi Ogas in Sai Gaddam sta nedavno izdala knjigo, Milijarda hudobnih misli, v katerem so podrobno analizirali 400 milijonov iskanj, ki so jih zbrali z iskalnikom Dogpile. Od teh 400 milijonov iskanj je bilo 13 odstotkov (55 milijonov) erotičnih vsebin.

Kako se je razkrojilo teh 55 milijonov iskanj? Ugotovimo ... vendar poglejmo tudi metodologijo teh raziskovalcev, da ugotovimo, ali so njihove ugotovitve vredne papirja, na katerem so natisnjene. (Če menite, da ne, imate verjetno prav.)

Torej, kaj iščejo ljudje na Dogpileju, ko gre za spolne interese. Spodnji izrazi so splošna kategorija iskanja tega zanimanja, ki vključuje vse vrste permutacij izrazov. Te permutacije (na primer "joške" za prsi) niso navedene spodaj; uporabite domišljijo.

  1. Mladina - 13,5 odstotka
  2. Gej - 4,7 odstotka
  3. MILF-ji (Mati, ki bi si želela F ***) - 4,3 odstotka
  4. Dojke - 4,0 odstotka
  5. Varanje žena - 3,4 odstotka
  6. Vagine - 2,8 odstotka
  7. Penisi - 2,4 odstotka

Smeti noter, smeti ven

V računalniškem programiranju je star rek - GIGO: Garbage In, Garbage Out. Enako dobro velja za vsako znanstveno prizadevanje, ki je enako dobro kot podatki, ki ste jih izbrali za analizo. Če začnete z naborom vprašljivih posploševalnosti ali vrednosti, boste morda našli zaključke, ki so malo povezani z resničnostjo.

V tem primeru obstaja velika težava z raziskovalnimi podatki, ki so jih zbrali ti raziskovalci. Ne prihajajo iz Googla ali celo Binga. Prihajajo iz malo znanega iskalnika, imenovanega "Dogpile", ki niti ni iskalnik. Dogpile je preprosto agregacijski mehanizem rezultatov iskanja iz Googla, Yahooja in Binga (ker Bing zdaj Yahooju posreduje podatke o iskanju, nisem prepričan, zakaj še vedno obstaja ta razlika).

To ni enako iskanju v Googlu prek Google.com ali iskanju v Bingu prek Bing.com. Pravzaprav morate obiskati spletno mesto Dogpile, da dobite te rezultate - rezultate, ki so oblikovali nabor podatkov za sedanje raziskovalce. Če iščete na spletnem mestu Google.com, ti raziskovalci ne bi analizirali vašega iskanja (kar je smiselno, saj Google in Bing raziskovalcem ne data na voljo podatkov, ki jih zbereta o iskanju).

Dogpile je verjetno malo uporabljen zaradi dejstva, da sponzorirane iskalne oglase pomeša z organskimi rezultati iskanja, tako rekoč brez vizualne podobe. Droben odtis na koncu vsakega rezultata iskanja vas obvesti, ali gre za "sponzoriran" rezultat ali ne - npr. Za oglas. Pri iskanju "depresije" na Dogpileu je bilo 14 od prvih 20 rezultatov iskanja oglasov - ni ravno nekaj, s čimer bi se večina navadnih ljudi zelo dolgo sprijaznila.

Ljudje, ki iščejo spletne vsebine, so se že dolgo odločili, da opustijo uporabo iskalnikov, ki poskušajo oglaševanje pomešati z dejanskimi rezultati. Razlog je preprost - ljudje bodo kliknili oglas, ko jih zanima izdelek ali storitev, ki jih ponuja. Ne marajo, da jih navajajo, da kliknejo tisto, kar se jim je zdelo rezultat iskanja, le da ugotovijo, da gre za preoblečen oglas.

Kdo torej uporablja Dogpile? Kdo ve, zagotovo pa verjetno ne bo običajni uporabnik interneta. Medtem ko več kot 150 milijonov ljudi uporablja Google in 90 milijonov uporablja Bing.com, Dogpile-ovih 2-3 milijona ljudi na mesec bledi v primerjavi in ​​je veliko manj kot 0,05 odstotka celotnega trga iskalnikov.

Ali lahko izvedete anketo na tako majhnem naboru podatkov in poskusite uporabiti dim in ogledala, da se vam zdi, kot da ste dejansko opravili enako revolucionarno raziskavo, kot jo je Kinsey Institute v petdesetih in šestdesetih letih? Seveda lahko.

Ogi Ogas in Sai Gaddam sta na primer povedala, da sta analizirala 400 milijonov spletnih iskanj. Toda primerjajte to številko s 3 milijardami iskanj, ki jih izvajajo vsak dan, po poročanju spletnega analitičnega podjetja Hitwise. Naenkrat 400 milijonov - čeprav je v vakuumu na videz impresivno število - izgleda precej manj impresivno, če jih postavimo v nekakšen podatkovni kontekst. 400 milijonov iskanj je enako številu opravljenih v približno 3 urah. V enem dnevu.

Kontekst je seveda vse, kar zadeva nabore podatkov, zlasti kadar so ti nabori podatkov pristranski na načine, ki se jih niste nikoli trudili raziskati. V tem primeru je nabor podatkov pristranski zaradi uporabe iskalnika Dogpile - drobnega, nišnega iskalnika, ki ga določena podskupina prebivalstva, ki se razlikuje od ostale populacije, bolj verjetno kot ne.

Torej vzemite ta seznam z rezervo. Zanimivo je, vendar nisem prepričan, da odraža splošno populacijo. In vsekakor se ne splača kupiti celotne knjige, ki se poglobi v ta napačen nabor podatkov.

!-- GDPR -->