Kaikki valehtelevat ja Google tietää sen

Stephens-Davidowitz has used data from the internet — particularly Google searches — to get new insights into the human psyche

En ole viime aikoina jaksanut kauheasti lukea, mutta nyt päätin ottaa äänikirjana kuuneltavaksi Seth Stephens-Davidowitzin tuoreen bestsellerin Everyboy lies. Kirjan loppupuolella Davidowitz mainitsee esikuvakseen Steve Levittin sekä Freakonomicsin ja vähän samanlaisesta menosta tässäkin kirjassa on kyse. Osoitetaan suurelle yleisölle viihteellisellä tavalla, kuinka data ja kvantitatiiviset menetelmät voivat tuoda yllättävillä tavoilla uutta ja mielenkiintoista tietoa moniin asioihin.

Mutta nyt reilu 10 vuotta Freakonomicsin jälkeen tutkimusaineistot on kerätty netistä ja ne ovat vähän eri kokoluokkaa kuin vielä 2000-luvun alussa. Buzzword Big dataa on käytetty viime vuodet tarpeettomankin paljon, mutta kuten monissa trendisanoissa, tässäkin on taustalla ihan oikeasti merkittävä ilmiö. Se että virtuaalimaailmassa monia asioita on helppo mitata täsmällisesti ja kehittynyt teknologia mahdollistaa muuallakin uudenlaisen asioiden kvantifioimisen, on  iso juttu.

Kuvahaun tulos haulle everybody lies davidowitz

Davidowitz tajusi useimpia muita aiemmin jo lähes vuosikymmen sitten, että Googlen valtaisat datamassat ihmisten rehellisistä ja suodattamattomista nettihauista tuottavat uudella tavalla mieleniintoisen ikkunan maailman, johon perinteisillä kyselytutkimuksilla ei olla päästy. Kirjoittajamme menee jopa niin pitkälle, että pitää Google-hakuja kaikkien aikojen parhaana tutkimusmaterialina, eikä tuo välttämättä edes ole kauhean suurta liioittelua.

Ihmisillä on usein jopa nimettömissä kyseilyissä taipumuksena vältetellä ikävien totuuksien kertomista itsestään ja liioitella positiivisia juttuja. Toki Google-hakujen yhteydessä mahdollisesti painottuvat asiat, joista ei kehdata keskustella muiden ihmisten kanssa ja tämä on kirjoittajankin myöntämällä tavalla syytä ottaa huomioon.

Kirjan työnimenä oli How big is my penis ja kirjassa on aika paljon seksuaalisuuteen ja pornoon liittyviä juttuja. Se että miehet tekevät ihan helvetisti penikseen kokoon liittyviä hakuja ja naiset googlailevat järjettömästi alapäähänsä, perseeseen ja tisseihin liittyviä asioita, ei ole kauhean yllättävää, mutta onpahan tuokin nyt todistettu. Davidowitz pääsi kuitenkin käsiksi myös PornHubin dataan. Erilaisten fetissien yleisyys ja esimerkiksi se, että yllättävän monet naiset katselevat väkivaltaista tai rajusti naisia alistavaa pornoa, on ihan mielenkiintoista, mutta tuo data toi valoa myös muihin keskusteluihin.

Esimerkiksi Yhdysvalloissa konservatiivisten ja liberaalien osavaltioiden välillä on monia tutkimuksia katsottaessa aika isoja eroja siinä, kuinka paljon näissä on homoja. Mutta jos katsotaan tilastoja homopornon katsomissta netissä, katoavat konservatiivisten ja liberaalien osavaltioiden erot lähes kokonaan. Molemmissa tapauksissa homoseksuaaleja näyttäisi olevan noin 5% väestöstä.

Pornoon liittyvät haut näyttävät myös korreloivan hyvin vahvasti työttömäksi päätymisen kanssa, oletettavasti sen seurauksena pornon katselu on niitä asioita, johon työttämäksi jäänet alkavat kasvanutta vapaa-aikaansa käyttää. Jos siis yrittää ennakoida työttömyyslukuja ennen kuin ne on virallisesti raportoitu, kannattaa ilmeisesti yhtenä mallin muuttujana käyttää pornoon liittyvien hakujen määrässä tapahtuneita muutoksia.

Kirjan alkupuolella esitellään myös kuinka huolestuttavan yleisiä erilaiset negatiivisia stereorypioita vilisevät nigger-haut olivat “rasismin-jälkeisellä” Obaman aikakaudella ja kuinka vahvasti Trumpin esivaalimenestys korreloi rasististen hakujen alueellisen jakauman kanssa. Nimenomaan esimerkiksi erilaisia rasistisia ennakkoluuloja ei helposti tuoda esiin edes anonyymeissä kyselyissä, mutta Google-hakuja tehtäessä tätä ei mitenkään piilotella. Hieman häiritsevää oli myös sinänsä ei niin yllättvä tieto, että osavaltioissa ja alueilla, joissa abortin hankkiminen on erityisen vaikeaa, googletaan selvästi enemmän tietoa henkarilla tehtävästä oman käden abortista.



Välillä tuntui, että tässä kirjassa yritettiin vähän itsetarkoituksellisesti käyttää rajuja esimerkkejä aihepiireistä, jotka herättävät paljon tunteita. Tuo oli kuitenkin napakka ja viihdyttävä kokonaisuus, jota voi suositella jos etsii vähän kevyempaa luettavaa big datan liittyen.

Big datan pimeä puoli – Weapons of math Destruction, Cathy O’Neil

Leave a Reply

Your email address will not be published. Required fields are marked *