Rss

  • linkedin

Archives for : Tutkimukset

Mihin voi luottaa informaatioähkyn keskellä?

Internet on tiedon valtatie. Mutta valitettavasti se on myös temmellyspaikka monenkirjavien totuutena myytävien uskomusten levittäjille.

Tim Ferriss kirjoitti kirjassaan ”The 4-Hour Workweek”, kuinka yksi keino hankkia lisätuloja on alkaa asiantuntijaksi. Ferrissin mukaan 4 viikkoa riittää asiantuntijastatuksen haalimiseen uudella alalla. Tosin ei niin hyvän, että saisi kunnioitusta kyseisen alan oikeilta asiantuntijoilta, mutta sellaisen uskottavuuden että voi muodostaa riittävän suuren asiakaskunnan ihmisistä, jotka eivät tunne alaa.

Omalta erikoisalaltaan osaa erottaa juttujen sisällön perusteella nämä puoskarit tohtoreista, mutta entä kun puhe on aiheesta, josta itsellä ei ole kummoisia taustatietoja? Mihin tietoon tässä maailmassa voi luottaa?

Tieteellinen prosessi

Tiedon etsimisessä ei voi täysin nojautua yksittäiseen tutkimukseen. Yksittäisen tutkimuksen lopputulos voi osua harhaan monestakin syystä ja useamman vuoden vanha tutkimus on voitu jo kumota uusimmissa tutkimuksissa. Sen sijaan julkaisujen sarjasta koostuva tieteellinen prosessi johtaa pikkuhiljaa aina vaan lähemmäksi totuutta. Tieteellisen prosessiin kuuluu, että koko ajan mennään eteenpäin ja pyritään etsimään virheitä vanhoista omista olettamuksista. Hyvä tapa aloittaa uuteen aiheeseen tutustuminen on etsiä viimeisin review-artikkeli, joka kokoaa yhteen, mitä tähän mennessä eri tutkijat ovat löytäneet.

Uutisointi

Monessa muussa asiassa niin hyvin toimiva markkinatalous tuntuu yskivän tiedon levityksessä. Yliampuvat shokkiuutiset ja liian yksinkertaiset ratkaisut monimutkaisiin ongelmiin myyvät paremmin kuin analyyttinen asioiden punnitseminen eri näkökulmista. (Ketosen ja Myllyrinteen tiivistys). Tämä siitä huolimatta, että perusteellisesti analysoidun tiedon tehokkaampi leviäminen auttaisi meitä kaikkia tekemään parempia päätöksiä, joilla voisi nostaa itsemme ja läheistemme terveydellistä + taloudellista hyvinvointia.

Päivittäisen uutisvirran seuraaminen voi olla jopa haitallista asioiden ymmärtämisen kannalta, mitä tässä kirjoituksessa hyvin perustellaan. Itse pyrin seuraaman maailman menoa hieman suodatettuna niin että luen uutisen netistä vasta kun joku analyyttisena pitämäni Twitter-seurattava kommentoi uutista mielenkiintoisena.

Twitterissä olen kokenut hyödylliseksi seurattavaksi myös vahvan tieteellisen taustan omaavat aktiiviset ”bull shit detectorit” (esim. Markku Niemivirta @mniemivirta) ja harhaanjohtavalta otsikoinnilta suojelijat (esim. @klikinsaastaja).  Nämä säästävät omaa aikaani harhaanjohtavien uutisten lukemiselta.

Tieteellistä lähestymistapaa uutisten käsittelyyn edustaa nettisivusto Rootclaim. Kun maailmalla on tapahtunut jotain, jossa totuutta on vaikea hahmottaa kaikkien asian ympärillä pyörivien huhujen joukosta, Rootclaim ottaa asian punnittavaksi. Jäsenet muodostavat kilpailevia hypoteeseja vaihtoehtoisista totuuksista ja kokoavat yhteen tiedonmurusia asian ympärillä eri lähteistä. Lopputuloksena on Bayesläisen päättelyn tuloksena todennäköisyydet eri hypoteesien todennäköisyyksille. Kuka tahansa voi osallistua prosessiin tiedottamalla uusista tiedonjyväsistä ja todennäköisyydet sitä mukaa päivittyvät. Tällä hetkellä sivustolla punnitaan ainakin Malesialaisen lentokoneen katoamista, rokotteiden sivuvaikutuksia ja Syyriassa tapahtunutta kemiallista asehyökkäystä.

Vedonlyönti

Put your money where your mouth is or shut up.

Ne ketkä oikeasti ymmärtävät asioista, voivat myös lyödä vetoa näkemystensä puolesta. Silloin kun vedonlyönti on mahdollista, erinomainen näyttö ymmärtämisestä on voitollisen vedonlyöntihistorian esittely. Tosin tässä kirjoituksessani kävi ilmi että vetoja pitää löytyä aika paljon historiasta, että sillä voisi tilastollisesti osaamisensa todistaa. Kuitenkin jos on edes valmis laittamaan rahaa likoon näkemyksensä puolesta pelkän leukojen loksuttamisen sijaan, on se jo merkki uskottavuuden suuntaan.

Vedonlyöntikulttuuri kukoistaa penkkiurheilijoiden keskuudessa ja talousasioissa voi ottaa näkemystä joko osake- tai johdannaismarkkinoilla. Vedonlyöntifirmat ottavat myös kiitettävästi vetoja vastaan poliittisista vaaleista. Kaipaisin kuitenkin lisää herrasmiesvedonlyöntikulttuuria muillekin elämän osa-alueille. Silloin erimieltä olevien ei tarvitsisi loputtomasti jankuttaa SoMessa vaan sopia aiheeseen liittyvä veto ja jatkaa elämää. Vetojen lopputulokset kun vielä päivittyisivät julkiselle sivustolle niin pikkuhiljaa vetojen kertyessä alkaisi hahmottumaan, kuka on vahvemmin ja kuka heikommin asian ytimessä.

Asiantuntijoiden nahka

Kun ottaa neuvoja vastaan asiantuntijalta tai sellaisena esiintyvältä, pitää aluksi varmistaa missä pelissä tällä henkilö on niin sanotusti oma nahka pelissä (”skin on the game”). Varsinkin jos henkilö saa kaikki tulonsa yhdestä lähteestä, ensisijainen peli hänellä on työpaikkansa ja asemansa säilyttäminen. Esim. apteekkarilta voi saada hyvän näkemyksen siihen, mitä lääkkeitä eniten myydään. Sitten kun pohdinnan alla on apteekkimonopolin hyödyllisyys yhteiskunnalle, voi näkemys olla vähän yksipuolinen. Eikä kannata odottaa, että rivityöntekijätkään purevat ainoaa ruokkivaa kättä.

Asiantuntijalta kannattaa myös muotoilla kysymykset sellaiseen muotoon, missä vahvasti tuodaan hänen omaa nahkaansa peliin. Esim. kilpailevista hoitomuodoista voi kysyä lääkäriltä muodossa: ”Millä menetelmällä hoitaisit tällaisessa tapauksessa itseäsi / lastasi?

Superennustajien ominaisuudet

Philip E. Tetlockin ja Dan Gardnerin kirjoittamassa ja Terra Cognitan suomentamassa kirjassa Superennustajat kerrotaan ”Good Judgment” – tutkimusprojektista, jossa lukuisat tavalliset ihmiset tekivät ennusteita mitä erilaisista tulevaisuuden tapahtumista, kuten poliittisten konfliktien tai taloudellisten tunnuslukujen kehittymisestä. Hieman yllättävä tulos oli, että tietyt samat henkilöt vuodesta ja aiheesta toiseen erottuivat muista edukseen. Kirjoittajien mukaan vieläpä paljon paremmin kuin mitä pelkkä sattuma antaisi odottaa. Näitä tutkimuksen kestomenestyjiä kirjoittajat kutsuvat superennustajiksi. Ammatillisen taustan suhteen superennustajilla ei ollut mitään yhteistä selittäjää, mutta seuraavia yhteisiä taipumuksia heistä löytyi maailmankatsomuksen, kykyjen ja ajattelutapojen suhteen:

  • Varovainen (mikään ei ole varmaa)
  • Nöyrä (todellisuus on äärettömän monimutkainen)
  • Epädeterministinen (tapahtuva ei ole ennalta määrätty, eikä sen tarvitse tapahtua)
  • Aktiivisesti mieleltään avoin (uskomukset ovat testattavia hypoteeseja, eivät suojattavia aarteita)
  • Älykäs ja tietävä jolla on ”tunnustuksen” saamisen tarve (älyllisesti uteliaita, ongelmista ja mentaalisista haasteista nauttivia)
  • Reflektiivinen (itsetutkiskeleva ja itsekriittinen)
  • Numerotaitoinen (sinut numeroiden kanssa)

Lisäksi kirjassa mainitaan, että superennustajat pyrkivät jatkuvasti päivittämään ja parantamaan omia arvioitaan. Ohjelmointikielellä he ovat ikuisia ”beta-versioita” itsestään. Voitaneen lisätä, että he ovat käveleviä tieteellisiä prosesseja.

Mikäli kokee vedonlyönnin liian uhkapelinä, voi asiantuntijuuttaan osoittaa pitämällä julkisesti kirjaa ennusteistaan. Good Judgment – projektilla on avoin yhteisö, johon kuka tahansa voi liittyä ja alkaa tekemään ennusteita haluamistaan aiheista. Koska kirjanpidon hoitaa yhteisön verkkosivut automaattisesti, ei jälkikäteen voi pieleen menneitä ennustuksia piilotella. Tämän blogikirjoitukseni innoittamana itsekin kävin nyt kirjautumassa mukaan yhteisöön nimimerkillä ”Riski-Risto”.

Esimerkki

Lopuksi nostan esimerkkinä esiin yhden henkilön, jota en tunne henkilökohtaisesti millään tavalla, mutta hän on onnistunut herättämään valtavaa kunnioitusta. Kyseessä on osakerahaston hoitajana työskentelevä Anders Oldenburg. Vaikka lähtökohtaisesti välttelen aktiivisen salkunhoidon kuluja, tässä kohtaa olen tehnyt poikkeuksen ja sijoittanut rahastoon.

Tuottohistoria

Andersin hoitama Phoebus – rahasto on ollut pystyssä 15 vuotta yhden ja saman henkilön hoidossa. Tänä aikana rahasto on keskimäärin tuottanut sijoittajille 11.3% vuodessa. Tästä on vähennetty rahaston kulut (TKA) mitkä ovat olleet keskimäärin 1.2% vuodessa. Vertailuindeksin tuottaessa samana aikana 9.5%, saadaan tulokseksi, että Anders on osakevalinnoillaan pystynyt tuottamaan noin 3 % – yksikön verran vuosittaista ylituottoa, josta asiakkaalle on jäänyt hyötynä 1.8 % -yksikköä. Luvut voi käydä tarkemmin läpi täällä.

En ole tarkemmin tutkinut, missä ajassa osakemarkkinoilla erottuvat starat hyvätuurisista keskivertosijoittajasta tilastollisesti. Kutina on että 15 vuotta olisi jonkinlainen, muttei yksinään täysin vakuuttava näyttö.

Skin in the game

Anders on (ainakin omien sanojensa mukaan) sijoittanut itse merkittävän osan varallisuudestaan omaan Phoebus – rahastoonsa ja on rahaston suurin yksittäinen sijoittaja. Tämän luulisi takaavan, että rahastossa on Andersilla itsellään oma nahka mukana samassa pelissä kuin muilla sijoittajilla.

Superennustajan ominaisuudet

Oleellinen osa luottamuksen kehittymistä on ollut Andersin pitämä Phoebus – blogi, jossa hän kommentoi yhtiövalintojaan ja maailmaa niiden ympärillä. Mitä tulee Tetlockin ja Gardnerin mainitsemiin superennustajien ominaisuuksiin, Anders suorastaan korostaa epävarmuutta aina liikkuessaan kirjoituksissaan alueella, jota ei ole perinpohjin tutkinut. Hän myös paljon korostaa satunnaisuutta yritysten lyhyen ajan voitoissa. Lisäksi hän käy avoimesti läpi huonojakin osakevalintoja menneisyydestä ja pyrkii oppimaan virheistään.

Näihin ominaisuuksiin nojautuen olen uskaltanut antaa keskimääristä 1.2% vuosittaisista kuluista huolimatta palan sijoitusomaisuuttani Andersin käsiin ja sen lisäksi pyrin imemään hänen blogista vaikutteita maailman tutkimiseen analyyttisesti. Tämä siitä huolimatta, etten omista minkäänlaista sosiaalista suhdetta kyseiseen kaveriin tai hänen edustamaansa yritykseen.

Tiivistelmä

Ominaisuudet, jotka nostavat asiantuntijan uskottavuutta:

  • Taustalla pitkä tieteellinen prosessi
  • Julkinen vedonlyönti, sijoitus tai ennustus -historia
  • ”Skin in the game” samassa pelissä tiedon objektiivisuuden kanssa
  • Nöyrän analyyttiset ”superennustajan” ominaisuudet
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Sotilaalliset luottamusvälit

Luottamusväli taitaa olla heti keskihajonnan jälkeen yleisimmin käytetty epävarmuutta kuvaava tilastollinen mittari. Siihen liittyy kuitenkin hyvin paljon hämmennystä. Olen monta kertaa päässyt apukirjoittajan tai tilastokonsultin roolissa seuraamaan vierestä tutkijan ja tiedelehden arvioitsijan välistä keskustelua, missä toinen puhuu aidasta ja toinen aidan seipäästä kun kyse on luottamusväleistä. Niinpä arvelen että blogosfäärissä olisi tilaa pienelle tietoiskulle aiheesta.

Varusmiesten paino

Lehdissä näkyy aina välillä huolestuneita kirjoituksia (esim. Yle) koskien muutoksia varusmiesten keskipainossa. Tämä sopii havainnollistavaksi esimerkiksi meidän kuvitteelliseen tutkimukseen.

Sovitaan, että olemme laskeneet keskiarvoksi (kilogrammoina) 77.5 ja keskihajonnaksi 8. Katsotaan millaiseksi luottamusväli muodostuu riippuen siitä, kuinka monta varusmiestä on aineistossa tutkittu. Kaikenkaikkiaan varusmiehiä on 25000 ja heihin tutkimustulokset halutaan yleistää. Tätä koko joukkoa kutsutaan perusjoukoksi. Kaikissa esimerkeissä käytetään 95% luottamusväliä.

  1. Otoskoko 100

Voimme laskea luottamusvälin mekaanisesti tilastotieteen oppikirjan kaavalla:

($ \overline{x}-t_{0.025}\cdot s/\sqrt n$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n$) \approx  (75.9 ; 79.1)

  1. Otoskoko 25000, kaikki sen vuoden varusmiehet

Nyt kun kaikki varusmiehet on tutkittu, pitääkin hetki pysähtyä. Mitä luottamusvälillä oikein haetaankaan? Sen avullahan tavoitellaan ymmärrystä laskelmiin liittyvästä epävarmuudesta. Yleensä nimenomaan otannasta johtuvaa epävarmuutta. Nyt kun kaikki varusmiehet on tukittu, ei ole mitään otannasta johtuvaa epävarmuutta, joten siinä mielessä koko luottamusvälin laskemisessa ei ole tolkkua. Toki meillä vielä voi olla muitakin mielenkiintoisia epävarmuuden lähteitä kuten esim. mittausvirhe, mutta se on eri tarina ja vaatii oman tutkimuksensa mittalaitteen tarkkuudesta.

  1. Otoskoko 15000

Jos kaksi edellistä kohtaa oli tuttua tavaraa niin tässä kohtaa saattaa tulla jotain yllättävää. Se mitä useimmista tilastotieteen perusteiden oppikirjoista unohtuu mainita, on se että kohdassa 1. käytettyyn kaavaan liittyy oletus: ”Tutkittava perusjoukko on kooltaan ääretön”. Nyt meidän perusjoukon koko N = 25000. Usein käytetty nyrkkisääntö kuuluu, että mikäli otoskoko on korkeintaan 5% perusjoukon koosta, kohdassa 1. käytettyä kaavaa voidaan käyttää. Otoskoko 15000 on nyt kuitenkin 60% perusjoukosta, joten peruskaava antaa virheellisiä tuloksia. Kaava, jolla luottamusväli lasketaan on nyt (laskukaavasta lisää täällä):

($ \overline{x}-t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$) \approx (77.4 ; 77.6)

Tässä tapauksessa ero luottamusvälin leveydessä on vain suuruusluokkaa 0.1 verrattuna kohdassa 1. käytettyyn kaavaan, joten suurta munausta ei olisi tullut vaikka oltaisiin menty peruskaavalla.

Lopuksi vielä graafi, josta näkee kuinka luottamusvälin leveys riippuu otoskoosta. Punainen käyrä kuvaa luottamusvälin leveyttä kohdan 1. Peruskaavalla ja musta käyrä kohdan 3. Tarkkaa kaavaa. Pystyviiva kertoo, missä kohti tulee täyteen nyrkkisääntömme ”5% perusjoukon koosta”. Perusjoukkoon kuuluu kaikki 25000 varusmiestä.

Nähdään, että nyrkkisääntö vaikuttaisi pitävän tässäkin hyvin kutinsa. Äärettöman perusjoukon olettava ”peruskaava” menee käsi kädessä tarkan välin pituuden kanssa, mutta alkaa sen jälkeen hiljalleen erkaantua. Huomataan myös, että tutkittavan joukon kasvattaminen 5000:sta ylöspäin ei enää kovin tehokkaasti kasvata tutkimuksen tarkkuutta luottamusvälin suhteen.

Kun paino jää sivuruuliin

Tahdon vielä nostaa esiin asian liittyen joidenkin tiedejulkaisujen intoon vaatia luottamusvälejä kehiin joka ikisen raportoidun luvun perään. Otetaanpa esimerkiksi tutkimuskysymys: ”Mikä on palvelusaikana syötyjen munkkien määrän vaikutus Cooperin testin tulokseen varusmiehillä?”. Lisäksi mitataan kontrollointitarkoituksessa pituus, paino ja monia terveysmuuttujia.

Näiden sivuroolissa olevin muuttujien keskiarvon ja keskihajonnan raportointi on asiallista toimintaa, jotta tutkimuksen lukija saa kuvan siitä minkä tyyppistä porukkaa taustatiedoiltaan on tällä kertaa otokseen sattunut. Ainoa ilmiö, mitä tutkimuksessa kuitenkin on tarkoitus yleistää, on munkkien ja juoksukunnon yhteys. Mikäli kaikille taustamuuttujillekin vaaditaan vielä lisäksi raportoitavaksi luottamusvälit, ainakin itselläni herää kysymys: Miksi?

Tämä varmaan lopulta on mielipidekysymys, mutta omasta mielestäni tutkimusartikkelit tuppaavat olemaan riittävän raskasta luettavaa ilmankin että tekstin sekaan tungetaan kaikkea mieleen juolahtavaa epäolennaista numeropuuroa.

Tulkinta

Viimeisimpinä, muttei helpoimpana asiana lienee syytä käydä vielä läpi vähän luottamusvälin tulkintaa. Silloin kun harrastin vielä tilastotieteen perusteiden luennointia, paniikkioireet kasvoivat aina kun läheni se hetki, että piti alkaa puhumaan luottamusväleistä. Tuntui mahdottomalta tehtävältä selittää luottamusvälit niin, että se olisi totta ja ettei opiskelijoiden+omat aivot menisi lopullisesti solmuun.

Luottamusvälin kaavat perustuvat frekventistiseen tieteenfilosofiaan. Tässä katsomuksessa mielenkiinnon kohteena oleva ”tutkimusparametri” (esim. Kaikkien varusmiesten keskipaino tai kaikkien varusmiesten keskuudessa vallitseva munkin syönnin sekä juoksukunnon välinen regressiokerroin) on kiinteä luku ja kaikki epävarmuus liittyy vain otanta-aineistoon liittyvään sattumaan. Niinpä puhuminen ”tutkimusparametrin” todennäköisyysjakaumasta on mieletöntä. 95% luottamusväli tulkitaankin otantajakauman avulla: ”Kun saman suuruista otantaa toistetaan ja toistetaan niin 95 prosentissa toistoista todellinen tutkimusparametri osuu luottamusvälille.”

Bayesläinen tieteenfilosofia

Tutkijalle kinkkistä tässä on, että hänen näkökulmastaan nimenomaan tutkimusparametriin liittyy mielenkiintoisin epävarmuus. Eihän koko tutkimusta tarvittaisi, mikäli tutkimuksen kohde olisi jo täsmällisesti tiedossa. Olisi siten luontevampaa kysyä tutkimusparametrin todennäköisyyksiin pohjautuvia kysymyksiä, esim. ”Mikä on otanta-aineistomme perusteella todennäköisyys, että kaikkien varusmiesten keskipaino on suurempi kuin 75 kg?” Vastaus tähän löytyy Bayesläisen tieteenfilosofian avulla. Siihen liittyvät menetelmät ovat välillä laskennallisesti raskaampia, mutta nykyisellä tietokoneiden laskentatehoilla se ei enää ole niin suuri ongelma. Jännityksellä odottelen, milloin Bayesläisyys alkaa lyömään kunnolla läpi akateemisessa maailmassa ja tiedejulkaisut alkavat pärjätä ilman hallitsematonta luottamusvälien ja p-arvojen sarjatulta.

Lisää frekventistisistä luottamusväleistä ja Bayesläisistä todennäköisyysväleistä simulointikokeilla havainnollistettuna voi lukea esimerkiksi täältä.

Statistickon steesit:

  • Kun raportoit (tai vaadit raportoimaan) luottamusvälin, mieti mistä epävarmuudesta olet oikeasti kiinnostunut
  • Kun tutkimuksen otoksena on suuri osuus perusjoukosta, luottamusvälin peruskaava antavat liian leveitä välejä
  • Yleensä luottamusväli määritellään mittatikkuna, jonne tutkimusparametri osuu halutulla varmuudella kun otetaan toistuvasti erilaisia satunnaisotoksia
  • Kun halutaan tehdä todennäköisyyspäätelmiä itse tutkimusparametrista, pitää käyttää Bayesläisiä analyysimenetelmiä
  • Liiallisen epäolennaisen numeerisen informaation viljely raporteissa ja artikkeleissa hankaloittaa lukijan ymmärrystä itse pääviestistiä
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Trendikkäät riippuvuussuhteet

trend_cityVieläkö muistat, mikä yhteys on uima-altaaseen hukkumisella ja Nicholas Cagen elokuvaesiintymisillä? Vastaus on että eipä juuri mikään, mutta silti niiden välille on mahdollista havaita keskinäistä riippuvuussuhdetta mittaavaa korrelaatiota. Aiemmassa blogikirjoituksessa havainnollistin kuinka korrelaatioita pompsahtelee esiin vain sattumalta kun tarpeeksi montaa eri muuttujaparia kokeillaan. Seuraavassa pureudutaan yleiseen hämäävien korrelaatioiden lähteeseen; aikaan.

Korrelaatio ja aikatrendit

Otin Gapminder –datapankista tiedot Lapsikuolleisuudesta Kiinassa (alle 5v kuolevia per 1000 syntymää) ja Sähkön käytöstä Suomessa (kWh per asukas). Molemmista löytyi dataa vuosilta 1960-2011. Nämä ovat tarkoituksella haetut muuttujat, joilla ei pitäisi olla mitään tekemistä toistensa kanssa. Eihän meillä voi olla niin huono säkä, että data näyttäisi silti niiden välille korrelaatiota? Katsotaan muuttujien välistä sirontakuviota oikealla.

korrelaatiot_sironta

Suomen sähkönkulutuksen ja Kiinan lapsikuolleisuuden sirontakuvio

Vaikuttaisi kuitenkin siltä, että silloin kun Suomessa on korkea sähkönkulutus, niin Kiinassa lapsia kuolee vähemmän. Korrelaatiokerroinkin -0.84 vahvistaa saman: muuttujien välillä on vahva negatiivinen lineaarinen yhteys. Pitäisikö tästä nyt tulkita, että mikäli haluamme pelastaa kiinalaisia lapsia, niin pitää heti laittaa uuni ja sähkösauna päälle?

Tutkitaan seuraavaksi molempien muuttujien kehitystä ajassa erikseen.

korrelaatiot_trendit

Lapsikuolleisuuden ja sähkönkulutuksen aikatrendit

Nähdään, että Kiinan lapsikuolemissa on ollut selvä laskeva trendi ja suomalaisten sähkönkulutuksessa selvä nouseva trendi. Omituinen korrelaatio näiden muuttujien välillä ei selity tällä kertaa sattumalla vaan yhteisellä taustatekijällä, mikä on nyt aikatrendi. Koska trendit ovat erisuuntaiset, korrelaatiokerroin on negatiivinen.

Tutkitaan sitten alkuperäisten havaintojen sijaan muutoksia edelliseen aikapisteeseen verrattuna. Näin saadaan trendit eliminoitua havainnoista, kuten kuvaajista nähdään.

Muutosmuuttujien kehitys ajassa

Muutosmuuttujien kehitys ajassa

Näiden muutosmuuttujien välille laskettu korrelaatiokerroin on -0.03. Tämä on niin lähellä nollaa että voimme turvallisesti sanoa ettei Suomen sähkönkulutuksen muutoksella ole mitään yhteyttä saman vuoden Kiinan lapsikuolleisuuden muutokseen. Varmistetaan asia vielä piirtämällä sirontakuvio ja havaitsemalla ettei yhteistä systematiikkaa löydy.

 

Muutosmuuttujien sirontakuvio

Muutosmuuttujien sirontakuvio

Autokorrelaatiot

Myöskään trendittömien muuttujien aikahavaintojen tutkiminen ei ole aivan yksinkertaista. Mikäli olemme kiinnostuneita epävarmuudesta ja korrelaation tilastollisesta merkitsevyydestä, usein päävaivaksi tulee autokorrelaatio. Tällä tarkoitetaan sitä että saman muuttujan peräkkäiset havainnot korreloivat keskenään. Perusmenetelmiin liittyvä oletus riippumattomasta satunnaisotoksesta ei nyt päde ja kahden autokorreloituneen muuttujan riippuvuuden tutkimiseen on parempi käyttää esim. vektoriaikasarja-malleja.

Tilastoja tutkimaan

Lopuksi pitää vielä kehua datapankkia, josta lapsikuolleisuus ja sähkönkulutusdatat ovat haettu. Sivustolta löytyy läjäpäin muutakin terveys-, talous- ja muuta yhteiskunnallista dataa ympäri maailmaa ja niitä voi kätevästi graafisesti tutkailla tällä sivustolla. Mutta pidäthän tämän blogin opetukset mielessä ennen kuin vedät johtopäätöksiä liittyen syy-seuraus suhteisiin. Lopuksi voi vielä viihdyttää itseään käymällä tsekkaamassa vanhaa sivua, jossa on koottuna huumorikorrelaatioita. Nyt pitäisi olla valmiudet perustellusti spekuloida jokaisen kuvaajan kohdalla, johtuuko korrelaatio

  • jostain yhteisestä taustamuuttujasta
  • aikatrendistä
  • sattumasta
  • aidosta riippuvuussuhteesta
  • vai jostain edellisten yhdistelmästä.

Statistickon steesit

  • Aikatrendi on yleinen taustatekijä, joka selittää kahden muuttujan näennäisen riippuvuuden
  • Ajassa itsensä kanssa korreloituneita muuttujia tulee syvällisemmin analysoida aikasarja- tai pitkittäistutkimusmenetelmillä
  • Maailma on täynnä mielenkiintoisia tilastoja, mutta niitä on helppo ymmärtää väärin

 

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Voitto- ja tappioputket jääkiekossa

Tietokirjailija/kääntäjä Kimmo Pietiläisen blogikirjoituksessa käsitellään koripallon ”kuuma käsi” -ilmiötä, jolla perinteisesti tarkoitetaan pelaajan heittosuorituksen parantumista, kun alla on useampi onnistunut heitto putkeen. Tutkimukset ovat kuitenkin paljastaneet kyseisen ilmiön ainoastaan urheiluselostajien luomaksi myytiksi. Kirjoituksessa kerrotaan tutkimusten jopa osoittaneen päinvastaista ilmiötä: useamman onnistumisen jälkeen koripalloilijoilla on taipumus hakea onnistumisten jälkeen liian vaikeita heittoja, mikä tekee heidän osumisputkistaan lyhempiä kuin mitä tulisi puhtaan satunnaisvaihtelun ansiosta.

Kirjoitus herätti kiinnostukseni voittoputkien pituuksia kohtaan joukkueurheilussa ja otin oman pikatutkimuksen kohteeksi Liigan jääkiekkopelit viimeisen kymmenen vuoden ajalta. Penkkiurheilija-psykologia tarjoaa useita selityksiä sekä putkien keston pitkittymiselle että katkeamiselle ennen aikojaan:

Voittoputki

+ Joukkueessa on hurmostila, minkä vuoksi joukkue pelaa entistä paremmin seuraavissa peleissä

–  Joukkueesta tulee ylimielinen, mikä heikentää suoritusta seuraavissa peleissä

–  Joukkueesta tulee himoittu päänahka ja vastustaja on poikkeuksellisen syttynyt

Tappioputki

kiekkoilijat_vasyneena+ Joukkue halua katkasta tappioputken hinnalla millä hyvänsä ja on entistä motivoituneempi voittamaan

+ Vastustaja suhtautuu ylimielisesti viimeaikojen heittopussiin, mikä parantaa yllätyssaumoja

–  Joukkue menettää itseluottamuksen ja joukkuehenki on latistunut, mikä heikentää suoritusta

–  Pitkän tappioputken jälkeen kotiyleisö voi kääntyä omiaan vastaan tehden voittamisesta kotipelissä vaikeampaa

Kymmenen kauden tutkimus

Lähdin tutkimaan vuosina 2006-2015 alkaneiden Liiga-kausien pelejä tiputtaen kauden lopusta kuitenkin kaikki 31.1. jälkeen pelatut pelit pois. Syynä tälle on se, että runkosarjan lopussa playoff-paikkojen varmistuttua monien joukkueiden motivaatiotasot vaihtelevat ja siirtoikkunan kynnyksellä tammi-helmikuun vaihteessa on nähty kesken kauden pelaajien ”tyhjennysmyyntejä”. Nämä ovat muuttaneet joukkueiden taitotasoja kesken kauden. En halua näiden häiriötekijöiden sekoittavan analyysiä voitto- ja tappioputkien psykologiasta. Aineistoa jäi analyysiin 2840 ottelun verran.

Kyseisestä aineistosta laskin (koodaamani funktio laski puolestani) ennen jokaisen ottelun alkua, kuinka pitkä voitto/tappio putki on alla kotijoukkueella ja vierasjoukkueella. Sitten lajittelin putkien pituudet seuraaviin luokkiin:

  1. Vähintään 7 ottelun tappioputki
  2. 5-6 ottelun tappioputki
  3. 3-4 ottelun tappioputki
  4. Ei kunnon putkea (maksimissaan 2 ottelun putki)
  5. 3-4 ottelun voittoputki
  6. 5-6 ottelun voittoputki
  7. Vähintään 7 ottelun voittoputki

Tämän jälkeen muutin satunnaisesti jokaisen kauden sisällä otteluiden järjestystä ja muodostin sata uutta aineistoa alkuperäisen aineiston pohjalta (ns. bootstrap-otos). Nämä uudet sekoitetut aineistot kertovat nyt todennäköisyydet eri putkien pituuksille puhtaan sattuman johdosta. Alla olevassa kuvaajassa punainen pylväs kertoo, kuinka eri putkien pituudet jakaantuivat alkuperäisessä aineistossa. Sininen pylväs taas kertoo sekoitetun aineiston osuudet kussakin putkiluokassa. Kuvaajassa vasemmalla puolella on tappioputket ja oikealla voittoputket.

Putki_graafi

Pitkät putket ovat havaitussa aineistossa aavistuksen sekoitettua yleisempiä, muttei tilastollisesti merkitsevästi (P-arvo = 0.12). Tämän perusteella ei siis ole selvää näyttöä että Liigassa syntyisi keskimäärin enemmän tai vähemmän pitkiä putkia kuin mitä puhtaan sattuman takia tulee. Analyysi tarjoaa kuitenkin lohdutuksen sanan tappioputkessa seuraavaan otteluun alamaissa valmistautuvalle joukkueelle: ”12 kertaa sadasta ottelun alla on vähintään 3 ottelun tappioputki pelkästään puhtaan sattuman taki.”

Tilastollinen mallinnus

Edellinen analyysi jättää kuitenkin useita kysymyksiä. Yllä olevat putket saattavat vaikuttaa joukkueiden suoritukseen eritavoin koti- ja vieraspeleissä. Lisäksi putkien muodostumiseen vaikuttavat myös fyysiset rasitustekijät, mutta erityisesti meitä kiinnostavat psykologiset tekijät. Muodostetaan vielä toinen analyysi, jossa tilastollisella mallilla (yleistetty sekamalli logit-linkkifunktiolla) selitetään kotijoukkueen voittotodennäköisyyttä seuraavilla tekijöillä:

  • Kotijoukkueen alla oleva putken pituus
  • Vierasjoukkueen alla oleva putken pituus
  • Kotijoukkueen fyysinen rasitus
  • Vierasjoukkueen fyysinen rasitus
  • Kotijoukkueen keskimääräinen taitotaso kotipeleissä kyseisellä kaudella
  • Vierasjoukkueen keskimääräinen taitotaso vieraspeleissä kyseisellä kaudella

Fyysinen rasitustekijä -muuttujassa on neljä vaihtoehtoa:

  1. Edellisenä päivänä peli ja sitä ennen vähintään 3 peliä viikon sisällä
  2. Edellisenä päivänä peli, mutta alle 3 peliä sitä edeltävän viikon sisällä
  3. Ei peliä edellisenä päivänä, mutta vähintään 3 peliä sitä edeltävän viikon sisällä
  4. Ei aiemmissa luokissa määriteltyjä rasitustekijöitä

Tämän analyysin tuloksessa mielenkiintoa herättävä vaikutus on kotijoukkueiden erittäin pitkien putkien näkyminen heikentävänä suorituksena. Mallin mukaan kotijoukkueen voittotodennäköisyys tippuisi muuten tasaisessa pelissä 50% -> 42%, mikäli kotijoukkueella on alla 5-6 ottelun tappioputki. Vähintään 7 ottelun tappioputkessa todennäköisyys putoaisi jopa 23% :iin. Efekti ei ole kuitenkaan aivan tilastollisesti merkitsevä (P-arvo = 0.1) ja vähintään 7 ottelun putken osalta epäilyttävän suuri. Tutkimus kuitenkin herättää ainakin epäilyksen, että kotiluolassa pitkän putken katkaiseminen voisi olla oikeasti vaikeaa.

Muille alussa luetelluille penkkiurheilijoiden psykologisille teorioille aineisto ei anna oikein minkäänlaista tukea. Tosin on mahdollista, että eri joukkueet käsittelevät putkia eri tavoin ja siten positiiviset vaikutukset kumoutuvat negatiivisilla vaikutuksella pidemmän päälle. Mielenkiintoinen sivutulos löytyi fyysisen rasituksen osalta. Fyysisellä rasituksella oli mallin mukaan heikentävää vaikutusta suoritukseen lähinnä vain vieraspeleissä ja erityisesti edellisenä päivänä pelatun pelin takia. Tästä lienee jääkiekon ammattivedonlyöjillä tarkempia tutkimustuloksia, mistä kuulen mielelläni jos joku haluaa salaisuuksiaan paljastaa.

Tiivistelmä

  • Pitkä alla oleva tappioputki mahdollisesti heikentää suoritusta kotipeleissä jääkiekossa
  • Muuten putkilla ei vaikuttaisi olevan näkyviä vaikutuksia suoritukseen seuraavassa pelissä
  • Edelleen on mahdollista että toisinaan putkien vaikutukset ovat suoritukseen positiivisia ja toisinaan negatiivisia, jolloin ne pitkässä juoksussa kumoavat toisensa
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Kärjistyvät näkemykset

Ihmisen aivot on ohjelmoitu vetämään härskisti muutaman havainnon perusteella syy-seuraus yhteyksiä. Itse työskentelen päivittäin satunnaisvaihtelun ymmärtämisen parissa. Mutta annas olla kun vaihdan vapaalle ja vähän rentoudun niin muutaman tuopillisen jälkeen alkaa jutuissani näkymään riippuvuussuhteita siellä sun täällä yksittäisiin esimerkkeihin nojaten: ”Alkulämmittely urheilussa on vaan haitaksi. Itsekin pelasin urani parhaan futsal-pelin silloin Ristiinassa kun huonon ajokelin takia ei keretty lämmittelemään ollenkaan.” Eikä siinä mitään, näin syntyy tarinoita ja legendoja. Elämä ympärivuorokautisena satunnaisvaihteluintoilijana olisi todella tylsää.

angryVaarallisemmaksi tilanne muuttuu, kun mukaan astuvat vahvat poliittiset ideologiat. Olet ehkä jo saavuttanut ajatuksillesi jonkinlaista kannatusta, etkä halua kannattajiesi silmissä leimautua ”takin kääntäjäksi”. Alitajuntasi alkaa rekisteröimään vain aiempia näkemyksiä tukevia havaintoja ja vastakkaista näkemystä tukevat havainnot humahtavat ohi niin että tukka hulmuaa. Ehkä SoMe:ssakin kaveripiiri alkaa koostumaan vaan saman ideologian jakajista ja toisenlaiset näkemykset blokataan sekopäisten hourailuna. Sinulla on kansantalouden tutkimuksista löytynyt oma suosikkisi, johon voit viitata kohdatessasi vasta-argumentteja. Mutta hetkinen, vastapuolellakin on viittaus tieteelliseen artikkeliin, jolla hän perustelee omaa näkemystään. Mitä ihmettä, onko koko tiedemaailmakin sekaisin?

Totuus hahmottuu vähitelleen

Vaikka maailmassa on paljon tutkijoita, joilla on vaikeuksia käsitellä todennäköisyyksiä ja joissain tiedelehdissä on kehnoja julkaisukriteerejä, niin suuressa mittakaavassa tiede tekee oikeita asioita. Taistelu totuuden löytämiseksi sattuman sekoittamassa maailmassa on vaan kovaa hommaa.

Matematiikassa tai fysiikassa voi olla mahdollista todistaa uusi tutkimuslöydös yhdellä tutkimuksella aukottomasti todeksi. Suurimmalle osalle ihmisistä olennaisempia ovat kuitenkin ”pehmeämmät” tieteet kuten yhteiskuntatieteet ja niissä on pakko turvautua havaintoihin. Tilastotiede kehittää tutkimusmenetelmiä eri soveltavien tieteiden tarpeisiin, mutta monet perinteiset menetelmät toimivat täydellisesti vain satunnaistettujen kokeiden (satunnaisesti valittu koeryhmä ja vertailuryhmä) yhteydessä. Hienostuneemmat menetelmät ovat taas useille tutkijoille matemaattisesti liian monimutkaisia.

Poliittisesti herkässä kansantaloustieteessä satunnaistetut kokeet ovat harvoin mahdollisia. Vai miltä kuulostaa seuraava koe: Rakennetaan Suomeen kolme uutta samankaltaista asuinaluetta ja arvotaan tuhansia ihmisiä (tarvittaessa pakkosiirretään) asumaan kuhunkin kymmeneksi vuodeksi. Yhdessä alueessa käytetään nykyistä sosiaaliturvajärjestelmää, toisessa perustuloa ja kolmannessa ei ole sosiaaliturvaa ollenkaan. Näin voitaisiin saada helposti tieteellistä näyttöä eri tulonsiirtomekanismien toimivuudesta, mutta lienee selvää miksei tällaisia kokeita voida järjestää. Satunnaiskokeiden puutteen takia taloustieteen tutkimukset ovat herkkiä sille, kuinka kaikki oleelliset taustatekijät on huomioitu. Tästä hyvä esimerkki on edellinen kirjoitukseni tuloeroista.

Kun soppaan lisätään vielä muu totuuden etsimiseen liittyvä hankalasti kontrolloitava satunnaisuus (aiemassa kirjoituksessani tätä on yritetty avata) niin ei ole mikään ihme että yksittäiset tutkimukset voivat saada toisistaan vastakkaisia tuloksia. Tiede onkin jatkuvasti kehittyvä prosessi. Vasta kun vuosien varrella useimmat toisistaan riippumattomat tutkimukset alkavat saada samankaltaisia tuloksia, voidaan alkaa puhumaan yleisestä totuudesta.

Radikalisoituminen

radikaali_graafi2Ikävä puoli tässä kaikessa on, että erilaiset ideologiset ryhmittymät vahvistavat valikoiden omia näkemyksiään ja alkavat sitten käymään täysin tarpeetonta vihanpitoa toisiaan kohtaan. Loppupelissä kyse on vain satunnaisvaihtelusta, josta ryhmittymät ovat ajautuneet näkemään vain toisen puolen. Jottei tämäkään kirjoitus jäisi ilman jotain tilastollista käppyrää, piirsin kuvaajan hahmottamaan ilmiötä. Totuus kiistanalaisesta asiasta on jakauman keskellä, mutta sen havaitsemiseen liittyy satunnaisuutta ja ryhmät rekisteröivät vain toista puolta ja etsivät sitä tukevia yksittäisiä tutkimuksia.

Esimerkiksi keskellä voisi olla totuus ”Virkamiehet ovat keskimäärin yhtä fiksuja ja rehellisiä kuin muutkin ihmiset” (en tiedä, pitääkö oikeasti paikkansa). Musta käyrä kuvaa, yksittäisiin virkamiehiin liittyvää vaihtelua todellisuudessa ja pallerot kansalaisten havaintoja heistä. Mitä oikeammalla vaakasuunnassa pallero sijaitsee, sitä pätevämpi havaittu virkamies on. Nyt siniseeen porukkaan kuuluvat ovat kohdanneet tai muuten vaan mielikuviin rekisteröineet esimerkkejä korruptoituneista ja epäpätevistä tapauksista. Punainen porukka on taas rekistenöinyt havaintoja lähinnä fiksuimmista ja rehdimmistä kavereista. Punaisilla ja sinisillä saattaa olla tämän jälkeen pientä erimielisyyttä siitä, kuinka paljon virkamiehillä pitää olla valtaa.

Asiaa ei helpota yhtään, että nykypäivänä netin keskustelukanavat vilisevät trolleja, joiden päämääränä on lisätä hämmennystä ja media kilpailee klikkauksista ylidramatisoivilla sekä harhaanjohtavilla otsikoilla. Otsikon harhaanjohtavuus on helppo huomata, kun kyse on itselle ennalta tutusta aiheesta. Vieraasta aiheesta taas harhaa emme tunnista vaan muodostamme omaa todellisuutta näiden ”havaintojen” perusteella.

Mennyt vuosi on ollut kriisipitoinen ja kotimaan poliittisessa keskusteluissa ovat olleet tunteet pinnassa. Ainakin julkinen keskustelu menee liian helposti asia-argumentoinnin sijaan henkilökohtaisuuksiin ja vastapuolen syyttelyyn ”kuplassa elämisestä”. Kannustan kaikkia ensisijaisesti pohtimaan, mistä oma kupla muodostuu. Kaikilla meillä sellainen on.

Esimerkkiä pelkkään toisen osapuolen vääriin näkemyksiin keskittymiseen tarjoavat eduskunnan televisioitavat istunnot. Näitä katsoessa on kuitenkin hyvä muistaa, että vaikka edustajat TV-kameroiden ollessa päällä vetävät tunteenpalossa roolejaan, eduskunnan käytäviltä kantautuvien huhujen perusteella useimmat näistä ”ammattiräyhääjistä” pystyvät ihan asiallisesti kahvipöydissä keskustelemaan kameroiden ollessa kiinni. Istuntosalissakin on ainakin näin joulun aikaan merkkejä vähemmän kiihkeästä suhtautumisesta omiin rooleihin ainakin tämän pätkän perusteella.

Yhteistyöllä eteenpäin

Maailman muuttuessa talouteen tulee ajoittain shokkeja ja vaikeita aikoja, mutta yhteistyöllä varmasti pääsemme niistä yli. Me tarvitsemme toisiamme:

  • Ilman riskiä kantavia yritysten omistajia ei duunareilla ole töitä ja ilman ahkeria duunareita ei yrityksissä tapahdu mitään.
  • Ilman liiketoiminnan (ALV, palkat ja voitot) generoimia verorahoja sekä yrittämällä rikastuneiden säätiöitä ei tutkimukselle löytyisi rahoitusta. Toisaalta ilman laadukasta tutkimusta kuluttajat jäisivät paitsi monien innovaatioiden hyödyistä, eivät tietäisi mikä on terveydelle hyväksi ja yrityksillä ei olisi kaikkea tehostavaa teknologiaa käytössään.
  • Ilman yksityisen sektorin generoimia verorahoja ei julkisen sektorin työntekijöille voisi maksaa palkkoja, mutta ilman julkisen sektorin tarjoamaa turvallisuutta ja koulutusta olisi yhteiskunta aika kehno paikka yrittää ja etsiä päteviä työntekijöitä.

Haloo Helsingin säkeiden myötä haluan toivottaa lukijoille rauhaisaa joulua ja avarakatseista uutta vuotta!

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Tuloerot ja taustatekijöiden hallinta

Julkisessa talouskeskustelussa pistää silmään usein tuloerojen korostaminen ongelmana, johon pitää erityisesti puuttua. Olen yrittänyt miettiä logiikkaa tämän taustalla. Koska eri ammattien vaatimukset ovat varsin erilaisia ja lisäksi ihmisten halukkuus tehdä tietyntyyppistä työtä poikkeaa paljon niin eikö ole luonnollista, että hintamekanismi myös palkitsee toisista töistä enemmän kuin toisista? Näin hinnat ohjaavat päteviä työntekijöitä hyvin tarpeellisten, mutta vaativien ja/tai yleisesti epämieluisten töiden pariin.

Tavoitteiden tärkeysjärjestys

poor_houseVoisiko köyhimpien olojen parantaminen olla tärkeämpi tavoite kuin itseisarvoinen taistelu tuloerojen kaventamiseksi? Itse en ainakaan ole huolissani 2500€/kk tienaavasta vaikka kuinka hänen naapurinsa tienaisi 7500€. Sen sijaan huolestuttavampia ovat ihmiset, joilla on vaikeuksia täyttää elämisen perustarpeita.

Silloin ongelma on iso, mikäli ihmisten vapaudessa valita eri ammattien välillä on suuria eroja. Esimerkiksi hyvin palkattuihin, korkeisiin virkoihin ei voisi päästä ilman sopivia sukulaisuussuhteita tai kouluttautuminen ei olisi suuresta motivaatiosta huolimatta mahdollista kuin rikkaiden perheiden lapsille. Myös lisensioitumista vaativissa ammateissa (esim. lääkärit ja juristit) voi päästä palkkaneuvotteluissa epäreiluun asemaan, jos koulutuspaikkojen määrät ovat alimitoitettuja tarpeisiin nähden.

Tasavertaisten valintojen maailma

Tasavertaisten valintamahdollisuuksien maailmassa on vaikea nähdä tuloeroja vakavana ongelmana. Mikäli haluaa mammuttipalkkaiseen suuryrityksen toimitusjohtajan hommaan, niin voisi 20 vuotta määrätietoisesti hankkia ammatissa vaadittavaa osaamista ja työkokemusta. Sitten voisi loppuelämänsä omistaa ympärivuorokautisena keulakuvana toimiseen ja elämään median, työntekijöiden edustajien ja sijoittajien paineen jatkuvassa ristitulessa.

Riskien kantamisen, eli pääomatulojen puolella taas sijoittaja voisi halutessaan jättää sijoittamatta turvalliseksi koettuun kasvukeskuksen asuntoon ja laittaa säästönsä kiinni nuoriin startup-yrityksiin, joista iso osa ei tule tuottamaan mitään, mutta hyvällä säkällä joku voi räjäyttää pankin luoden yhteiskuntaan runsaasti tuottavia työpaikkoja ja riskinkantajalle palkkioksi mojovan omaisuuden.

Äärimmäisenä tuloerojen kauhuskenaariona näen sellaisen, että joku yksittäinen taho pystyisi ostamaan kaikki asuinkiinteistöt Suomesta ja siten monopoliasemansa turvin orjuuttamaan kaikki jotka haluavat Suomessa asua. En kuitenkaan hirveän realistisena tällaista skenaariota näe, vaikka moni on sitä Monopoli-pelin avulla lapsena kovasti harjoitellut. Ylipäätään monopolit ja kartellit ovat myrkkyä valinnan mahdollisuuksille. Aidosti kilpailevat yritykset ovat mielestäni avain ihmisten valinnan mahdollisuuksille joutuessaan kilpailemaan työntekijöistä, asiakkaista ja sijoittajista.

Tuloerot köyhyyden aiheuttajana?

Ehkä tuloeroilla on riippuvuussuhde absoluuttiseen köyhyyteen ja siksi se on tärkeä aihe. Lähdin ottamaan tästä selvää Tilastokeskuksen julkaisemien Euroopan maiden taloustilastojen (vuodelta 2012) avulla.

Gini_puute_pngVieressä on kuvaaja, jossa vaaka-akselilla on tulojen eroja kuvaava Gini-kerroin ja pystyakselilla oleva Puute-muuttuja kertoo, kuinka monta prosenttia väestöstä kokee vakavaa aineellista puutetta.

Vaikuttaa selkeältä: kun tuloerot kasvavat niin Puute kasvaa myös. Näiden välille laskettu korrelaatiokerroin (Spearmanin versio, koska yhteys ei ole lineaarinen) on 0.66 ja se on nyt tilastollisesti erittäin merkitsevä (totuuden mittareista tarkemmin tässä postauksessa). Voidaanko tästä vetää johtopäätös että suurista tuloeroista seuraa yhteiskuntaan vakavaa puutetta? Tässä vaiheessa on hyvä kerrata aiempi postaukseni korrelaatiotutkimuksista.

Alkujohdattelussa puhuin valintojen mahdollisuuksista ja sitä jollain tavalla kuvannee korruption määrä. Toinen oleellinen muuttuja, joka mahdollisesti vaikuttaa sekä Gini-kertoimeen että Puutteeseen on kansalaisten kokonaistulotaso, mitä kuvaa nyt vuositulojen mediaani maittain. Oma hypoteesini näiden muuttujien yhteyksistä on seuraava:

Puute_kaavio

Seuraavassa kuviossa on kaikkien neljän tutkittavan muuttujien kuvaajat ja korrelaatiokertoimet:

Lävistäjältä löytyy jokaisen muuttujan oma jakauma. Oikealla ylhäällä löytyy vastaavan sarake- ja rivimuuttujan välinen Spearmanin korrelaatiokerroin sekä tilastollinen merkitsevyys tähtinä. Vasemmalla alhaalla jokaisen muuttujaparin sirontakuvio.

Kaikki neljä muuttujaa korreloivat pareittain. Esim. Korruptoimattomuuden korrelaatiokerroin Puutteen kanssa on -0.86, mikä tarkoittaa että maissa joissa on vähän korruptiota, on myös vähän puutetta.

Gini_puute2_pngMuodostin matemaattisesti uuden Puute-muuttujan, josta on eliminoitu Tulojen ja Korruption vaikutus. Ginin ja eliminoidun Puute-muuttujan sirontakuvio näyttää nyt aikalailla erilaiselta.

Yhteys ei ole enää niin selvä kuin aiemmassa kuvaajassa. Nyt korrelaatiokerroin on 0.27 ja P-arvo on 0.12, mikä ei ole enää tilastollisesti merkitsevä.

Muodostetaan vielä regressiomalli, jossa Puutteessa elävien osuutta (sen logit-muunnosta, jotta yhteys olisi lineaarinen) selitetään Ginillä, Mediaanituloilla ja Korruptoimattomuudella. Alla on R-ohjelmiston tuloste pro-lukijoita varten.

puute_regressio2Menemättä taulukon yksityiskohtiin vaikuttaa, että kansakunnan yleinen tulotaso ja korruptoimattomuus ovat ne tärkeimmät tekijät puutteen selittämisessä. Toki Ginilläkin näyttäisi olevan yhteys (akateemiset tutkijat heittelevät nyt voltteja, koska P-arvo jäi hiuksen hienosti alle 0.05), mutta merkitys kokonaisuuteen on kuitenkin vähäinen. Gini-kertoimen mukanaolo regressiomallissa nosti selitysastetta vain 2%-yksikköä.

Mitä tästä opimme?

Siihen, kuinka paljon tuloeroihiin tulisi Euroopassa puuttua, ei tämä laskuharjoitus anna vastausta. Kyseessä on pintaraapaisu aiheeseen helposti löytyneellä datalla, eikä loppuunviety tutkimus. Tärkein opetus tässä on näyttää kuinka pelkkien kahdenvälisten korrelaatiokertoimien tutkiminen voi johtaa harhaan. Taloustutkimuksissa ei yleensä pystytä järjestämään satunnaistettuja koeasetelmia ja silloin tutkimustulokset heilahtelevat sen mukaan mitä oleellisia taustatekijöitä on huomioitu ja mitä ei.

Lukijagallup: Mitä muita tekijöitä tässä pitäisi huomioida, että tutkimus olisi vielä luotettavampi?

Statistickon steesi:

  1. Kun tutkimusaineisto ei perustu satunnaistettuun kokeeseen, tulokset riippuvuuden suhteen ovat erityisen herkkiä yhteisten taustatekijöiden kontrolloimiselle

Aineistolähteet:

Puute

Tulot ja tuloerot

Korruptio

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Useat tulonlähteet

Vossikka

Vossikka

Teknologia kehittyy ja maailma muuttuu kokoajan. Taxi-kuskit ovat tällä hetkellä huolissaan työpaikkojensa puolesta ja protestoivat Uber-kuskeja vastaan. Muistaakohan kukaan, että taxi-autoilijoiden ammattikunta on aikoinaan kaapannut markkinat vossikkakuskeilta?

 Useat tulonlähteet tulevaisuuden turvana

Kehitykseen kuuluu luonnollisena se, että joillekin töille on jatkossa vähemmän tarvetta ja tilalle tulee uusia ammatteja. Koska elämme sattuman sekoittamassa maailmassa, on vaikea ennustaa, mikä on oman nykyisen ammattiosaamisen kysyntä 10 vuoden päästä.

Kannatan ajatusta, että olisi hyvä olla useita tulonlähteitä, jolloin on paremmin suojautunut maailman muutoksien tuomia riskejä vastaan. Helpoin tapa sivutienesteille, mikä itselleni tulee mieleen, on aloittaa säännöllinen sijoittaminen vähäkuiluisiin indeksirahastoihin ja päästä näin käsiksi passiivisiin sijoitustuloihin. Tästä löytyy esimerkki edellisestä postauksestani. Toisille taas sopii paremmin asuntosijoittaminen, mikä tosin vaatii hieman enemmän aktiivisuutta ja isompaa kertasijoitusta.

Menestyspotentiaalin ja itsensä kehittämisen puolesta houkuttelevin vaihtoehto on yrityksen perustaminen ja pyörittäminen palkkatyön ohessa. Nykypäivänä verkkokaupan pystyttäminen ei edes vaadi kovin suuria alkuinvestointeja. Oma yrittäjätaipaleeni alkoi aikoinaan tällaisen verkkokaupan merkeissä. Tosin aikaa joutuu jostakin repimään ja yrittäminen usein kannattaakin aloittaa yhdessä luotettavan kumppanin kanssa, että saa työtaakkaa sekä ajatuksia jaettua.

Moni varmasti ajattelee, että sekä sijoittaminen että yrittäminen on riskialtista. Tottahan se on, mutta omasta mielestäni on vielä riskialttiimpaa, jos koko elämä roikkuu yhden työpaikan varassa. Suomessa sosiaaliturva tuo kyllä toimeentulon puolesta riittävän turvan yhden työn vakituisille työntekijöille, mutta riskinä on oman elämän päätäntävallan valuminen työnantajan ja sosiaaliviranomaisten käsiin. Pomolla on aina valta antaa potkut, mutta sivubisnes antaa myös työntekijälle vallan siirtyä satsaamaan omaan bisnekseen jos tuntuu, että pitää päästä vaihtamaan maisemaa.

Omat tulonlähteeni

Itselläni tulojen jakautuminen on hieman mennyt överiksi. Laskeskelin, että viimeisen kolmen vuoden aikana kuudella eri tulonlähteellä on ollut jonkinlainen rooli itseni elättämisessä. Jonkinlainen fokusoituminen voisi olla jatkossa paikallaan. Nyt kesäloman kynnyksellä olenkin vähän pureskellut menneiden vuosien bisneksieni hyviä ja huonoja puolia.

1. Yrittäjyys

Yrittäjänä on mahdollisuus saavuttaa oikeasti jotain merkittävää. Se tuo mahdollisuuden työllistää ja olla tärkeä palanen yhteiskuntaa. Vastuu on myös iso eikä virheitä voi täysin välttää. Mutta tyytyväisen asiakkaan palaute korvaa kyllä helposti pettymysten hetket. Saimme juuri Statistin kotisivut uuteen uskoon ja tällä ilmeellä lähdemme ottamaan selvää, missä ensi syksynä data-analyysiosaaminen kohtaa maailman tarpeet.

2. Sijoittaminen

Sijoittaminen avaa portit passiivisille osinko/vuokratuloille. Tämä mahdollistaa haaveen ”taloudellinen riippumattomuus jo ennen virallista eläkeikää” saavuttamisen. Tosin huonolla riskienhallinnalla ja tunteiden vallassa elämisellä sijoittaminen voi myös tärvellä oman talouden. Sijoittaminen tarjoaa analyyttisia haasteita ja omia tuloksiaan voi vertailla tunnettujen ”gurujen” kanssa. Erityisesti osakesijoittaminen on avannut silmät siitä, mitä ympärillä maailmassa oikeasti tapahtuu. Se on myös motivoinut ottamaan selvää historiasta, mikä taas luo pohjaa mielenkiintoisille keskusteluille erilaisten ihmisten kanssa. Sijoittaminen tulee taatusti olemaan vahvasti mukana elämässäni jatkossakin.

3. Akateeminen tutkimus

Tällä hetkellä en ole mukana aktiivisesti missään akateemisessa tutkimuksessa. Olen ollut hieman kriittinen tieteellisten artikkeleiden julkaisuprosesseja kohtaan, mutta ne vaikuttavat kehittyvän parempaan suuntaan. Tiedon kaivaminen sekä jakaminen on lähellä sydäntäni ja olen edelleen avoin mielenkiintoisille tutkimuskohteille.

4. Urheiluvedonlyönti

Urheilu on aina ollut läheinen osa elämääni ja siihen liittyvä data-analyysi on kiehtovaa. Vuosikymmen sitten rahan tekeminen nettivedonlyönnissä onnistui vähän yksinkertaisemmallakin matematiikalla, mutta nykypäivänä tehostuneilla markkinoilla analyysitaidot joutuvat tositestiin. Nostankin nöyrästi hattua niille, jotka elättävät itsensä pelkällä vedonlyönnillä ilman sisäpiiritietoa. Itselläni rahkeet riittävät tällä hetkellä vain tiettyjen erikoistilanteiden ja itseäni viisaampien näkemyksen hyödyntämiseen. Vedonlyöntiharrastukseen liittyy matsin katsomiseen yhdistettynä elämyksiä tuova jännitysmomentti ja aionkin pitää sen mukana harrastuksena ilman isoja tuotto-odotuksia. Jokainen plussamerkkinen euro on kotiinpäin.

5. Nettipokeri

Pokerin pelaaminen (itselläni nopeat ”sit and go” -turnaukset) tyydyttää kilpailuviettiä ja pelaamiseen keskittyminen on erinomainen tapa tyhjentää päätä kaikesta muusta epämääräisestä hälinästä. Menestys ei kuitenkaan ole ollut enää viime vuosina huipputasolla. Edellisen kolmen vuoden sijoitetun pääoman tuotto on +0.8 %. Se ei ole riittävä korvaus stressistä, mikä tulee pokeritulojen hurjasta vaihtelusta. Nettipokeri on myös yksinäistä ja isoina annoksina puuduttava harrastus, enkä halua tehdä sitä niin paljon että nykyisellä tuotto-odotuksella vuositulot olisivat varmasti positiiviset (todennäköisyys tehdä neljän tuhannen vuosittaisella turnaustahdilla ja 0.8 % tuotto-odotuksella positiivinen vuositulos on vain 62 %). Trendi vaikuttaa olevan, että vastustajien taso vaan kovenee vuosi vuodelta, joten ilman huomattavia satsauksia lisäkouluttautumiseen ei omassa tapauksessani ole kyse kovin kannattavasta bisneksestä.

En olevielä valmis ripustamaan korttipakkaa täysin naulaan, mutta jatkossa keskitän pelaamisen vain aikoihin kun tuotto-odottama on väliaikaisesti poikkeuksellisen korkea esim. pelifirman tarjoaman bonuksen vuoksi.

6. Tilastotieteeen opetus yliopistokurssilla

Perusasioiden opettaminen on varsin helppo työ, kun materiaalit ja prosessit ovat vuosien varrella kehittyneet toimiviksi. Kolikon kääntöpuolena työ tulisi jatkossa olemaan samojen asioiden ”jankkaamista” eikä kehittäisi itseäni eteenpäin. Niinpä päätin nyt keväällä luopua kurssin vetämisestä tällä erää.

Yhteenveto

Useampi tulonlähde helpottaa selviytymisestä elämän yllättävistä käänteistä ja ylläpitää oman elämän valinnanvapautta. Ajanhallinta on kuitenkin vaikeaa, jos erilaisia tulonlähteitä yrittää haalia liikaa. Itse aion jatkossa keskittyä enemmän yrittämiseen ja sijoittamiseen sekä vähemmän pokerinpelaamiseen ja opettamiseen. Näin uskon myös vapautuvan enemmän aikaa hyvinvoinnin ylläpitämiseen ja sosiaaliseen elämään.

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Totuuden jäljillä

Otetaan heti alkuun pieni pähkinä, joka on hieman muokaten kopioitu Nassim Talebin kirjasta ”Fooled by randomness”.

Kuvitellaan tauti, jota sairastaa yksi tuhannesta suomalaisesta 40 vuotiaasta miehestä. Jarkko menee 40-vuotispäivän kunniaksi lääkärille rutiininomaiseen terveystarkastukseen ja lääkäri suorittaa verikokeen taudin testaamiseksi. Kokeesta tiedetään, että oikeasti sairaiden lisäksi se antaa positiivisen tuloksen 5% todennäköisyydellä silloin kun potilas on terve.

Jarkko sai kokeesta positiivisen tuloksen. Mikä on todennäköisyys, että Jarkolla on kyseinen tauti?

Mieti hetki vastausta, ennen kuin jatkat eteenpäin.

sairaus_graafi2Vastasitko 95%? Ei se mitään, niin vastaa moni muukin pätevä kaveri. Mutta oikea vastaus on n. 2%. Pieleen menee yleensä siinä, että ennakkotieto ”yleinen sairastuneisuus 1/1000” jää huomiotta. Asian hahmottamiseksi vieressä on laatikko, jossa pallerot kuvaavat tyypillistä 1000 hengen otosta 40-vuotiaista miehistä. Punaisella värjätty alanurkan pallero on se epäonninen, joka sairastaa tautia. Jäljelle jäävistä 999 terveestä henkilöstä 0.05 * 999, eli noin 50 henkeä taas ovat sellaisia, jotka saavat verikokeesta virheellisen positiivisen tuloksen. Näitä ovat mustat pallerot ylhäällä. Pähkinän oikea vastaus tulee jakolaskusta 1/(1 + 50).

Edellinen verikoe on esimerkki tilanteesta, jossa totuuden etsimiseksi on kehitetty testi, jonka lopputulokseen liittyy epävarmuutta. Myös tieteen tekeminen on jatkuvaa painimista löydöksiin liittyvien epävarmuuksien kanssa. Esittelen seuraavaksi kolme mittaria, jotka auttavat tieteellisen löydöksen totuusarvon mittaamisessa.

Tilastollinen merkitsevyys (P-arvo)

P-arvo on tärkein ja tunnetuin mittari sille, kuinka uskottava tutkimustuloksemme on. Kyseessä on ehdollinen todennäköisyys: Todennäköisyys, että löydös ilmenee aineistossa sattumalta JOS se ei oikeasti pidä paikkaansa.  Akateemisessa tutkimuksessa löydöstä yleensä pidetään tilastollisesti merkitsevänä, jos P-arvo on pienempi kuin 0.05. P-arvoa kuitenkin ylitulkitaan jatkuvasti samoin kuin ”Jarkon sairausdiagnoosi” -esimerkissä. P-arvo 0.05 EI nimittäin tarkoita välttämättä, että tutkimuslöydös olisi 95% todennäköisyydellä tosi.

Tilastollinen voimakkuus (Power)

Voimakkuus on ”Todennäköisyys, että tutkimusaineisto paljastaa etsimämme ilmiön JOS ilmiö on oikeasti olemassa.” Mediahuomiotakin saaneen Kimble-tutkimuksen tapauksessa: ”Todennäköisyys, että vastakkaisia silmälukuja tulee tilastollisesti merkitsevästi enemmän tutkimuksessamme, jos nopassa on oikeasti systematiikkaa.” Voimakkuuslaskelmia käytetään pääasiassa ennen tutkimusta selvittämään sopivaa otoskokoa tutkimukselle, mutta se on hyödyllinen tieto myös myöhemmin löydöksen totuusarvoa laskiessa.

Ennakkokäsitys ilmiöstä (Prioritieto)

P-arvo ja Power ovat siis ilmiön paljastumistodennäköisyyksiä tietyillä ehdoilla ja me haluaisime päästä käsiksi ilmiön olemassaolon todennäköisyyteen. Tämä onnistuu ottamalla huomioon ennakkokäsitys ilmiöstä ennen tutkimusaineiston keräämistä.

Esimerkiksi Kimble-tutkimuksessa ennakkokäsityksemme oli suurinpiirtein seuraavanlainen: ”Nuorisokodin peleissä ykkönen on tullut kuutosen jälkeeen silmiinpistävän usein. Kyse voi kuitenkin olla sattumasta ja siitä seuraavasta psykologisesta harhasta. Toisaalta systematiikat ovat mahdollisia, koska noppakupu on sen verran pieni. Noppa voisi olla kyseisellä tavalla epäsatunnainen ehkä 20% todenäköisyydellä, eli kerran viidestä.”

Tässä kohti huomataan, että peliä vuosikymmeniä hakanneella konkarilla ennakkokäsitys olla täysin erilainen. Joku aktiivipelaaja olisi saattanut nähdä asian seuraavasti: ”Vuosikymmenten kokemuksella olen hyvin varma ilmiön olemassaolosta.  Väittäisin olevan sen tosi 90% todennäköisyydellä.” Ennakkokäsitys on usein hyvin subjektiivinen näkemys.

ProfessorSubjektiivisten näkemyksien suhteen ollaan ymmärrettävistä syistä varovaisia akateemisen tutkimuksen tilastoanalyysissä. Emme halua, että tieteen tulokset ovat liian riippuvaisia yksittäisen tutkijan subjektiivisesta näkemyksestä. Ainahan on olemassa riski, että ideologiset näkemykset tai henkilökohtaiset haaveet ohjaavat yksittäisen henkilön ennakkokäsitystä tiettyyn suuntaan.

Sen sijaan esim. yrityksen tehdessä tutkimusta vain oman liiketoimintansa päätöksenteon tueksi prioritietoa kannattaa hyödyntää, mikäli palkkalistoilta löytyy asiantuntija, joka osaa muuttaa näkemyksensä numeeriseen muotoon. Liiketoiminnassa taloudelliset intressit kannustavat kohti objektiivisuutta. Virheelliset johtopäätökset kun tuppaavat näkymään yrityksen tuloksessa.

Prioritodennäköisyyden ongelma on sen vaikea määrittäminen yksiselitteisen objektiivisesti. John Ioannidis käyttää artikkelissaan erästä objektiivista lähestymistapaa: selvitetään kaikki viimeaikojen oman tutkimusalan tutkimukset ja käytetään prioritodennäköisyytenä suhdetta, jolla aloitetut tutkimukset ovat lopulta johtaneet oikeaan uuteen löydökseen. Tämän asian selvittäminen ei kuitenkaan käy ihan sormia napsauttamalla.

Tutkimuslöydösten totuusarvot

Nyt meillä alkaa olla riittävästi työkaluja käydä käsiksi tutkittavan ilmiön olemassaolon todennäköisyyteen. Mietitään tyypillistä standardien mukaan suunniteltua tutkimusta. Mikäli matematiikka ei ole lähellä sydäntäsi voit jättää kaavat ja kreikkalaiset kirjaimet omaan arvoonsa. Tutkimuksen tilastollinen voimakkuus  (1-\beta ) on standardi 0.8 ja tilastollinen merkitsevyyskriteeri  (\alpha ) on 0.05. Olkoon testattava hypoteesi  (H_1 ) aiemman Kimble-esimerkin tapainen, mikä voidaan olettaa ennakkokäsityksen mukaan todeksi 20% varmuudella. Nyt jos data kriteereillämme paljastaa ilmiön, sen todennäköisyys olemassaololle on 80%. Tämä saadaan laskettua Bayesin säännöstä johdetulla kaavalla (johdin sen tähän hätään itse, joten suhtautuminen varauksella):

  \mathbb{P}(H_1 | Data) = \frac{(1-\beta ) \mathbb{P}(H_1)}{ \alpha (1-\mathbb{P}(H_1))+(1-\beta ) \mathbb{P}(H_1)}

 

Mietitään sitten vertailun vuoksi tutkimusta, jossa voimakkuus ja merkitsevyyskriteeri ovat edelleen samoja, mutta tarkoitus on testailla vähän kaikkea, jos satuttaisiin löytämään joitain tilastollisesti merkitseviä yhteyksiä. Meillä voisi olla vaikka pitkä lista erilaisista Kimble-pelaajien ominaisuuksista kätisyydestä hapenottokykyyn ja tutkimme, sattuisiko jollain niistä olemaan yhteyttä pelissä pärjäämiseen. Tällöin yksittäiseen testiin liittyvä prioritodennäköisyys ilmiön olemassaololle voisi olla luokkaa 1%. Nyt ylläolevalla kaavalla laskettu totuusarvo kyseiselle löydökselle romahtaa niinkin alas kuin 14%:iin.

Pieni prioritodennäköisyys romauttaa löydöksen totuusarvon, koska sattumalta tulevat löydökset dominoivat tilastollisesta merkitsevyydestä huolimatta. Näin kävi alun sairausdiagnoosipähkinässäkin. Lisäpähkinä pohdittavaksi: Matias saa saman diagnoosin kuin Jarkko, mutta hän tietää jo ennalta omaavansa geenit, jotka nostavat kyseisen sairauden puhkeamisen riskiä.

Käytännön prosessit

SearchingEnnakkonäkemyksen kunnollinen hyödyntäminen on todellisuudessa vaikeaa, mutta tärkeintä tässä on huomata ero huolellisesti valitun hypoteesin tutkimisen ja ”vähän kaiken kokeilun”, (exploratiivisen tutkimuksen) välillä. Tässä vaiheessa moni voi huomata, että omiin tutkimuksiin/tietolähteisiin liittyy enemmän epävarmuutta, mitä on tullut ajatelleeksi. Niin kävi itsellenikin tätä kirjoittaessa. Tutkimuksen huolellisella suunnittelulla voi kuitenkin luottaa olevansa useammin oikeassa kuin väärässä, vaikkei tarkkoja prioritodennäköisyyksiä pystyisikään hahmottamaan.

Tutkimustiedon jatkokäsittelijän taas tulee muistaa olla kriittinen uuden mullistavan tiedon löytyessä. Oleellinen kysymys kuuluu: Kuinka tähän tulokseen päädyttiin? Onko kyseessä hakuammunnan tulos vai oliko alla jo muuta samaa ilmiötä tukevaa tutkimustietoa, jolle nyt haettiin varmistus?

 

Statistickon steesit:

  1. Tutkimuslöydöksen todenperäisyyden arviointiin tarvitaan tilastollisten mittareiden lisäksi prioritiedon hyödyntämistä
  2. Prioritiedon muuttaminen numeroiksi on usein hankalaa, mutta huolellisella tutkimussuunnittelulla voidaan kiertää tätä ongelmaa
  3. Kokeileva, exploratiivinen, tutkimus on tärkeää uusien tutkimussuuntien löytämiseen, mutta siitä on vielä pitkä matka totuudeksi julistamiseen
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Kimblen noppa ei ole täysin satunnainen

Dices sign icon. Casino game symbolSyksyllä jyväskyläläisessä nuorisokodissa pelatuissa Kimble-peleissä tuli huomiota herättävän usein nopan heitolla, tai Kimblen tapauksessa kuvun sisällä olevan nopan poksautuksella, kuutosen jälkeen ykkönen. Tämän toistuessa peliseurueessa alettiin sadatella jatkuvaa heitto-onnen kääntymistä aallonharjalta pohjamutiin. Eräs nuorisokodin ohjaajista yritti puhua kanssapelaajilleen järkeä: noppa on aina satunnainen ja kuutosta seuraaviin ykkösiin oli vain alettu kiinnittää liiaksi huomiota. Koko ilmiön täytyi olla vain seurueen puheilla itselleen rakentama psykologinen harha.

Asian selvitys tutkimuksella

Orastava debatti kantautui tilastotieteilijä Tuomas Kukon korviin.  Ammattilaisen korvaan tutkimusongelma kuulosti äkkiseltään naiivilta: onhan arpakuution klassiset todennäköisyydet laskettu läpi jo pimeällä keskiajalla. Toisaalta Kimblen noppakupu on sen verran pieni, että voi olla pieni mahdollisuus sille, ettei satunnaisuus pääse sen sisällä täysin toteutumaan (nopan satunnaisuuden toteutumista käsiteltiin tässä postauksessa). Niinpä tutkimusryhmä pystytettiin, ja joululoman 2014 pimeinä iltoina, osin lapsityövoimaa hyödyntäen, tahkottiin kolme tiukkaa Kimble-matsia ja kirjattiin ylös kaikki 508 nopanheittoa.

Tutkimusongelma asetettiin analyysin tehostamiseksi siten, että kaikki vastakkaiselle puolelle tapahtuneet siirtymät (1 <–> 6, 2<–>5 ja 3<–>4) oletettiin yhtä todennäköisiksi. Kuvun sisällä olevan nopan symmetrisyyttä siis ei kyseenalaistettu vaan mahdollisten epäsatunnaisuuksien oletettiin tulevan kuvun takia lähtötilanteesta riippuen.  Lähtökohtaisesti paikkansa pitävä vanha totuus, eli nollahypoteesi, oli seuraava: ”Nopan vastapäinen luku tulee yhtä todennäköisesti kuin mikä tahansa muukin luku (n. 16.7%)”.

 Mullistava tulos

Jo otteluiden aikana alkoi lukuisia aineistoja pyöritelleen kirjurin silmään vaikuttaa siltä, että kyseessä saattaa sittenkin olla todellinen ilmiö, mutta vasta aineiston analyysivaihe toi julki varsinaisen jytkyn. Nopan vastapuoli heitettiin peräti 23.9% todennäköisyydellä, eli lähes puolitoista kertaa todennäköisemmin kuin ennakolta oletettiin. Osuuksien testin perusteella laskettiin tuloksen tilastollinen merkitsevyys. P-arvo tippui prosentin sadasosiin, kun yleisesti nollahypoteesin kumotuksi toteamiseen riittävät viittä prosenttia pienemmät arvot.

Koeasetelma (otteluiden heittojen lukumäärä) oli räätälöity paljastamaan nopan vastapuolen saamisen todennäköisyyden poikkeamia odotetusta siten, että noin kolmen prosenttiyksikön heilahdus 16.7% :sta oli löydettävissä. Tässä tutkimusryhmän suureksi yllätykseksi onnistuttiin, sillä ponnautusmekanismi Kimble-kuvun sisällä on mitä ilmeisimmin roimasti oikeaa nopanheittoa vähemmän satunnainen.

 Hyödyt pelaajille

Onko tästä löydöstä mitään konkreettista hyötyä Kimblen pelaajalle? Varmasti tulee vastaan tilanteita, joissa tätä tutkimustietoa voi hyödyntää. Mietitään esimerkiksi seuraavaa tilannetta:

Idea for gameHeität noppaluvun 5 ja sinulla on kaksi mahdollista siirtoa:

  1. Siirto, jossa nappisi siirtyy KOLME askelta seuraavana heittävän napin eteen
  2. Siirto, jossa nappisi siirtyy KAKSI askelta seuraavana heittävän napin eteen

Et tietenkään halua tulla syödyksi ja tiedät, että seuraavaksi nopasta tulee todennäköisimmin luku 2. Ensimmäinen valinta on tutkimuksen tiedon ansiosta nyt parempi ratkaisu. Lisäksi joskus, lähinnä aikuisten peli-illoissa, käytetään myös sääntövariaatiota, jossa mitään nappuloista ei ole pakko liikuttaa. Tällöin tämän tutkimuksen tarjoamien valistuneiden valintojen avulla voidaan kohottaa huomattavasti omaa voittotodennäköisyyttä.

 Sivutulos

Kerätty aineisto antoi varsinaisen tuloksen lisäksi mielenkiintoisen johtolangan. Siinä missä nopan vastapuoli ponnahti esiin n. 24-prosenttisesti, niin sama luku heti perään ilmaantui vain 10.8% todennäköisyydellä. Neljälle muulle nopan kantille jäi yhteensä 65.3% (eli keskimäärin 16.3%)  todennäköisyys. Käytännössä vastakkaisen luvun lisääntyminen selittyi pelkästään saman luvun toistumisen vähentymisenä ja kuution vierekkäiset sivut noudattelivat suurin piirtein ”rehellisiä” todennäköisyyksiä. Tätä ilmiötä ei alkuperäisen tutkimushypoteesin valossa tarkkailtu, joten olisi syytä kerätä vielä uusi aineisto, jotta minimoidaan yksittäisen aineiston satunnaisoikun mahdollisuus. Näin ei langeta aiemmin käsiteltyyn vanhaan miinaan.

Jatkotutkimukset

Tutkimukseen toteuttamiseen liittyy vielä pari kyseenalaistavaa kysymystä:

  • Kaikki heitot tehtiin samalla Kimble-laudalla. Voiko tulokset selittyä viallisella laudalla?
  • Nopan ”poksautuksia” suoritti kolme eri henkilöä. Voiko heillä joku systematiikka poksautus-tyylissä, mikä selittää tutkimuksen tulokset?

Näiden epäilyjen kumoamiseksi ja sivutuloksen oikeellisuuden varmistamiseksi haastan blogin lukijat keräämään talteen heittosarjan seuraavasta Kimble-pelistä. Kirjatkaa sarjat sitten tämän postauksen kommentti-osioon. Kunhan dataa on riittävästi kertynyt, suoritetaan eeppinen jatkotutkimus.

Kimblestä järjestettiin SM-kisat viimeksi vuonna 2012. Blogin lukijoiden onkin nyt hyvä aika aloittaa harjoittelu seuraavia kisoja varten. Ja kirjata luonnollisesti samalla heittosarjat ylös jatkotutkimuksiin.

Statistickon steesit:

  1. Kimblessä kannattaa minimoida ne riskit mitkä toteutuvat pelivuorossa seuraavan vastustajan heittäessä nopasta vastakkaisen luvun
  2. Lautapelin ollessa kilpaurheilun sijaan perheen leppoisaa ajanvietettä, sitä ei kannata pilata liian syvällisellä taktikoinnilla [ terveiset tähän väliin siskolle :) ]

Teksti on kirjoitettu yhdessä analyyseista vastanneen kollega Tuomas Kukon kanssa.

 

 

 

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Joululahjaksi laadukasta ajattelua

Tähän aikaan vuodesta useilla on pähkäilyn alla ”Mitä hankkia joululahjaksi henkilölle, jolla on jo kaikkea. Mitään turhaa krääsääkään ei viitsisi ostaa…” Oma vinkkini on tajuntaani hurjasti laajentanut kirja Thinking fast and slow tai sen suomennettu versio Ajattelu nopeasti ja hitaasti. Kirjan on kirjoittanut Daniel Kahneman, joka on tutkinut päätöksenteon psykologiaa vuosikymmeniä ja palkittu elämäntyöstään Nobelilla. Thinking fast and slow nitoo yhteen kansantajuisesti oppeja ihmisten psykologisista ajattelun luonnollisista vääristymistä verrattuna matemaattiseen rationaalisuuteen.

Miksi haluaisimme ymmärtää psykologisia heikkouksiamme?

KulutusvalintaOletko joskus huomannut ostaneesi mainoksen perusteella tuotteen, jolle ei ole juuri käyttöä löytynytkään?  Tai oletko äänestänyt vaalimainosten ja -lupausten perusteella poliitikkoa, joka ei oikeasti jaakaan samoja arvoja kanssasi? Jätän lukijan itse pohdittavaksi, kuinka paljon todellisuudessa mainostoimistot tai poliitikot pyrkivät johtamaan kuluttajia harhaan, mutta ei siitä ainakaan haittaa ole, mikäli jatkossa osaamme välttää joitain ansoja ja tehdä enemmän oikeasti hyvinvointiamme edistäviä valintoja.

Oletus rationaalisesta päätöksentekijästä

Taloussysteemimme rakenteita on pyritty ilmaisemaan taloustieteen perusteoksissa yksinkertaisin matemaattisin esityksin. Jotta tämä olisi mahdollista, joudutaan niissä usein tekemään myös hieman epärealistisia oletuksia tyyliin: ”Kuluttajat valitsevat aina sellaisen kulutusratkaisun, mikä maksimoi heidän tulevan hyvinvointinsa.” Koska tällaiset superrationaaliset yli-ihmiset ovat aika harvinaisia, ovat kriittisimmät tyypit valmiita hylkäämään koko taloustieteen ”huuhaana”. ”Juupas-eipäs”-väittelyn sijaan psykologi Daniel Kahneman on yhdessä edesmenneen Amos Tverskyn kanssa selvittänyt urallaan, millä lailla ja kuinka paljon ihmisten tyypillinen ajattelu poikkeaa rationaalisesta päätöksenteosta. Näenkin Kahnemanin&Tverskyn tutkimuksissa sillan tunteita korostavien humanistien ja kylmän rationaalisuuteen pyrkivien taloustieteilijöiden välille toistensa ajatusmaailmoihin.

Sattuman käsittely

Omaa innostusta kirjaa kohtaan ei ainakaan laske se, että Kahneman vaikuttaa myös erittäin pätevältä tilastotieteilijältä. Iso osa hänen tutkimuksistaan koskee sitä, kuinka ihminen tekee valintoja epävarmuuden vallitessa.

Ihmisten aivot kehittyvät evoluution mukana, mutta evoluutio ei ole pysynyt teknologisen kehityksen ja talouskasvun vauhdissa. Teemme herkästi ylireagointeja pienten aineistojen informaatioon, joissa on paljon sattumalla osuutta asiaan. On elonjäämisen kannalta kriittistä osata ylireagoida pieniinkiin vaaran merkkeihin, kun elämme samoilla seuduilla villien petoeläinten kanssa. Sen sijaan turvallisessa Pohjolan hyvinvointiyhteiskunnassa asuen eteen tulevissa valinnoissa ylireagointi ei ole niin hyödyllistä.

Opit rahapelaajille ja kilpaurheilijoille

Sattuman merkityksen ymmärtäminen ei ole todellakaan helppoa. Vaikka takana on vuosien työ tilastoaineistojen parissa erilaisia simulointikokeita tehden, niin sattuma vaan välillä pääsee yllättämään omissa henkilökohtaisissa asioissa, kuten itselläni oman pokerimenestyksen pohdinnassa. Jalkapallotoimittaja Lari Vesander taas avaa blogikirjoituksessaan Kahnemanin oppeja siitä, kuinka kilpaurheilun satunnaisuus hämää jatkuvasti urheiluselostajia ja valmentajia.

Ihmiset tyypillisesti kokevat rahalliset tappiot saman kokoista voittoa suurempana ja painottavat liikaa ajattelussaan pieniä, suuruusluokkaa 0.1% – 5% olevia todennäköisyyksiä. Nämä opetukset ovat myös vallitsevia teemoja pokerin oppi-isäni Tommi Verkasalon pokeripsykologiaa käsittelevässä ansiokkaassa gradussa: Voiton ja häviän vaikutus pokerinpelaajan riskipreferensseihin. Jääkiekossa tappiolla ollessa kannattaa ottaa hurjiakin riskejä (maalivahti pois lopussa) ja johdossa pelata ylivarovaisesti. Sama käyttäytymismalli toistuu kuitenkin myös pokerissa, vaikka siinä jokaisen Euron/Dollarin pitäisi olla yhtä arvokas riippumatta oletko siltä päivältä voitolla vai häviöllä.

Kahnemanin opit myös osaltaan selittävät lotto-tyyppisten arpajaisten ja vakuutusten suosiota (arpalipun hintaa ja pientä vakuutusmaksua ei yleensä koeta tappioksi). Lähinnä matemaattisen riskienhallinnan näkökulmasta kirjoittamani blogipostaukseni vakuutuksista saa kirjassa tuntemuksiin perustuvan jatko-osan.

Valintojen muokkautuminen

Vuosikymmenten akateemisia tutkimustuloksia yhteen paketoiva kirja kuulostaa äkkiseltään aika kuivalta joulupuurolta, mutta Kahneman onnistuu kirjoittamaan helppotajuisesti erilaisilla testeillä lukijaansa viihdyttäen. Yksi suosikeistani on seuraava:

Ongelma 1:

Valitse toinen:

E. 25% mahdollisuus voittaa 240$ ja 75% mahdollisuus menettää 760$.

F. 25% mahdollisuus voittaa 250$ ja 75% mahdollisuus menettää 750$

Ongelma 2:

Kuvittele, että joudut päättämään seuraavasta samanaikaisesta asiaparista. Pohdi ensin kumpaakin päätöstä ja kerro sen jälkeen, mitä valintoja (AC, AD, BC vai BD) suosit.

Päätös (i). Valitse toinen:

A. Varma 240$ voitto

B. 25% mahdollisuus voittaa 1000$ ja 75% mahdollisuus olla voittamatta mitään

Päätös (ii). Valitse toinen:

C. 750$ varma menettäminen.

D. 75%:n mahdollisuus menettää 1000$ ja 25%:n mahdollisuus olla menettämättä mitään.

Ongelma 1:ssä on helppo nähdä, että F on kannattavampi vaihtoehto ja Kahnemanin kokeessa kaikki koehenkilöt valitsivat sen. Ongelma 2:ssa tulee taas hieman vaihtelua. Kokeessa suosituin valintayhdistelmä oli AD (73% koehenkilöistä valitsi sen) ja kaikista epäsuosituin  BC (vain 3% koehenkilöistä). Nyt kun asiaa hieman tarkemmin mietitään tarvittaessa taskulaskimella summaten, niin huomataan että yhdistelmä AD on itse asiassa aivan sama kun Ongelma 1:n  E-vaihtoehto. Ja vähiten suosittu BC… aivan oikein: Ongelma 1:n F, minkä piti olla selvästi järkevämpi valinta.

Järki ja tunteetTämä esimerkki havainnollistaa kuinka helposti normaalit psykologiset ”heikkoudet” ja yksinkertaiset nyrkkisäännöt dominoivat ajattelua kun pitäisi tehdä vähäänkin haastavampaa matemaattista laskentaa. Toisaalta se havainnollista kuinka voidaan saada toinen ihminen olemaan samasta asiasta eri mieltä muotoilemalla asiaa eri muotoon tyypillisiä ajattelun vinoutumia hyödyntäen.

Itselläni tämä kirja tärähti tietokirjallisuuden TOP-listani kärkeen. Päällimmäinen ajatukseni nyt kun takakansi tuli vastaan on ”Pitääpä aloittaa heti alusta uudelleen”.

Joitain Kahnemanin teesejä normaalista ihmisestä tuntemuksineen:

  • pyrkii tekemään ensisijaisesti päätöksiä intuition ja helppojen nyrkkisääntöjen perusteella
  • pyrkii välttämään tappion tunteita ja ylisuojelemaan saavutettuja voittoja
  • aliarvioi sattuman vaikutusta ja yliarvioi oman tietämyksensä
  • korostaa huippuhetkiä ja viimeisiä tapahtumia muistojen onnellisuuden kokemisessa
Facebooktwittergoogle_plusredditpinterestlinkedinmail