Rss

  • linkedin

Archives for : Tutkimukset

Opiskelua ja soveltamista

Kun aloittelin puoliammattilais nettipokeri-uraa 2000-luvulla, opiskeluun ja pelin analysoimiseen meni ehkä 30%-40% pokeriin käytetystä ajasta. Ura oli huipulla vuosina 2009-2011, jolloin pokeri oli pääasiallinen toimeentulon lähteeni. Urahuipun jälkeen pokerin tutkimiseen käytetty aika alkoi lähenemään pikkuhiljaa kohti nollaa, kun pokerikirjallisuuden tilalle tuli talous-, sijoitus- ja pisneskirjallisuus. Intohimoni alkoivat siirtyä näihin muihin aiheisiin. Pokerin pelaamisen tuototkin alkoivat laskea viiveellä, kunnes vuonna 2016 totesin, ettei pelaaminen ole enää ollenkaan järkevää ajankäyttöä. Toisin sanoen, putosin pelistä pois kun ei taso enää riittänyt.

Loppuelämän ajan allokointia

Nyt viimeisenä parina vuonna aikaa on paljon vienyt toisen maisterintutkinnon opinnot, mitkä valmistuivat joulukuussa. Tällä hetkellä olen puolipäiväinen tohtori-koulutettava. Elämäni alkaa lähestymään odotusarvoisesti puolen välin krouvia, mikä on pistänyt miettimään: ”Miten paljon opiskeluun näin aikuisena on järkevää laittaa aikaa?” Muistin, että muutama vuosi sitten kesken jääneessä kirjassa Algorithms to Live By käsiteltiin tämän tyyppisiä “Explore/Exploit” -ongelmia. Sieltä selvisi vastaus joihinkin rajoitettuihin päätöksenteko-ongelmiin. Esim. kun bensaa riittää enää 100 km matka-ajoon ja haluamme maksimoida todennäköisyyden, että tankkaamme halvimmalla mahdollisella bensa-asemalla, kannattaa ensimmäiset 37 km “opiskella” hintoja ja sen jälkeen vasta iskeä kun tulee siihen mennessä halvin hinta vastaan. Koko elämän matkalle täsmällistä vastausta ei kuitenkaan löytynyt.

Kirjassa puhuttiin siitä, että nuorena kun on enemmän aikaa vielä jäljellä, opittua ehtii enemmän myöhemmin soveltamaan ja päälle uutta oppia kasaamaan. Toisaalta jotkin taidot vanhenevat ja kun on vielä vähän kokemusta käytännön töistä, ei oikein tiedä, mikä on itselleen hyödyllisintä teoreettista osaamista.

Yliopisto-opintojen kesto ja itseluottamusbuusti

Suomessa on yliopistoissa on tyypillistä opiskella suoraan maisteriksi n. 5 vuotta ja sen jälkeen aletaan oppeja soveltamaan työelämässä. Oman Dunning-Kruger – käyrän (lue ilmiöstä esim. täältä) mukainen yli-itseluottamuksen huippu sijoittuu varmaankin vuodelle 2012, jolloin valmistuin tilastotieteestä maisteriksi. Olin saanut käteeni virallisen todistuksen osaamisestani, mutta vähämpä vielä tiesin, mitä kaikkea tosielämän datojen kanssa painiminen vaatii. Tätä vuoden 2012 itseluottamuksen ja todellisen osaamisen välistä kuilua olen verkkokurssien, kirjojen ja nyttemmin jatko-opintoihin liittyvien kurssien avulla koittanut kiriä kiinni.

Nyt tuoreena kauppatieteen maisterina suhtaudun osaamiseni hieman nöyremmin. Lähinnä koen oppineeni talouden dynamiikan peruskonsepteja (joista osa mielestäni kuuluisi peruskouluun), ammattitermistön sekä nipun malleja yksinkertaistettuihin tilanteisiin. Gradun aiheeseen (kerroin edellisessä kirjoituksessa) olen syventynyt kunnolla, mutta yleisesti todellinen ekonomistin ammattitaito tulee myöhemmin tekemisen kautta jos on tullakseen.

Useampikin ulkomaalainen tuttu on edennyt urallaan siirtymällä kandidaatin tutkinnon kanssa työelämään ja jatkanut maisteriopintoihin vasta kun töiden ohessa on kirkastunut, mihin haluaa erikoistua. Tällä kirjoituksella haluankin nostaa esiin tällaista pitkäjänteisempää opiskelun ja käytännön työn toistuvaa vuoropuhelua. Ainakin näin jälkikäteen on helppo omalle kohdalle viisastella, että jokunen tunti luentosalin penkin kuluttamista olisi säästynyt, mikäli olisin tilastotieteessä tyytynyt kandin tutkintoon ja loikannut maisteriopintoihin taloustieteen puolelle silloin kun kiinnostus talousasioita kohtaan syttyi. Tilastotieteen työkalupakkia kun nyt olen joka tapauksessa joutunut myöhemmin reilusti päivittämään käytännön tarpeisiin tieteen ja teknologian kehittyessä.

Ikuista opiskelua

Mitäs nyt sitten jatkossa? Sen olen itsestäni oppinut, että kovin pitkään putkeen en malta keskittyä pelkästään opiskeluun/tutkimukseen, koska uusien oivallusten myötä alkaa virtaamaan ideoita, joita tulee hinku päästä toteuttamaan käytännössä. Toisaalta pitkäkestoisessa projektityössä taas kertyy ”opiskeluvelkaa” eli havaitsee asioita joita voisi tehdä jatkossa paremmin, muttei projektin puitteissa ehdi kunnolla paneutumaan.

Koska saan niin paljon kiksejä uusien asioiden ymmärtämisestä, tulen luultavasti koko loppuelämäni ajan opiskelemaan/tutkimaan jotain uutta. Kysymys on lopulta itselleen sopivan balanssin löytämisestä käytännön työskentelyn ja opiskelun/tutkimisen välisessä pallottelussa taloudellisten rajoitteiden puitteissa. Akateemiset tutkinnot saavat väitöskirjan jälkeen kyllä riittää, mutta onneksi netti on pullollaan vuosi vuodelta parempia edullisia verkkokursseja aina tarpeen mukaan.

Ehkä tämän kirjoituksen alkuperäiseen kysymykseen ei tarvitakaan vastaukseksi mitään loppuelämäksi kiveen hakattua ajan allokointi-suhdetta vaan riittää mennä eteenpäin tilanteen mukaan vuosi kerrallaan pitäen huolta sellaisesta osaamisesta, missä haluaa jatkossa loistaa?

Facebooktwitterredditpinterestlinkedinmail

Kelly-vetoja osakkeiden maailmassa

Pian päättyvä vuosi on ollut sekä tämän blogin että lähes kaiken muunkin vapaa-ajan aktiviteetin osalta aika hiljainen. Suurin yksittäinen selittäjä pandemian lisäksi tälle on se että tämä vuosi päättää seitsemän vuotta sitten alkaneen taloustieteen opiskeluun liittyvän opinto-oikeuden. Vuosi on sisältänyt paljon pitkiä iltoja gradun parissa. Nyt kyseinen apina on selästä pudotettu ja tässä kirjoituksessa kerron mitä iloa graduni voisi muillekin tuottavaa.

Gradun salainen taka-ajatus on ollut kehittää itselleni työkalua, jonka avulla voisin hahmotella sopivaa riskinoton määrää eri sijoituskohteille osakemarkkinoilla. Kun työn kokonaisuus alkoi hahmottumaan, huomasin että tämähän on aika hyvä lähestymistapa sijoittamiseen kelle tahansa satunnaisesti osakesijoittamista harrastavalle.

Romahduksia tulee, mutta ei hävitetä silloin kaikkia palikoita

Vanhana urheiluvedonlyöjänä Kellyn kriteeristä on muodostunut standardi riskinhallinan työkalu. Tässä kirjoituksessa aiemmin jo avasin Kellyn kriteerin saloja yksinkertaisessa vedonlyönnissä. Lyhyesti tavoitteena on maksimoida pitkällä ajanjaksolla varallisuuden kasvuvauhti ilman että missään välissä menee konkurssiin. Gradussa pyrin tarjoamaan yhden ratkaisun Kellyn kriteerin käytännön hyödyntämiseen osakemarkkinoilla, mikä aiheuttaa kipuilua koska osakkeiden tulevaisuuden tuottojen luotettava kuvaaminen matemaattisesti ei ole mikään helppo nakki. Opinnäytetyön pyrin kirjoittamaan tieteelliseen muottiin ja siihen voi tutustua täällä. Nyt blogikirjoituksessa kuitenkin otan vapauden puhua sijoittamisesta vapaasti omien näkemysten mukaan.

Satunnaiselle säästäjälle/sijoittajalle markkinan keskituoton tavoittelu laajasti hajauttavan indeksirahaston avulla on järkiratkaisu. Myös graduni sijoitusstrategiassa indeksi on pääsijoituskohde ja tärkein ratkaistava asia on päättää kuinka suuri osuus omaisuudesta on kiinni osakeindeksissä ja kuinka paljon “riskittömässä” korossa, eli nykyään käytännössä käteisessä.

Mitä tulee markkinoiden tehokkuuteen, itse näen asian subjektiivisena asiana. Kaikista näppärimmät ja nopeimmat hyvin informoidut kaverit pystyvät tekemään systemaattista ylituottoa ja elättämään itsensä käymällä pörssikauppaa. Mutta juuri näiden kavereiden kaupankäynti ajaa hintoja sellaiselle tasolle, että keskivertosijoittajalle markkinat näyttäytyvät varsin tehokkaina. Vaikka tavalliselle päivätyössä käyvälle sijoittajalle suurimmassa osassa yrityksistä on liian vaikea hankkia informaatioetua markkinoihin, minussa asuu kuitenkin ripaus Peter Lynchmäistä optimistisuutta. Mikäli herran kirjallisuus ei ole tuttua, voit aloittaa tutustumisen vaikka tästä Inderesin podista.

Lynchin ydinajatus on että kuka tahansa voi saavuttaa informaatioetua osakesijoittamissa sellaisten yritysten tai toimialojen kohdalla, joiden parissa viettää joka tapauksessa paljon aikaa esimerkisi työn tai harrastuksen takia. Esim. jos työskentelet auton osia valmistavassa firmassa ja toimitat tavaraa usealle kilpailevalle auton valmistajalle, voit olla hajulla siitä millä valmistajalla tänä vuonna myynti kiihyttää eniten ennen kun virallisten raporttien tieto menee ammattianalyytikoille. Tai vaikka intohimoisena peliharrastajana voit olla ensimmäisten joukossa hajulla, minkä firman uudesta pelistä tulee seuraava jättihitti. Kyse on yksinkertaisesti siitä, että pitää tietää jotain tärkeää, mitä suurin osa muista sijoittajista ja analyytikoista ei vielä tiedä.

Vaikkei työskentelisikään sellaisella alalla, missä voisi saada informaatioetua, suora sijoitus yksittäiseen osakkeeseen on perusteltua myös oppimisprosessin ja mielenkiinnon ylläpidon takia. Itselläni osakesijoittamisen aloittaminen vuonna 2009 sytytti aivan uudenlaisen uteliaisuuden kipinän ympärillä pyörivää yhteiskuntaa kohtaan. Uteliaisuus johti lopulta vuonna 2013 taloustieteen opiskelun aloittamiseen ja nyt lopultakin tämän gradun valmistumiseen. Joten olkaahan varovaisia siellä!

Sijoitusmaailmasa vain epävarmuus on varmaa, joten sijoitussalkun runko on hyvä perustaa hajautettuun indeksiin vaikka yksittäisessä firmassa olisikin erittäin hyvin hajulla. Gradussa kehittämässäni algoritmissa riskittömän koron ja osakeindeksin lisäksi on mahdollista sijoittaa myös yhteen yksittäiseen osakkeeseen. Rajaus yhteen johtui puhtaan teknisistä syistä: useamman osakkeen käsittely yhtäaikaa vaatisi myös näiden välisen riippuvuuden mallintamisen (mikä ei selity yleisellä markkinakehityksellä) ja olisi lisännyt työmäärää, mitä riitti näinkin ihan tarpeeksi. Käytännössäkin keskivertosijoittajalla ei voi olettaa olevan kovin montaa oikeasti hyvää sijoitusideaa kerrallaan, joten sen puolesta ehkä on vain hyvä ettei laita paljoa paukkuja kuin parhaaseen ideaansa.

Vaikka tavoiteltavan sijoitustyökalun ideana on käyttäjän itse antaa yksittäiseen osakkeeseen liittyvää omaa “erikoistietämystä”, gradussa yksittäisen osakkeen näkemys pohjautuu analyytikoiden tavoitehintoihin. Tällä hetkellä työkalusta on julkaistu demoversio, mikä noudattaa täysin gradun kaavoja ja antaa tehdä sijoituspäätöksen 31.12.2019 olleilla tiedoilla 20 vuoden historiaan ja sen hetken analyytikoiden tavoitehintoihin pohjautuen. Sijoituskatalogissa valikoimassa on käteinen, Helsingin pörssin osakeindeksi ja valtionyhtiöitä (väh. 10% omistus), joilta on historiadataa 20 vuoden ajalta. Työkaluun voi tutustua täällä.

Ennen kuin teet sijoituspäätöksiä työkalun perusteella on hyvä tiedostaa, että älä tee. Ainakaan pelkästään sen avulla. Käytän hintojen mallintamisessa t-jakaumaa, mikä on paksuhäntäisenä normaalijakaumaa huomattavasti parempi vaihtoehto. Mutta mikäli on Talebinsa lukenut, tietää ettei osakkeiden tuottojakaumien häntien kanssa ihan näin helpolla selviä ja sellaisia ikäviä yllätyksiä on odotettavissa, mihin pelkästään historiadatan avulla ei pystytä varautumaan. Mikäli tämä tai muut mallin yksityiskohdat kiinnostavat, niistä voi lukea lisää gradusta. Tässä kohtaa on oleellista tietää, että työkalu sopii lähinnä omaan riskinsietokykyyn sopivan osakeriskin ylärajan hahmottelemiseen. Käytännössä mustien joutsenien takia riskit kannattaa pitää työkalun suositusta alemmalla tasolla. Kehitystyö varmasti jatkuu, näillä näkymin myös tieteellisen julkaisun muodossa, ja kehitysideoita otan ilomielin vastaan.

Bayes-Kelly osakeportfolion optimointistrategia pähkinänkuoressa:

1. Valitse yksi osake riskivapaan koron ja indeksisijoituksen lisäksi (tai tyydy pelkkään indeksiin)

2. Valitse itsellesi sopiva turvarajoite = “hyväksyttävä vuosittainen tappio prosentteina sijoitusvarallisuudesta”

3. Optimoidaan eri kohteisiin sijoitettavat osuudet varallisuudesta niin että pitkän tähtäimen (tästä hetkestä ikuisuuteen) odotettu varallisuuden kasvuvauhti maksimoituu ja todennäköisyys kohdata yksittäisenä vuonna suurempi tappio kuin turvarajoite on alle 5%.

Tästä pääsee leikkimään työkalun mvp demolla ja tästä lukemaan gradua.

Facebooktwitterredditpinterestlinkedinmail

Kuinkas paljon aineistoa saisi olla?

Kun opiskelin tilastotiedettä, luennolla professori kerran antoi eväitä tulevaan työelämään kutakuinkin seuraavasti: ”Yleisin kysymys, mitä teiltä kysytään työelämässä kuuluu ’Mikä on tutkimuksessani sopiva otoskoko?’ Näihin kysymyksiin te sitten vastaatte: ’En tiedä’ ”

Proffan profetia kuulosti alkuun hämmentävältä, koska oltiinhan me opiskeltu voimakkuuslaskelmien tekoa sopivan otoskoon määrittelemiseksi tutkimukseen. Taustalla lienee sekä kokeneelle tilastotieteilijälle asian kuuluvaa nöyryyttä epävarmuuden edessä, mutta myös skeptisyyttä vastaamiseen tarvittavien tietojen saatavuudesta. Ilmeisesti hänelle tämän kysymyksen esittäneillä henkilöillä on ollut harvoin tarpeeksi lisätietoja kysymykseen vastaamiseksi tai hän odottaa asian ratkeavan yhdellä pikaisella puhelinsoitolla, vaikkei tilastotieteilijäparalla ole siinä tilanteessa tarvittavia työkaluja käsillä.

Viime vuosina en ole juurikaan työskennellyt kyselyjen tai koesuunnitelmien kanssa vaan pohtinut enemmänkin päätöksenteko-ongelmia tilanteissa, joissa dataa on mitä on eikä tule lisää. Viime keväänä päätin kuitenkin kohdata tämän kysymyksen pitkästä aikaa silmästä silmään kun Surveypalilta kutsuttiin keskustelemaan aiheesta heidän webinaarissaan. Käyn seuraavassa tiivisti pohdintojen ydinkohdat esimerkin avulla läpi.

Iso yritys, jolla on kymmeniä tuhansia asiakkaita järjestää
asiakaskyselyn, jossa se kysyy

  1. Perinteisen NPS – kysymyksen: Asteikolla 0-10, kuinka todennäköisesti
    suosittelisit yritystämme ystävillesi?

  2. Mikä seuraavista neljästä osa-alueesta kaipaa eniten
    yrityksessämme kehittämistä?

Tutkimusongelmat

Tutkimusongelma 1: Minkä ongelman korjaamiseen pitäisi ensisijaisesti
laittaa resurssit?

Seuraavassa on simuloitu kyselytutkimuksen tuloksia tilanteessa, jossa ongelma A koskee 10% asiakkaista, ongelma B 20% asiakkaista, ongelma C 30% asiakkaista ja ongelma D 40% asiakkaista. Kuvaajassa ongelmaa on väritetty sitä punaisemmaksi, mitä vakavampi se on. Tavoitteena olisi siis löytää kyselyn avulla tulipunainen ongelma D.

Kuvaajassa on todennäköisyys kullekin ongelmalle päätyä kyselyn vastauksissa eniten kannatusta saaneeksi ongelmaksi erilaisilla kyselyn otoskoilla.

Ongelmien todennäköisyydet päätyä eniten raportoiduksi erilaisilla palautteiden määrillä. 
Ongelma A = vihreä
Ongelma B = keltainen
Ongelma C = pinkki
Ongelma D = punainen

Kuvaajasta nähdään mm. että jo 50 otoskoolla ongelma D spotataan yleisimpänä vastauksena noin 80% todennäköisyydellä ja lähes aina kun mennään pieleen päädytään toiseksi vakavampaan ongelmaan C. Näemme myös että otoskoosta 100 tarkkuus kasvaa vain marginaalisesti otoskoon tuplaamisella 200:aan. Tämä havainnollistaa nyrkkisääntöä, että datan määrän kasvaessa informaatio ei kasva lineaarisesti vaan hidastuvasti: mitä enemmän dataa jo on, sitä vähemmän uusi data hyödyttää.

Tutkimusongelma 2: Mikä on koko asiakaskunnan todellinen NPS-luku 5 yksikön virhemarginaalin tarkkuudella?

Seuraavassa on simuloitu kyselytutkimuksen tuloksia tilanteessa, jossa 40% koko asiakaskunnasta on suosittelijoita (arvosana 9-10) ja 20% arvostelijoita (arvosanat 0-6). Todellinen NPS-luku on 40 – 20 = 20. Kuvaajassa on esitetty eri otoskoilla kyselyn tuloksen mediaani yhtenäisellä mustalla viivalla ja 95% varmuuteen pohjautuva virhemarginaali mustalla katkoviivalla. Punaiset viivat kuvaavat toivottua virhemarginaalia 5.

Kyselyn lopputuloksen virhemarginaali eri otoskoilla katkoviivana ja toivottu virhemarginaali punaisena viivana.

Toivottu virhemarginaali toteutuu vasta kun katkoviiva leikkaa punaisen viivan jossain 800 vastaajan otoskoon tienoilla. Kun ensimmäiseen tutkimusongelmaan saadaan vastaus riittävällä varmuudella jo 50 palautteella, tähän toiseen vaaditaankin 16 kertainen määrä vastauksia.

Otantaharha

Tutkimusongelman kaksi tutkiskelussa oletettiin, että vastaukset muodostavat harhattoman satunnaisotoksen koko asiakaskunnasta. Tämä voi olla joskus realismia tieteellisessä kontrolloidussa ympäristössä, mutta harvemmin asiakaskyselyissä. Muutetaanpa aiempaa simuloitua todellisuutta sen verran, että kriittiset arvostelijat vastaavat kaksi kertaa todennäköisemmin kyselyyn kuin suosittelijat. Nyt 800 otoskoko mittaa riittävällä tarkkuudella harhaista NPS-lukua 0 eikä todellista lukua 20. Vastaus alkuperäiseen kysymykseen voikin olla ettei tämä tutkimusongelma ratkea lainkaan käytettävissä olevilla resursseilla, jos harhan suuruudesta ja suunnasta ei ole mitään tietoa.

Hyvä uutinen yritykselle tässä kohtaa on, ettei yritykselle sen todellisen NPS-luvun arviointi ole kuitenkaan välttämättä oleellista. Kunhan kyselyprosessi pidetään vaan samanlaisena kuukaudesta toiseen, pysyy harhakin samanlaisena ja kysely antaa hyödyllistä tietoa omasta ajallisesta kehityksestä.

Perusjoukon koko

Se joukko, mistä aineisto kerätään ja mihin tutkimuksen tuloksia pyritään yleistämään on nimeltään perusjoukko. Yrityksellä se voisi olla koko asiakaskunta. Myös tämän joukon koko voi vaikuttaa järkevän otoskoon valintaa. 20 vastausta ei välttämättä anna vielä kovin kattavaa kuvaa asiakaskunnasta, mikäli iso yritys palvelee kuluttajia. Mutta mikäli se operoi B2B-markkinalla ja asiakasrekisteristä löytyy vain 30 asiakasyritystä, 20 onkin jo ihan kattava otos.

No tietääkö se tilastonikkari mitään?

Tässä tuli käytyä kolme päällimäistä asiaa, mitä tulee pohtia tutkimuksen kokoa suunnitellessa: tutkimusongelma, otantaharha ja persujoukon koko. Hyvä uutinen on se, että kun tietää mitä on tekemässä, vastaus saattaa löytyä hyvinkin helposti. Yksinkertaisiin tapauksiin netistä löytyy ilmaisia laskureita. Jos esim. halutaan suorittaa vaaligallupin tyyppinen tutkimus kannatusosuudesta ja tiedetään että pystytään keräämään harhaton satunnaisotos, riittävän otoskoon voi laskea vaikka täällä. Hankalampienkin tutkimusasetelmien otoskoko-ongelmia on mahdollista ratkaista simulointikokeilla, niin kun olen tässä kirjoituksessa tehnyt.

Näiden pohdiskelujen jälkeen ei varmaankaan enää ole yllätys, jos soittaa tilastonikkarille tyyliin: ”Teen asiakaskyselyn. Kerropas riittävä otoskoko, aikaa 30 sekuntia”, rehellinen vastaus kuuluu ”En tiedä”. Mutta kun rauhassa istuu alas yhdessä pohtimaan asiaa ja maksaa asiankuuluvan korvauksen ajasta, vastaus kyllä löytyy. Joskus se voi tosin vaatia hieman iterointia. Itse tein tilastotieteen graduni ohjelmiston/verkkosivun käytettävyystestissä käytettävien testaajien optimaalisesta lukumäärästä. Johtopäätös oli, että kannattaa aloittaa alkuun pienellä joukolla, ”kartoitustestillä”, ja siitä kerätyn datan pohjalta vasta optimoida lopullinen testauksen laajuus.

Kysymyksen vaikeudesta huolimatta, suosittelen ehdottomasti kysymään sen ammattilaiselta mahdollisimman aikaisin. Harmittavimpia tapauksia ovat ne tapaukset, joissa minuun on otettu yhteyttä aineiston keräämisen jälkeen analyysiavun merkeissä. Siinä vaiheessa tekee pahaa kertoa, että mikäli oikeasti haluttaisiin kyseiseen tutkimusongelmaan vastata, aineiston kokoon saisi laittaa nyt ainakin nollan perään.

Facebooktwitterredditpinterestlinkedinmail

Mihin voi luottaa informaatioähkyn keskellä?

Internet on tiedon valtatie. Mutta valitettavasti se on myös temmellyspaikka monenkirjavien totuutena myytävien uskomusten levittäjille.

Tim Ferriss kirjoitti kirjassaan ”The 4-Hour Workweek”, kuinka yksi keino hankkia lisätuloja on alkaa asiantuntijaksi. Ferrissin mukaan 4 viikkoa riittää asiantuntijastatuksen haalimiseen uudella alalla. Tosin ei niin hyvän, että saisi kunnioitusta kyseisen alan oikeilta asiantuntijoilta, mutta sellaisen uskottavuuden että voi muodostaa riittävän suuren asiakaskunnan ihmisistä, jotka eivät tunne alaa.

Omalta erikoisalaltaan osaa erottaa juttujen sisällön perusteella nämä puoskarit tohtoreista, mutta entä kun puhe on aiheesta, josta itsellä ei ole kummoisia taustatietoja? Mihin tietoon tässä maailmassa voi luottaa?

Tieteellinen prosessi

Tiedon etsimisessä ei voi täysin nojautua yksittäiseen tutkimukseen. Yksittäisen tutkimuksen lopputulos voi osua harhaan monestakin syystä ja useamman vuoden vanha tutkimus on voitu jo kumota uusimmissa tutkimuksissa. Sen sijaan julkaisujen sarjasta koostuva tieteellinen prosessi johtaa pikkuhiljaa aina vaan lähemmäksi totuutta. Tieteellisen prosessiin kuuluu, että koko ajan mennään eteenpäin ja pyritään etsimään virheitä vanhoista omista olettamuksista. Hyvä tapa aloittaa uuteen aiheeseen tutustuminen on etsiä viimeisin review-artikkeli, joka kokoaa yhteen, mitä tähän mennessä eri tutkijat ovat löytäneet.

Uutisointi

Monessa muussa asiassa niin hyvin toimiva markkinatalous tuntuu yskivän tiedon levityksessä. Yliampuvat shokkiuutiset ja liian yksinkertaiset ratkaisut monimutkaisiin ongelmiin myyvät paremmin kuin analyyttinen asioiden punnitseminen eri näkökulmista. (Ketosen ja Myllyrinteen tiivistys). Tämä siitä huolimatta, että perusteellisesti analysoidun tiedon tehokkaampi leviäminen auttaisi meitä kaikkia tekemään parempia päätöksiä, joilla voisi nostaa itsemme ja läheistemme terveydellistä + taloudellista hyvinvointia.

Päivittäisen uutisvirran seuraaminen voi olla jopa haitallista asioiden ymmärtämisen kannalta, mitä tässä kirjoituksessa hyvin perustellaan. Itse pyrin seuraaman maailman menoa hieman suodatettuna niin että luen uutisen netistä vasta kun joku analyyttisena pitämäni Twitter-seurattava kommentoi uutista mielenkiintoisena.

Twitterissä olen kokenut hyödylliseksi seurattavaksi myös vahvan tieteellisen taustan omaavat aktiiviset ”bull shit detectorit” (esim. Markku Niemivirta @mniemivirta) ja harhaanjohtavalta otsikoinnilta suojelijat (esim. @klikinsaastaja).  Nämä säästävät omaa aikaani harhaanjohtavien uutisten lukemiselta.

Tieteellistä lähestymistapaa uutisten käsittelyyn edustaa nettisivusto Rootclaim. Kun maailmalla on tapahtunut jotain, jossa totuutta on vaikea hahmottaa kaikkien asian ympärillä pyörivien huhujen joukosta, Rootclaim ottaa asian punnittavaksi. Jäsenet muodostavat kilpailevia hypoteeseja vaihtoehtoisista totuuksista ja kokoavat yhteen tiedonmurusia asian ympärillä eri lähteistä. Lopputuloksena on Bayesläisen päättelyn tuloksena todennäköisyydet eri hypoteesien todennäköisyyksille. Kuka tahansa voi osallistua prosessiin tiedottamalla uusista tiedonjyväsistä ja todennäköisyydet sitä mukaa päivittyvät. Tällä hetkellä sivustolla punnitaan ainakin Malesialaisen lentokoneen katoamista, rokotteiden sivuvaikutuksia ja Syyriassa tapahtunutta kemiallista asehyökkäystä.

Vedonlyönti

Put your money where your mouth is or shut up.

Ne ketkä oikeasti ymmärtävät asioista, voivat myös lyödä vetoa näkemystensä puolesta. Silloin kun vedonlyönti on mahdollista, erinomainen näyttö ymmärtämisestä on voitollisen vedonlyöntihistorian esittely. Tosin tässä kirjoituksessani kävi ilmi että vetoja pitää löytyä aika paljon historiasta, että sillä voisi tilastollisesti osaamisensa todistaa. Kuitenkin jos on edes valmis laittamaan rahaa likoon näkemyksensä puolesta pelkän leukojen loksuttamisen sijaan, on se jo merkki uskottavuuden suuntaan.

Vedonlyöntikulttuuri kukoistaa penkkiurheilijoiden keskuudessa ja talousasioissa voi ottaa näkemystä joko osake- tai johdannaismarkkinoilla. Vedonlyöntifirmat ottavat myös kiitettävästi vetoja vastaan poliittisista vaaleista. Kaipaisin kuitenkin lisää herrasmiesvedonlyöntikulttuuria muillekin elämän osa-alueille. Silloin erimieltä olevien ei tarvitsisi loputtomasti jankuttaa SoMessa vaan sopia aiheeseen liittyvä veto ja jatkaa elämää. Vetojen lopputulokset kun vielä päivittyisivät julkiselle sivustolle niin pikkuhiljaa vetojen kertyessä alkaisi hahmottumaan, kuka on vahvemmin ja kuka heikommin asian ytimessä.

Asiantuntijoiden nahka

Kun ottaa neuvoja vastaan asiantuntijalta tai sellaisena esiintyvältä, pitää aluksi varmistaa missä pelissä tällä henkilö on niin sanotusti oma nahka pelissä (”skin on the game”). Varsinkin jos henkilö saa kaikki tulonsa yhdestä lähteestä, ensisijainen peli hänellä on työpaikkansa ja asemansa säilyttäminen. Esim. apteekkarilta voi saada hyvän näkemyksen siihen, mitä lääkkeitä eniten myydään. Sitten kun pohdinnan alla on apteekkimonopolin hyödyllisyys yhteiskunnalle, voi näkemys olla vähän yksipuolinen. Eikä kannata odottaa, että rivityöntekijätkään purevat ainoaa ruokkivaa kättä.

Asiantuntijalta kannattaa myös muotoilla kysymykset sellaiseen muotoon, missä vahvasti tuodaan hänen omaa nahkaansa peliin. Esim. kilpailevista hoitomuodoista voi kysyä lääkäriltä muodossa: ”Millä menetelmällä hoitaisit tällaisessa tapauksessa itseäsi / lastasi?

Superennustajien ominaisuudet

Philip E. Tetlockin ja Dan Gardnerin kirjoittamassa ja Terra Cognitan suomentamassa kirjassa Superennustajat kerrotaan ”Good Judgment” – tutkimusprojektista, jossa lukuisat tavalliset ihmiset tekivät ennusteita mitä erilaisista tulevaisuuden tapahtumista, kuten poliittisten konfliktien tai taloudellisten tunnuslukujen kehittymisestä. Hieman yllättävä tulos oli, että tietyt samat henkilöt vuodesta ja aiheesta toiseen erottuivat muista edukseen. Kirjoittajien mukaan vieläpä paljon paremmin kuin mitä pelkkä sattuma antaisi odottaa. Näitä tutkimuksen kestomenestyjiä kirjoittajat kutsuvat superennustajiksi. Ammatillisen taustan suhteen superennustajilla ei ollut mitään yhteistä selittäjää, mutta seuraavia yhteisiä taipumuksia heistä löytyi maailmankatsomuksen, kykyjen ja ajattelutapojen suhteen:

  • Varovainen (mikään ei ole varmaa)
  • Nöyrä (todellisuus on äärettömän monimutkainen)
  • Epädeterministinen (tapahtuva ei ole ennalta määrätty, eikä sen tarvitse tapahtua)
  • Aktiivisesti mieleltään avoin (uskomukset ovat testattavia hypoteeseja, eivät suojattavia aarteita)
  • Älykäs ja tietävä jolla on ”tunnustuksen” saamisen tarve (älyllisesti uteliaita, ongelmista ja mentaalisista haasteista nauttivia)
  • Reflektiivinen (itsetutkiskeleva ja itsekriittinen)
  • Numerotaitoinen (sinut numeroiden kanssa)

Lisäksi kirjassa mainitaan, että superennustajat pyrkivät jatkuvasti päivittämään ja parantamaan omia arvioitaan. Ohjelmointikielellä he ovat ikuisia ”beta-versioita” itsestään. Voitaneen lisätä, että he ovat käveleviä tieteellisiä prosesseja.

Mikäli kokee vedonlyönnin liian uhkapelinä, voi asiantuntijuuttaan osoittaa pitämällä julkisesti kirjaa ennusteistaan. Good Judgment – projektilla on avoin yhteisö, johon kuka tahansa voi liittyä ja alkaa tekemään ennusteita haluamistaan aiheista. Koska kirjanpidon hoitaa yhteisön verkkosivut automaattisesti, ei jälkikäteen voi pieleen menneitä ennustuksia piilotella. Tämän blogikirjoitukseni innoittamana itsekin kävin nyt kirjautumassa mukaan yhteisöön nimimerkillä ”Riski-Risto”.

Esimerkki

Lopuksi nostan esimerkkinä esiin yhden henkilön, jota en tunne henkilökohtaisesti millään tavalla, mutta hän on onnistunut herättämään valtavaa kunnioitusta. Kyseessä on osakerahaston hoitajana työskentelevä Anders Oldenburg. Vaikka lähtökohtaisesti välttelen aktiivisen salkunhoidon kuluja, tässä kohtaa olen tehnyt poikkeuksen ja sijoittanut rahastoon.

Tuottohistoria

Andersin hoitama Phoebus – rahasto on ollut pystyssä 15 vuotta yhden ja saman henkilön hoidossa. Tänä aikana rahasto on keskimäärin tuottanut sijoittajille 11.3% vuodessa. Tästä on vähennetty rahaston kulut (TKA) mitkä ovat olleet keskimäärin 1.2% vuodessa. Vertailuindeksin tuottaessa samana aikana 9.5%, saadaan tulokseksi, että Anders on osakevalinnoillaan pystynyt tuottamaan noin 3 % – yksikön verran vuosittaista ylituottoa, josta asiakkaalle on jäänyt hyötynä 1.8 % -yksikköä. Luvut voi käydä tarkemmin läpi täällä.

En ole tarkemmin tutkinut, missä ajassa osakemarkkinoilla erottuvat starat hyvätuurisista keskivertosijoittajasta tilastollisesti. Kutina on että 15 vuotta olisi jonkinlainen, muttei yksinään täysin vakuuttava näyttö.

Skin in the game

Anders on (ainakin omien sanojensa mukaan) sijoittanut itse merkittävän osan varallisuudestaan omaan Phoebus – rahastoonsa ja on rahaston suurin yksittäinen sijoittaja. Tämän luulisi takaavan, että rahastossa on Andersilla itsellään oma nahka mukana samassa pelissä kuin muilla sijoittajilla.

Superennustajan ominaisuudet

Oleellinen osa luottamuksen kehittymistä on ollut Andersin pitämä Phoebus – blogi, jossa hän kommentoi yhtiövalintojaan ja maailmaa niiden ympärillä. Mitä tulee Tetlockin ja Gardnerin mainitsemiin superennustajien ominaisuuksiin, Anders suorastaan korostaa epävarmuutta aina liikkuessaan kirjoituksissaan alueella, jota ei ole perinpohjin tutkinut. Hän myös paljon korostaa satunnaisuutta yritysten lyhyen ajan voitoissa. Lisäksi hän käy avoimesti läpi huonojakin osakevalintoja menneisyydestä ja pyrkii oppimaan virheistään.

Näihin ominaisuuksiin nojautuen olen uskaltanut antaa keskimääristä 1.2% vuosittaisista kuluista huolimatta palan sijoitusomaisuuttani Andersin käsiin ja sen lisäksi pyrin imemään hänen blogista vaikutteita maailman tutkimiseen analyyttisesti. Tämä siitä huolimatta, etten omista minkäänlaista sosiaalista suhdetta kyseiseen kaveriin tai hänen edustamaansa yritykseen.

Tiivistelmä

Ominaisuudet, jotka nostavat asiantuntijan uskottavuutta:

  • Taustalla pitkä tieteellinen prosessi
  • Julkinen vedonlyönti, sijoitus tai ennustus -historia
  • ”Skin in the game” samassa pelissä tiedon objektiivisuuden kanssa
  • Nöyrän analyyttiset ”superennustajan” ominaisuudet

Facebooktwitterredditpinterestlinkedinmail

Sotilaalliset luottamusvälit

Luottamusväli taitaa olla heti keskihajonnan jälkeen yleisimmin käytetty epävarmuutta kuvaava tilastollinen mittari. Siihen liittyy kuitenkin hyvin paljon hämmennystä. Olen monta kertaa päässyt apukirjoittajan tai tilastokonsultin roolissa seuraamaan vierestä tutkijan ja tiedelehden arvioitsijan välistä keskustelua, missä toinen puhuu aidasta ja toinen aidan seipäästä kun kyse on luottamusväleistä. Niinpä arvelen että blogosfäärissä olisi tilaa pienelle tietoiskulle aiheesta.

Varusmiesten paino

Lehdissä näkyy aina välillä huolestuneita kirjoituksia (esim. Yle) koskien muutoksia varusmiesten keskipainossa. Tämä sopii havainnollistavaksi esimerkiksi meidän kuvitteelliseen tutkimukseen.

Sovitaan, että olemme laskeneet keskiarvoksi (kilogrammoina) 77.5 ja keskihajonnaksi 8. Katsotaan millaiseksi luottamusväli muodostuu riippuen siitä, kuinka monta varusmiestä on aineistossa tutkittu. Kaikenkaikkiaan varusmiehiä on 25000 ja heihin tutkimustulokset halutaan yleistää. Tätä koko joukkoa kutsutaan perusjoukoksi. Kaikissa esimerkeissä käytetään 95% luottamusväliä.

  1. Otoskoko 100

Voimme laskea luottamusvälin mekaanisesti tilastotieteen oppikirjan kaavalla:

($ \overline{x}-t_{0.025}\cdot s/\sqrt n$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n$) \approx  (75.9 ; 79.1)

  1. Otoskoko 25000, kaikki sen vuoden varusmiehet

Nyt kun kaikki varusmiehet on tutkittu, pitääkin hetki pysähtyä. Mitä luottamusvälillä oikein haetaankaan? Sen avullahan tavoitellaan ymmärrystä laskelmiin liittyvästä epävarmuudesta. Yleensä nimenomaan otannasta johtuvaa epävarmuutta. Nyt kun kaikki varusmiehet on tukittu, ei ole mitään otannasta johtuvaa epävarmuutta, joten siinä mielessä koko luottamusvälin laskemisessa ei ole tolkkua. Toki meillä vielä voi olla muitakin mielenkiintoisia epävarmuuden lähteitä kuten esim. mittausvirhe, mutta se on eri tarina ja vaatii oman tutkimuksensa mittalaitteen tarkkuudesta.

  1. Otoskoko 15000

Jos kaksi edellistä kohtaa oli tuttua tavaraa niin tässä kohtaa saattaa tulla jotain yllättävää. Se mitä useimmista tilastotieteen perusteiden oppikirjoista unohtuu mainita, on se että kohdassa 1. käytettyyn kaavaan liittyy oletus: ”Tutkittava perusjoukko on kooltaan ääretön”. Nyt meidän perusjoukon koko N = 25000. Usein käytetty nyrkkisääntö kuuluu, että mikäli otoskoko on korkeintaan 5% perusjoukon koosta, kohdassa 1. käytettyä kaavaa voidaan käyttää. Otoskoko 15000 on nyt kuitenkin 60% perusjoukosta, joten peruskaava antaa virheellisiä tuloksia. Kaava, jolla luottamusväli lasketaan on nyt (laskukaavasta lisää täällä):

($ \overline{x}-t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$) \approx (77.4 ; 77.6)

Tässä tapauksessa ero luottamusvälin leveydessä on vain suuruusluokkaa 0.1 verrattuna kohdassa 1. käytettyyn kaavaan, joten suurta munausta ei olisi tullut vaikka oltaisiin menty peruskaavalla.

Lopuksi vielä graafi, josta näkee kuinka luottamusvälin leveys riippuu otoskoosta. Punainen käyrä kuvaa luottamusvälin leveyttä kohdan 1. Peruskaavalla ja musta käyrä kohdan 3. Tarkkaa kaavaa. Pystyviiva kertoo, missä kohti tulee täyteen nyrkkisääntömme ”5% perusjoukon koosta”. Perusjoukkoon kuuluu kaikki 25000 varusmiestä.

Nähdään, että nyrkkisääntö vaikuttaisi pitävän tässäkin hyvin kutinsa. Äärettöman perusjoukon olettava ”peruskaava” menee käsi kädessä tarkan välin pituuden kanssa, mutta alkaa sen jälkeen hiljalleen erkaantua. Huomataan myös, että tutkittavan joukon kasvattaminen 5000:sta ylöspäin ei enää kovin tehokkaasti kasvata tutkimuksen tarkkuutta luottamusvälin suhteen.

Kun paino jää sivuruuliin

Tahdon vielä nostaa esiin asian liittyen joidenkin tiedejulkaisujen intoon vaatia luottamusvälejä kehiin joka ikisen raportoidun luvun perään. Otetaanpa esimerkiksi tutkimuskysymys: ”Mikä on palvelusaikana syötyjen munkkien määrän vaikutus Cooperin testin tulokseen varusmiehillä?”. Lisäksi mitataan kontrollointitarkoituksessa pituus, paino ja monia terveysmuuttujia.

Näiden sivuroolissa olevin muuttujien keskiarvon ja keskihajonnan raportointi on asiallista toimintaa, jotta tutkimuksen lukija saa kuvan siitä minkä tyyppistä porukkaa taustatiedoiltaan on tällä kertaa otokseen sattunut. Ainoa ilmiö, mitä tutkimuksessa kuitenkin on tarkoitus yleistää, on munkkien ja juoksukunnon yhteys. Mikäli kaikille taustamuuttujillekin vaaditaan vielä lisäksi raportoitavaksi luottamusvälit, ainakin itselläni herää kysymys: Miksi?

Tämä varmaan lopulta on mielipidekysymys, mutta omasta mielestäni tutkimusartikkelit tuppaavat olemaan riittävän raskasta luettavaa ilmankin että tekstin sekaan tungetaan kaikkea mieleen juolahtavaa epäolennaista numeropuuroa.

Tulkinta

Viimeisimpinä, muttei helpoimpana asiana lienee syytä käydä vielä läpi vähän luottamusvälin tulkintaa. Silloin kun harrastin vielä tilastotieteen perusteiden luennointia, paniikkioireet kasvoivat aina kun läheni se hetki, että piti alkaa puhumaan luottamusväleistä. Tuntui mahdottomalta tehtävältä selittää luottamusvälit niin, että se olisi totta ja ettei opiskelijoiden+omat aivot menisi lopullisesti solmuun.

Luottamusvälin kaavat perustuvat frekventistiseen tieteenfilosofiaan. Tässä katsomuksessa mielenkiinnon kohteena oleva ”tutkimusparametri” (esim. Kaikkien varusmiesten keskipaino tai kaikkien varusmiesten keskuudessa vallitseva munkin syönnin sekä juoksukunnon välinen regressiokerroin) on kiinteä luku ja kaikki epävarmuus liittyy vain otanta-aineistoon liittyvään sattumaan. Niinpä puhuminen ”tutkimusparametrin” todennäköisyysjakaumasta on mieletöntä. 95% luottamusväli tulkitaankin otantajakauman avulla: ”Kun saman suuruista otantaa toistetaan ja toistetaan niin 95 prosentissa toistoista todellinen tutkimusparametri osuu luottamusvälille.”

Bayesläinen tieteenfilosofia

Tutkijalle kinkkistä tässä on, että hänen näkökulmastaan nimenomaan tutkimusparametriin liittyy mielenkiintoisin epävarmuus. Eihän koko tutkimusta tarvittaisi, mikäli tutkimuksen kohde olisi jo täsmällisesti tiedossa. Olisi siten luontevampaa kysyä tutkimusparametrin todennäköisyyksiin pohjautuvia kysymyksiä, esim. ”Mikä on otanta-aineistomme perusteella todennäköisyys, että kaikkien varusmiesten keskipaino on suurempi kuin 75 kg?” Vastaus tähän löytyy Bayesläisen tieteenfilosofian avulla. Siihen liittyvät menetelmät ovat välillä laskennallisesti raskaampia, mutta nykyisellä tietokoneiden laskentatehoilla se ei enää ole niin suuri ongelma. Jännityksellä odottelen, milloin Bayesläisyys alkaa lyömään kunnolla läpi akateemisessa maailmassa ja tiedejulkaisut alkavat pärjätä ilman hallitsematonta luottamusvälien ja p-arvojen sarjatulta.

Lisää frekventistisistä luottamusväleistä ja Bayesläisistä todennäköisyysväleistä simulointikokeilla havainnollistettuna voi lukea esimerkiksi täältä.

Statistickon steesit:

  • Kun raportoit (tai vaadit raportoimaan) luottamusvälin, mieti mistä epävarmuudesta olet oikeasti kiinnostunut
  • Kun tutkimuksen otoksena on suuri osuus perusjoukosta, luottamusvälin peruskaava antavat liian leveitä välejä
  • Yleensä luottamusväli määritellään mittatikkuna, jonne tutkimusparametri osuu halutulla varmuudella kun otetaan toistuvasti erilaisia satunnaisotoksia
  • Kun halutaan tehdä todennäköisyyspäätelmiä itse tutkimusparametrista, pitää käyttää Bayesläisiä analyysimenetelmiä
  • Liiallisen epäolennaisen numeerisen informaation viljely raporteissa ja artikkeleissa hankaloittaa lukijan ymmärrystä itse pääviestistiä

Facebooktwitterredditpinterestlinkedinmail

Trendikkäät riippuvuussuhteet

trend_cityVieläkö muistat, mikä yhteys on uima-altaaseen hukkumisella ja Nicholas Cagen elokuvaesiintymisillä? Vastaus on että eipä juuri mikään, mutta silti niiden välille on mahdollista havaita keskinäistä riippuvuussuhdetta mittaavaa korrelaatiota. Aiemmassa blogikirjoituksessa havainnollistin kuinka korrelaatioita pompsahtelee esiin vain sattumalta kun tarpeeksi montaa eri muuttujaparia kokeillaan. Seuraavassa pureudutaan yleiseen hämäävien korrelaatioiden lähteeseen; aikaan.

Korrelaatio ja aikatrendit

Otin Gapminder –datapankista tiedot Lapsikuolleisuudesta Kiinassa (alle 5v kuolevia per 1000 syntymää) ja Sähkön käytöstä Suomessa (kWh per asukas). Molemmista löytyi dataa vuosilta 1960-2011. Nämä ovat tarkoituksella haetut muuttujat, joilla ei pitäisi olla mitään tekemistä toistensa kanssa. Eihän meillä voi olla niin huono säkä, että data näyttäisi silti niiden välille korrelaatiota? Katsotaan muuttujien välistä sirontakuviota oikealla.

korrelaatiot_sironta

Suomen sähkönkulutuksen ja Kiinan lapsikuolleisuuden sirontakuvio

Vaikuttaisi kuitenkin siltä, että silloin kun Suomessa on korkea sähkönkulutus, niin Kiinassa lapsia kuolee vähemmän. Korrelaatiokerroinkin -0.84 vahvistaa saman: muuttujien välillä on vahva negatiivinen lineaarinen yhteys. Pitäisikö tästä nyt tulkita, että mikäli haluamme pelastaa kiinalaisia lapsia, niin pitää heti laittaa uuni ja sähkösauna päälle?

Tutkitaan seuraavaksi molempien muuttujien kehitystä ajassa erikseen.

korrelaatiot_trendit

Lapsikuolleisuuden ja sähkönkulutuksen aikatrendit

Nähdään, että Kiinan lapsikuolemissa on ollut selvä laskeva trendi ja suomalaisten sähkönkulutuksessa selvä nouseva trendi. Omituinen korrelaatio näiden muuttujien välillä ei selity tällä kertaa sattumalla vaan yhteisellä taustatekijällä, mikä on nyt aikatrendi. Koska trendit ovat erisuuntaiset, korrelaatiokerroin on negatiivinen.

Tutkitaan sitten alkuperäisten havaintojen sijaan muutoksia edelliseen aikapisteeseen verrattuna. Näin saadaan trendit eliminoitua havainnoista, kuten kuvaajista nähdään.

Muutosmuuttujien kehitys ajassa

Muutosmuuttujien kehitys ajassa

Näiden muutosmuuttujien välille laskettu korrelaatiokerroin on -0.03. Tämä on niin lähellä nollaa että voimme turvallisesti sanoa ettei Suomen sähkönkulutuksen muutoksella ole mitään yhteyttä saman vuoden Kiinan lapsikuolleisuuden muutokseen. Varmistetaan asia vielä piirtämällä sirontakuvio ja havaitsemalla ettei yhteistä systematiikkaa löydy.

 

Muutosmuuttujien sirontakuvio

Muutosmuuttujien sirontakuvio

Autokorrelaatiot

Myöskään trendittömien muuttujien aikahavaintojen tutkiminen ei ole aivan yksinkertaista. Mikäli olemme kiinnostuneita epävarmuudesta ja korrelaation tilastollisesta merkitsevyydestä, usein päävaivaksi tulee autokorrelaatio. Tällä tarkoitetaan sitä että saman muuttujan peräkkäiset havainnot korreloivat keskenään. Perusmenetelmiin liittyvä oletus riippumattomasta satunnaisotoksesta ei nyt päde ja kahden autokorreloituneen muuttujan riippuvuuden tutkimiseen on parempi käyttää esim. vektoriaikasarja-malleja.

Tilastoja tutkimaan

Lopuksi pitää vielä kehua datapankkia, josta lapsikuolleisuus ja sähkönkulutusdatat ovat haettu. Sivustolta löytyy läjäpäin muutakin terveys-, talous- ja muuta yhteiskunnallista dataa ympäri maailmaa ja niitä voi kätevästi graafisesti tutkailla tällä sivustolla. Mutta pidäthän tämän blogin opetukset mielessä ennen kuin vedät johtopäätöksiä liittyen syy-seuraus suhteisiin. Lopuksi voi vielä viihdyttää itseään käymällä tsekkaamassa vanhaa sivua, jossa on koottuna huumorikorrelaatioita. Nyt pitäisi olla valmiudet perustellusti spekuloida jokaisen kuvaajan kohdalla, johtuuko korrelaatio

  • jostain yhteisestä taustamuuttujasta
  • aikatrendistä
  • sattumasta
  • aidosta riippuvuussuhteesta
  • vai jostain edellisten yhdistelmästä.

Statistickon steesit

  • Aikatrendi on yleinen taustatekijä, joka selittää kahden muuttujan näennäisen riippuvuuden
  • Ajassa itsensä kanssa korreloituneita muuttujia tulee syvällisemmin analysoida aikasarja- tai pitkittäistutkimusmenetelmillä
  • Maailma on täynnä mielenkiintoisia tilastoja, mutta niitä on helppo ymmärtää väärin

 Facebooktwitterredditpinterestlinkedinmail

Voitto- ja tappioputket jääkiekossa

Tietokirjailija/kääntäjä Kimmo Pietiläisen blogikirjoituksessa käsitellään koripallon ”kuuma käsi” -ilmiötä, jolla perinteisesti tarkoitetaan pelaajan heittosuorituksen parantumista, kun alla on useampi onnistunut heitto putkeen. Tutkimukset ovat kuitenkin paljastaneet kyseisen ilmiön ainoastaan urheiluselostajien luomaksi myytiksi. Kirjoituksessa kerrotaan tutkimusten jopa osoittaneen päinvastaista ilmiötä: useamman onnistumisen jälkeen koripalloilijoilla on taipumus hakea onnistumisten jälkeen liian vaikeita heittoja, mikä tekee heidän osumisputkistaan lyhempiä kuin mitä tulisi puhtaan satunnaisvaihtelun ansiosta.

Kirjoitus herätti kiinnostukseni voittoputkien pituuksia kohtaan joukkueurheilussa ja otin oman pikatutkimuksen kohteeksi Liigan jääkiekkopelit viimeisen kymmenen vuoden ajalta. Penkkiurheilija-psykologia tarjoaa useita selityksiä sekä putkien keston pitkittymiselle että katkeamiselle ennen aikojaan:

Voittoputki

+ Joukkueessa on hurmostila, minkä vuoksi joukkue pelaa entistä paremmin seuraavissa peleissä

–  Joukkueesta tulee ylimielinen, mikä heikentää suoritusta seuraavissa peleissä

–  Joukkueesta tulee himoittu päänahka ja vastustaja on poikkeuksellisen syttynyt

Tappioputki

kiekkoilijat_vasyneena+ Joukkue halua katkasta tappioputken hinnalla millä hyvänsä ja on entistä motivoituneempi voittamaan

+ Vastustaja suhtautuu ylimielisesti viimeaikojen heittopussiin, mikä parantaa yllätyssaumoja

–  Joukkue menettää itseluottamuksen ja joukkuehenki on latistunut, mikä heikentää suoritusta

–  Pitkän tappioputken jälkeen kotiyleisö voi kääntyä omiaan vastaan tehden voittamisesta kotipelissä vaikeampaa

Kymmenen kauden tutkimus

Lähdin tutkimaan vuosina 2006-2015 alkaneiden Liiga-kausien pelejä tiputtaen kauden lopusta kuitenkin kaikki 31.1. jälkeen pelatut pelit pois. Syynä tälle on se, että runkosarjan lopussa playoff-paikkojen varmistuttua monien joukkueiden motivaatiotasot vaihtelevat ja siirtoikkunan kynnyksellä tammi-helmikuun vaihteessa on nähty kesken kauden pelaajien ”tyhjennysmyyntejä”. Nämä ovat muuttaneet joukkueiden taitotasoja kesken kauden. En halua näiden häiriötekijöiden sekoittavan analyysiä voitto- ja tappioputkien psykologiasta. Aineistoa jäi analyysiin 2840 ottelun verran.

Kyseisestä aineistosta laskin (koodaamani funktio laski puolestani) ennen jokaisen ottelun alkua, kuinka pitkä voitto/tappio putki on alla kotijoukkueella ja vierasjoukkueella. Sitten lajittelin putkien pituudet seuraaviin luokkiin:

  1. Vähintään 7 ottelun tappioputki
  2. 5-6 ottelun tappioputki
  3. 3-4 ottelun tappioputki
  4. Ei kunnon putkea (maksimissaan 2 ottelun putki)
  5. 3-4 ottelun voittoputki
  6. 5-6 ottelun voittoputki
  7. Vähintään 7 ottelun voittoputki

Tämän jälkeen muutin satunnaisesti jokaisen kauden sisällä otteluiden järjestystä ja muodostin sata uutta aineistoa alkuperäisen aineiston pohjalta (ns. bootstrap-otos). Nämä uudet sekoitetut aineistot kertovat nyt todennäköisyydet eri putkien pituuksille puhtaan sattuman johdosta. Alla olevassa kuvaajassa punainen pylväs kertoo, kuinka eri putkien pituudet jakaantuivat alkuperäisessä aineistossa. Sininen pylväs taas kertoo sekoitetun aineiston osuudet kussakin putkiluokassa. Kuvaajassa vasemmalla puolella on tappioputket ja oikealla voittoputket.

Putki_graafi

Pitkät putket ovat havaitussa aineistossa aavistuksen sekoitettua yleisempiä, muttei tilastollisesti merkitsevästi (P-arvo = 0.12). Tämän perusteella ei siis ole selvää näyttöä että Liigassa syntyisi keskimäärin enemmän tai vähemmän pitkiä putkia kuin mitä puhtaan sattuman takia tulee. Analyysi tarjoaa kuitenkin lohdutuksen sanan tappioputkessa seuraavaan otteluun alamaissa valmistautuvalle joukkueelle: ”12 kertaa sadasta ottelun alla on vähintään 3 ottelun tappioputki pelkästään puhtaan sattuman taki.”

Tilastollinen mallinnus

Edellinen analyysi jättää kuitenkin useita kysymyksiä. Yllä olevat putket saattavat vaikuttaa joukkueiden suoritukseen eritavoin koti- ja vieraspeleissä. Lisäksi putkien muodostumiseen vaikuttavat myös fyysiset rasitustekijät, mutta erityisesti meitä kiinnostavat psykologiset tekijät. Muodostetaan vielä toinen analyysi, jossa tilastollisella mallilla (yleistetty sekamalli logit-linkkifunktiolla) selitetään kotijoukkueen voittotodennäköisyyttä seuraavilla tekijöillä:

  • Kotijoukkueen alla oleva putken pituus
  • Vierasjoukkueen alla oleva putken pituus
  • Kotijoukkueen fyysinen rasitus
  • Vierasjoukkueen fyysinen rasitus
  • Kotijoukkueen keskimääräinen taitotaso kotipeleissä kyseisellä kaudella
  • Vierasjoukkueen keskimääräinen taitotaso vieraspeleissä kyseisellä kaudella

Fyysinen rasitustekijä -muuttujassa on neljä vaihtoehtoa:

  1. Edellisenä päivänä peli ja sitä ennen vähintään 3 peliä viikon sisällä
  2. Edellisenä päivänä peli, mutta alle 3 peliä sitä edeltävän viikon sisällä
  3. Ei peliä edellisenä päivänä, mutta vähintään 3 peliä sitä edeltävän viikon sisällä
  4. Ei aiemmissa luokissa määriteltyjä rasitustekijöitä

Tämän analyysin tuloksessa mielenkiintoa herättävä vaikutus on kotijoukkueiden erittäin pitkien putkien näkyminen heikentävänä suorituksena. Mallin mukaan kotijoukkueen voittotodennäköisyys tippuisi muuten tasaisessa pelissä 50% -> 42%, mikäli kotijoukkueella on alla 5-6 ottelun tappioputki. Vähintään 7 ottelun tappioputkessa todennäköisyys putoaisi jopa 23% :iin. Efekti ei ole kuitenkaan aivan tilastollisesti merkitsevä (P-arvo = 0.1) ja vähintään 7 ottelun putken osalta epäilyttävän suuri. Tutkimus kuitenkin herättää ainakin epäilyksen, että kotiluolassa pitkän putken katkaiseminen voisi olla oikeasti vaikeaa.

Muille alussa luetelluille penkkiurheilijoiden psykologisille teorioille aineisto ei anna oikein minkäänlaista tukea. Tosin on mahdollista, että eri joukkueet käsittelevät putkia eri tavoin ja siten positiiviset vaikutukset kumoutuvat negatiivisilla vaikutuksella pidemmän päälle. Mielenkiintoinen sivutulos löytyi fyysisen rasituksen osalta. Fyysisellä rasituksella oli mallin mukaan heikentävää vaikutusta suoritukseen lähinnä vain vieraspeleissä ja erityisesti edellisenä päivänä pelatun pelin takia. Tästä lienee jääkiekon ammattivedonlyöjillä tarkempia tutkimustuloksia, mistä kuulen mielelläni jos joku haluaa salaisuuksiaan paljastaa.

Tiivistelmä

  • Pitkä alla oleva tappioputki mahdollisesti heikentää suoritusta kotipeleissä jääkiekossa
  • Muuten putkilla ei vaikuttaisi olevan näkyviä vaikutuksia suoritukseen seuraavassa pelissä
  • Edelleen on mahdollista että toisinaan putkien vaikutukset ovat suoritukseen positiivisia ja toisinaan negatiivisia, jolloin ne pitkässä juoksussa kumoavat toisensa

Facebooktwitterredditpinterestlinkedinmail

Kärjistyvät näkemykset

Ihmisen aivot on ohjelmoitu vetämään härskisti muutaman havainnon perusteella syy-seuraus yhteyksiä. Itse työskentelen päivittäin satunnaisvaihtelun ymmärtämisen parissa. Mutta annas olla kun vaihdan vapaalle ja vähän rentoudun niin muutaman tuopillisen jälkeen alkaa jutuissani näkymään riippuvuussuhteita siellä sun täällä yksittäisiin esimerkkeihin nojaten: ”Alkulämmittely urheilussa on vaan haitaksi. Itsekin pelasin urani parhaan futsal-pelin silloin Ristiinassa kun huonon ajokelin takia ei keretty lämmittelemään ollenkaan.” Eikä siinä mitään, näin syntyy tarinoita ja legendoja. Elämä ympärivuorokautisena satunnaisvaihteluintoilijana olisi todella tylsää.

angryVaarallisemmaksi tilanne muuttuu, kun mukaan astuvat vahvat poliittiset ideologiat. Olet ehkä jo saavuttanut ajatuksillesi jonkinlaista kannatusta, etkä halua kannattajiesi silmissä leimautua ”takin kääntäjäksi”. Alitajuntasi alkaa rekisteröimään vain aiempia näkemyksiä tukevia havaintoja ja vastakkaista näkemystä tukevat havainnot humahtavat ohi niin että tukka hulmuaa. Ehkä SoMe:ssakin kaveripiiri alkaa koostumaan vaan saman ideologian jakajista ja toisenlaiset näkemykset blokataan sekopäisten hourailuna. Sinulla on kansantalouden tutkimuksista löytynyt oma suosikkisi, johon voit viitata kohdatessasi vasta-argumentteja. Mutta hetkinen, vastapuolellakin on viittaus tieteelliseen artikkeliin, jolla hän perustelee omaa näkemystään. Mitä ihmettä, onko koko tiedemaailmakin sekaisin?

Totuus hahmottuu vähitelleen

Vaikka maailmassa on paljon tutkijoita, joilla on vaikeuksia käsitellä todennäköisyyksiä ja joissain tiedelehdissä on kehnoja julkaisukriteerejä, niin suuressa mittakaavassa tiede tekee oikeita asioita. Taistelu totuuden löytämiseksi sattuman sekoittamassa maailmassa on vaan kovaa hommaa.

Matematiikassa tai fysiikassa voi olla mahdollista todistaa uusi tutkimuslöydös yhdellä tutkimuksella aukottomasti todeksi. Suurimmalle osalle ihmisistä olennaisempia ovat kuitenkin ”pehmeämmät” tieteet kuten yhteiskuntatieteet ja niissä on pakko turvautua havaintoihin. Tilastotiede kehittää tutkimusmenetelmiä eri soveltavien tieteiden tarpeisiin, mutta monet perinteiset menetelmät toimivat täydellisesti vain satunnaistettujen kokeiden (satunnaisesti valittu koeryhmä ja vertailuryhmä) yhteydessä. Hienostuneemmat menetelmät ovat taas useille tutkijoille matemaattisesti liian monimutkaisia.

Poliittisesti herkässä kansantaloustieteessä satunnaistetut kokeet ovat harvoin mahdollisia. Vai miltä kuulostaa seuraava koe: Rakennetaan Suomeen kolme uutta samankaltaista asuinaluetta ja arvotaan tuhansia ihmisiä (tarvittaessa pakkosiirretään) asumaan kuhunkin kymmeneksi vuodeksi. Yhdessä alueessa käytetään nykyistä sosiaaliturvajärjestelmää, toisessa perustuloa ja kolmannessa ei ole sosiaaliturvaa ollenkaan. Näin voitaisiin saada helposti tieteellistä näyttöä eri tulonsiirtomekanismien toimivuudesta, mutta lienee selvää miksei tällaisia kokeita voida järjestää. Satunnaiskokeiden puutteen takia taloustieteen tutkimukset ovat herkkiä sille, kuinka kaikki oleelliset taustatekijät on huomioitu. Tästä hyvä esimerkki on edellinen kirjoitukseni tuloeroista.

Kun soppaan lisätään vielä muu totuuden etsimiseen liittyvä hankalasti kontrolloitava satunnaisuus (aiemassa kirjoituksessani tätä on yritetty avata) niin ei ole mikään ihme että yksittäiset tutkimukset voivat saada toisistaan vastakkaisia tuloksia. Tiede onkin jatkuvasti kehittyvä prosessi. Vasta kun vuosien varrella useimmat toisistaan riippumattomat tutkimukset alkavat saada samankaltaisia tuloksia, voidaan alkaa puhumaan yleisestä totuudesta.

Radikalisoituminen

radikaali_graafi2Ikävä puoli tässä kaikessa on, että erilaiset ideologiset ryhmittymät vahvistavat valikoiden omia näkemyksiään ja alkavat sitten käymään täysin tarpeetonta vihanpitoa toisiaan kohtaan. Loppupelissä kyse on vain satunnaisvaihtelusta, josta ryhmittymät ovat ajautuneet näkemään vain toisen puolen. Jottei tämäkään kirjoitus jäisi ilman jotain tilastollista käppyrää, piirsin kuvaajan hahmottamaan ilmiötä. Totuus kiistanalaisesta asiasta on jakauman keskellä, mutta sen havaitsemiseen liittyy satunnaisuutta ja ryhmät rekisteröivät vain toista puolta ja etsivät sitä tukevia yksittäisiä tutkimuksia.

Esimerkiksi keskellä voisi olla totuus ”Virkamiehet ovat keskimäärin yhtä fiksuja ja rehellisiä kuin muutkin ihmiset” (en tiedä, pitääkö oikeasti paikkansa). Musta käyrä kuvaa, yksittäisiin virkamiehiin liittyvää vaihtelua todellisuudessa ja pallerot kansalaisten havaintoja heistä. Mitä oikeammalla vaakasuunnassa pallero sijaitsee, sitä pätevämpi havaittu virkamies on. Nyt siniseeen porukkaan kuuluvat ovat kohdanneet tai muuten vaan mielikuviin rekisteröineet esimerkkejä korruptoituneista ja epäpätevistä tapauksista. Punainen porukka on taas rekistenöinyt havaintoja lähinnä fiksuimmista ja rehdimmistä kavereista. Punaisilla ja sinisillä saattaa olla tämän jälkeen pientä erimielisyyttä siitä, kuinka paljon virkamiehillä pitää olla valtaa.

Asiaa ei helpota yhtään, että nykypäivänä netin keskustelukanavat vilisevät trolleja, joiden päämääränä on lisätä hämmennystä ja media kilpailee klikkauksista ylidramatisoivilla sekä harhaanjohtavilla otsikoilla. Otsikon harhaanjohtavuus on helppo huomata, kun kyse on itselle ennalta tutusta aiheesta. Vieraasta aiheesta taas harhaa emme tunnista vaan muodostamme omaa todellisuutta näiden ”havaintojen” perusteella.

Mennyt vuosi on ollut kriisipitoinen ja kotimaan poliittisessa keskusteluissa ovat olleet tunteet pinnassa. Ainakin julkinen keskustelu menee liian helposti asia-argumentoinnin sijaan henkilökohtaisuuksiin ja vastapuolen syyttelyyn ”kuplassa elämisestä”. Kannustan kaikkia ensisijaisesti pohtimaan, mistä oma kupla muodostuu. Kaikilla meillä sellainen on.

Esimerkkiä pelkkään toisen osapuolen vääriin näkemyksiin keskittymiseen tarjoavat eduskunnan televisioitavat istunnot. Näitä katsoessa on kuitenkin hyvä muistaa, että vaikka edustajat TV-kameroiden ollessa päällä vetävät tunteenpalossa roolejaan, eduskunnan käytäviltä kantautuvien huhujen perusteella useimmat näistä ”ammattiräyhääjistä” pystyvät ihan asiallisesti kahvipöydissä keskustelemaan kameroiden ollessa kiinni. Istuntosalissakin on ainakin näin joulun aikaan merkkejä vähemmän kiihkeästä suhtautumisesta omiin rooleihin ainakin tämän pätkän perusteella.

Yhteistyöllä eteenpäin

Maailman muuttuessa talouteen tulee ajoittain shokkeja ja vaikeita aikoja, mutta yhteistyöllä varmasti pääsemme niistä yli. Me tarvitsemme toisiamme:

  • Ilman riskiä kantavia yritysten omistajia ei duunareilla ole töitä ja ilman ahkeria duunareita ei yrityksissä tapahdu mitään.
  • Ilman liiketoiminnan (ALV, palkat ja voitot) generoimia verorahoja sekä yrittämällä rikastuneiden säätiöitä ei tutkimukselle löytyisi rahoitusta. Toisaalta ilman laadukasta tutkimusta kuluttajat jäisivät paitsi monien innovaatioiden hyödyistä, eivät tietäisi mikä on terveydelle hyväksi ja yrityksillä ei olisi kaikkea tehostavaa teknologiaa käytössään.
  • Ilman yksityisen sektorin generoimia verorahoja ei julkisen sektorin työntekijöille voisi maksaa palkkoja, mutta ilman julkisen sektorin tarjoamaa turvallisuutta ja koulutusta olisi yhteiskunta aika kehno paikka yrittää ja etsiä päteviä työntekijöitä.

Haloo Helsingin säkeiden myötä haluan toivottaa lukijoille rauhaisaa joulua ja avarakatseista uutta vuotta!

Facebooktwitterredditpinterestlinkedinmail

Tuloerot ja taustatekijöiden hallinta

Julkisessa talouskeskustelussa pistää silmään usein tuloerojen korostaminen ongelmana, johon pitää erityisesti puuttua. Olen yrittänyt miettiä logiikkaa tämän taustalla. Koska eri ammattien vaatimukset ovat varsin erilaisia ja lisäksi ihmisten halukkuus tehdä tietyntyyppistä työtä poikkeaa paljon niin eikö ole luonnollista, että hintamekanismi myös palkitsee toisista töistä enemmän kuin toisista? Näin hinnat ohjaavat päteviä työntekijöitä hyvin tarpeellisten, mutta vaativien ja/tai yleisesti epämieluisten töiden pariin.

Tavoitteiden tärkeysjärjestys

poor_houseVoisiko köyhimpien olojen parantaminen olla tärkeämpi tavoite kuin itseisarvoinen taistelu tuloerojen kaventamiseksi? Itse en ainakaan ole huolissani 2500€/kk tienaavasta vaikka kuinka hänen naapurinsa tienaisi 7500€. Sen sijaan huolestuttavampia ovat ihmiset, joilla on vaikeuksia täyttää elämisen perustarpeita.

Silloin ongelma on iso, mikäli ihmisten vapaudessa valita eri ammattien välillä on suuria eroja. Esimerkiksi hyvin palkattuihin, korkeisiin virkoihin ei voisi päästä ilman sopivia sukulaisuussuhteita tai kouluttautuminen ei olisi suuresta motivaatiosta huolimatta mahdollista kuin rikkaiden perheiden lapsille. Myös lisensioitumista vaativissa ammateissa (esim. lääkärit ja juristit) voi päästä palkkaneuvotteluissa epäreiluun asemaan, jos koulutuspaikkojen määrät ovat alimitoitettuja tarpeisiin nähden.

Tasavertaisten valintojen maailma

Tasavertaisten valintamahdollisuuksien maailmassa on vaikea nähdä tuloeroja vakavana ongelmana. Mikäli haluaa mammuttipalkkaiseen suuryrityksen toimitusjohtajan hommaan, niin voisi 20 vuotta määrätietoisesti hankkia ammatissa vaadittavaa osaamista ja työkokemusta. Sitten voisi loppuelämänsä omistaa ympärivuorokautisena keulakuvana toimiseen ja elämään median, työntekijöiden edustajien ja sijoittajien paineen jatkuvassa ristitulessa.

Riskien kantamisen, eli pääomatulojen puolella taas sijoittaja voisi halutessaan jättää sijoittamatta turvalliseksi koettuun kasvukeskuksen asuntoon ja laittaa säästönsä kiinni nuoriin startup-yrityksiin, joista iso osa ei tule tuottamaan mitään, mutta hyvällä säkällä joku voi räjäyttää pankin luoden yhteiskuntaan runsaasti tuottavia työpaikkoja ja riskinkantajalle palkkioksi mojovan omaisuuden.

Äärimmäisenä tuloerojen kauhuskenaariona näen sellaisen, että joku yksittäinen taho pystyisi ostamaan kaikki asuinkiinteistöt Suomesta ja siten monopoliasemansa turvin orjuuttamaan kaikki jotka haluavat Suomessa asua. En kuitenkaan hirveän realistisena tällaista skenaariota näe, vaikka moni on sitä Monopoli-pelin avulla lapsena kovasti harjoitellut. Ylipäätään monopolit ja kartellit ovat myrkkyä valinnan mahdollisuuksille. Aidosti kilpailevat yritykset ovat mielestäni avain ihmisten valinnan mahdollisuuksille joutuessaan kilpailemaan työntekijöistä, asiakkaista ja sijoittajista.

Tuloerot köyhyyden aiheuttajana?

Ehkä tuloeroilla on riippuvuussuhde absoluuttiseen köyhyyteen ja siksi se on tärkeä aihe. Lähdin ottamaan tästä selvää Tilastokeskuksen julkaisemien Euroopan maiden taloustilastojen (vuodelta 2012) avulla.

Gini_puute_pngVieressä on kuvaaja, jossa vaaka-akselilla on tulojen eroja kuvaava Gini-kerroin ja pystyakselilla oleva Puute-muuttuja kertoo, kuinka monta prosenttia väestöstä kokee vakavaa aineellista puutetta.

Vaikuttaa selkeältä: kun tuloerot kasvavat niin Puute kasvaa myös. Näiden välille laskettu korrelaatiokerroin (Spearmanin versio, koska yhteys ei ole lineaarinen) on 0.66 ja se on nyt tilastollisesti erittäin merkitsevä (totuuden mittareista tarkemmin tässä postauksessa). Voidaanko tästä vetää johtopäätös että suurista tuloeroista seuraa yhteiskuntaan vakavaa puutetta? Tässä vaiheessa on hyvä kerrata aiempi postaukseni korrelaatiotutkimuksista.

Alkujohdattelussa puhuin valintojen mahdollisuuksista ja sitä jollain tavalla kuvannee korruption määrä. Toinen oleellinen muuttuja, joka mahdollisesti vaikuttaa sekä Gini-kertoimeen että Puutteeseen on kansalaisten kokonaistulotaso, mitä kuvaa nyt vuositulojen mediaani maittain. Oma hypoteesini näiden muuttujien yhteyksistä on seuraava:

Puute_kaavio

Seuraavassa kuviossa on kaikkien neljän tutkittavan muuttujien kuvaajat ja korrelaatiokertoimet:

Lävistäjältä löytyy jokaisen muuttujan oma jakauma. Oikealla ylhäällä löytyy vastaavan sarake- ja rivimuuttujan välinen Spearmanin korrelaatiokerroin sekä tilastollinen merkitsevyys tähtinä. Vasemmalla alhaalla jokaisen muuttujaparin sirontakuvio.

Kaikki neljä muuttujaa korreloivat pareittain. Esim. Korruptoimattomuuden korrelaatiokerroin Puutteen kanssa on -0.86, mikä tarkoittaa että maissa joissa on vähän korruptiota, on myös vähän puutetta.

Gini_puute2_pngMuodostin matemaattisesti uuden Puute-muuttujan, josta on eliminoitu Tulojen ja Korruption vaikutus. Ginin ja eliminoidun Puute-muuttujan sirontakuvio näyttää nyt aikalailla erilaiselta.

Yhteys ei ole enää niin selvä kuin aiemmassa kuvaajassa. Nyt korrelaatiokerroin on 0.27 ja P-arvo on 0.12, mikä ei ole enää tilastollisesti merkitsevä.

Muodostetaan vielä regressiomalli, jossa Puutteessa elävien osuutta (sen logit-muunnosta, jotta yhteys olisi lineaarinen) selitetään Ginillä, Mediaanituloilla ja Korruptoimattomuudella. Alla on R-ohjelmiston tuloste pro-lukijoita varten.

puute_regressio2Menemättä taulukon yksityiskohtiin vaikuttaa, että kansakunnan yleinen tulotaso ja korruptoimattomuus ovat ne tärkeimmät tekijät puutteen selittämisessä. Toki Ginilläkin näyttäisi olevan yhteys (akateemiset tutkijat heittelevät nyt voltteja, koska P-arvo jäi hiuksen hienosti alle 0.05), mutta merkitys kokonaisuuteen on kuitenkin vähäinen. Gini-kertoimen mukanaolo regressiomallissa nosti selitysastetta vain 2%-yksikköä.

Mitä tästä opimme?

Siihen, kuinka paljon tuloeroihiin tulisi Euroopassa puuttua, ei tämä laskuharjoitus anna vastausta. Kyseessä on pintaraapaisu aiheeseen helposti löytyneellä datalla, eikä loppuunviety tutkimus. Tärkein opetus tässä on näyttää kuinka pelkkien kahdenvälisten korrelaatiokertoimien tutkiminen voi johtaa harhaan. Taloustutkimuksissa ei yleensä pystytä järjestämään satunnaistettuja koeasetelmia ja silloin tutkimustulokset heilahtelevat sen mukaan mitä oleellisia taustatekijöitä on huomioitu ja mitä ei.

Lukijagallup: Mitä muita tekijöitä tässä pitäisi huomioida, että tutkimus olisi vielä luotettavampi?

Statistickon steesi:

  1. Kun tutkimusaineisto ei perustu satunnaistettuun kokeeseen, tulokset riippuvuuden suhteen ovat erityisen herkkiä yhteisten taustatekijöiden kontrolloimiselle

Aineistolähteet:

Puute

Tulot ja tuloerot

KorruptioFacebooktwitterredditpinterestlinkedinmail

Useat tulonlähteet

Vossikka

Vossikka

Teknologia kehittyy ja maailma muuttuu kokoajan. Taxi-kuskit ovat tällä hetkellä huolissaan työpaikkojensa puolesta ja protestoivat Uber-kuskeja vastaan. Muistaakohan kukaan, että taxi-autoilijoiden ammattikunta on aikoinaan kaapannut markkinat vossikkakuskeilta?

 Useat tulonlähteet tulevaisuuden turvana

Kehitykseen kuuluu luonnollisena se, että joillekin töille on jatkossa vähemmän tarvetta ja tilalle tulee uusia ammatteja. Koska elämme sattuman sekoittamassa maailmassa, on vaikea ennustaa, mikä on oman nykyisen ammattiosaamisen kysyntä 10 vuoden päästä.

Kannatan ajatusta, että olisi hyvä olla useita tulonlähteitä, jolloin on paremmin suojautunut maailman muutoksien tuomia riskejä vastaan. Helpoin tapa sivutienesteille, mikä itselleni tulee mieleen, on aloittaa säännöllinen sijoittaminen vähäkuiluisiin indeksirahastoihin ja päästä näin käsiksi passiivisiin sijoitustuloihin. Tästä löytyy esimerkki edellisestä postauksestani. Toisille taas sopii paremmin asuntosijoittaminen, mikä tosin vaatii hieman enemmän aktiivisuutta ja isompaa kertasijoitusta.

Menestyspotentiaalin ja itsensä kehittämisen puolesta houkuttelevin vaihtoehto on yrityksen perustaminen ja pyörittäminen palkkatyön ohessa. Nykypäivänä verkkokaupan pystyttäminen ei edes vaadi kovin suuria alkuinvestointeja. Oma yrittäjätaipaleeni alkoi aikoinaan tällaisen verkkokaupan merkeissä. Tosin aikaa joutuu jostakin repimään ja yrittäminen usein kannattaakin aloittaa yhdessä luotettavan kumppanin kanssa, että saa työtaakkaa sekä ajatuksia jaettua.

Moni varmasti ajattelee, että sekä sijoittaminen että yrittäminen on riskialtista. Tottahan se on, mutta omasta mielestäni on vielä riskialttiimpaa, jos koko elämä roikkuu yhden työpaikan varassa. Suomessa sosiaaliturva tuo kyllä toimeentulon puolesta riittävän turvan yhden työn vakituisille työntekijöille, mutta riskinä on oman elämän päätäntävallan valuminen työnantajan ja sosiaaliviranomaisten käsiin. Pomolla on aina valta antaa potkut, mutta sivubisnes antaa myös työntekijälle vallan siirtyä satsaamaan omaan bisnekseen jos tuntuu, että pitää päästä vaihtamaan maisemaa.

Omat tulonlähteeni

Itselläni tulojen jakautuminen on hieman mennyt överiksi. Laskeskelin, että viimeisen kolmen vuoden aikana kuudella eri tulonlähteellä on ollut jonkinlainen rooli itseni elättämisessä. Jonkinlainen fokusoituminen voisi olla jatkossa paikallaan. Nyt kesäloman kynnyksellä olenkin vähän pureskellut menneiden vuosien bisneksieni hyviä ja huonoja puolia.

1. Yrittäjyys

Yrittäjänä on mahdollisuus saavuttaa oikeasti jotain merkittävää. Se tuo mahdollisuuden työllistää ja olla tärkeä palanen yhteiskuntaa. Vastuu on myös iso eikä virheitä voi täysin välttää. Mutta tyytyväisen asiakkaan palaute korvaa kyllä helposti pettymysten hetket. Saimme juuri Statistin kotisivut uuteen uskoon ja tällä ilmeellä lähdemme ottamaan selvää, missä ensi syksynä data-analyysiosaaminen kohtaa maailman tarpeet.

2. Sijoittaminen

Sijoittaminen avaa portit passiivisille osinko/vuokratuloille. Tämä mahdollistaa haaveen ”taloudellinen riippumattomuus jo ennen virallista eläkeikää” saavuttamisen. Tosin huonolla riskienhallinnalla ja tunteiden vallassa elämisellä sijoittaminen voi myös tärvellä oman talouden. Sijoittaminen tarjoaa analyyttisia haasteita ja omia tuloksiaan voi vertailla tunnettujen ”gurujen” kanssa. Erityisesti osakesijoittaminen on avannut silmät siitä, mitä ympärillä maailmassa oikeasti tapahtuu. Se on myös motivoinut ottamaan selvää historiasta, mikä taas luo pohjaa mielenkiintoisille keskusteluille erilaisten ihmisten kanssa. Sijoittaminen tulee taatusti olemaan vahvasti mukana elämässäni jatkossakin.

3. Akateeminen tutkimus

Tällä hetkellä en ole mukana aktiivisesti missään akateemisessa tutkimuksessa. Olen ollut hieman kriittinen tieteellisten artikkeleiden julkaisuprosesseja kohtaan, mutta ne vaikuttavat kehittyvän parempaan suuntaan. Tiedon kaivaminen sekä jakaminen on lähellä sydäntäni ja olen edelleen avoin mielenkiintoisille tutkimuskohteille.

4. Urheiluvedonlyönti

Urheilu on aina ollut läheinen osa elämääni ja siihen liittyvä data-analyysi on kiehtovaa. Vuosikymmen sitten rahan tekeminen nettivedonlyönnissä onnistui vähän yksinkertaisemmallakin matematiikalla, mutta nykypäivänä tehostuneilla markkinoilla analyysitaidot joutuvat tositestiin. Nostankin nöyrästi hattua niille, jotka elättävät itsensä pelkällä vedonlyönnillä ilman sisäpiiritietoa. Itselläni rahkeet riittävät tällä hetkellä vain tiettyjen erikoistilanteiden ja itseäni viisaampien näkemyksen hyödyntämiseen. Vedonlyöntiharrastukseen liittyy matsin katsomiseen yhdistettynä elämyksiä tuova jännitysmomentti ja aionkin pitää sen mukana harrastuksena ilman isoja tuotto-odotuksia. Jokainen plussamerkkinen euro on kotiinpäin.

5. Nettipokeri

Pokerin pelaaminen (itselläni nopeat ”sit and go” -turnaukset) tyydyttää kilpailuviettiä ja pelaamiseen keskittyminen on erinomainen tapa tyhjentää päätä kaikesta muusta epämääräisestä hälinästä. Menestys ei kuitenkaan ole ollut enää viime vuosina huipputasolla. Edellisen kolmen vuoden sijoitetun pääoman tuotto on +0.8 %. Se ei ole riittävä korvaus stressistä, mikä tulee pokeritulojen hurjasta vaihtelusta. Nettipokeri on myös yksinäistä ja isoina annoksina puuduttava harrastus, enkä halua tehdä sitä niin paljon että nykyisellä tuotto-odotuksella vuositulot olisivat varmasti positiiviset (todennäköisyys tehdä neljän tuhannen vuosittaisella turnaustahdilla ja 0.8 % tuotto-odotuksella positiivinen vuositulos on vain 62 %). Trendi vaikuttaa olevan, että vastustajien taso vaan kovenee vuosi vuodelta, joten ilman huomattavia satsauksia lisäkouluttautumiseen ei omassa tapauksessani ole kyse kovin kannattavasta bisneksestä.

En olevielä valmis ripustamaan korttipakkaa täysin naulaan, mutta jatkossa keskitän pelaamisen vain aikoihin kun tuotto-odottama on väliaikaisesti poikkeuksellisen korkea esim. pelifirman tarjoaman bonuksen vuoksi.

6. Tilastotieteeen opetus yliopistokurssilla

Perusasioiden opettaminen on varsin helppo työ, kun materiaalit ja prosessit ovat vuosien varrella kehittyneet toimiviksi. Kolikon kääntöpuolena työ tulisi jatkossa olemaan samojen asioiden ”jankkaamista” eikä kehittäisi itseäni eteenpäin. Niinpä päätin nyt keväällä luopua kurssin vetämisestä tällä erää.

Yhteenveto

Useampi tulonlähde helpottaa selviytymisestä elämän yllättävistä käänteistä ja ylläpitää oman elämän valinnanvapautta. Ajanhallinta on kuitenkin vaikeaa, jos erilaisia tulonlähteitä yrittää haalia liikaa. Itse aion jatkossa keskittyä enemmän yrittämiseen ja sijoittamiseen sekä vähemmän pokerinpelaamiseen ja opettamiseen. Näin uskon myös vapautuvan enemmän aikaa hyvinvoinnin ylläpitämiseen ja sosiaaliseen elämään.Facebooktwitterredditpinterestlinkedinmail