Rss

  • linkedin

Archives for : Epävarmuus

Menneisyyden ruotiminen

Tuleeko mieleen tilanteita, joissa on tullut ruodittua omia valintoja jälkikäteen ankaraan sävyyn? Esimerkiksi seuraavaan tyyliin:

”Lähdin treffeille Kertun, enkä Venlan kanssa. Kerttu osoittautui alkuhuuman jälkeen ääliöksi ja Venlalla on nyt poikaystävä. Miten olinkaan niin idiootti, etten aikanaan valinnut Venlaa?”

”Sijoitin Talvivaaran osakkeisiin, koska työkaverikin sijoitti ja nyt hävisin rahani konkurssissa. Eiköhän se ole parempi ettei meikäläinen sijoita koskaan enää yhtään mihinkään”

Elämä on sattumien summa

Yleensä emme voi tietää lopputulosta, mikäli olisimme toimineet toisin. Ashton Kutcherin tähdittämä elokuva Perhosvaikutus leikittelee ajatuksella, että voisi palata menneisyyteen toimimaan erilailla kuin tuli toimittua. Termi ”perhosvaikutus” viittaa kaaosteoriaan, minkä kuuluisa esimerkki on Brasilialainen perhonen, jonka siivenisku saa aikaan ilmavirtauksissa ketjureaktion, mikä monen sattuman kautta voisi aiheuttaa myrskyn Teksasissa. Ashtonin roolihahmo palaa menneisyyteen auttamaan lähimmäistään, mutta tästä toiminnasta alkaneesta tapahtumaketjusta seuraa aina monen sattumuksen kautta paljon pahempi onnettomuus jollekin toiselle läheiselle. Myöskään parinvalintaesimerkissämme emme voi tietää kuinka suhteessa Venlan kanssa olisi käynyt. Ehkä suhde olisi päättynyt itsetunnon sekä rahojen menettämiseen ja tilanne olisi nyt nykyistä huonompi. Onneksi Kerttu ja Venla eivät ole maailman ainoita naisia.

Informaation hyödyntäminen

Kuinka menneitä tulisi sitten ruotia? Mielestäni kannattaa keskittyä pohtimaan seuraavaa:

Olisiko sinulla päätöstä tehdessä ollut käytettävissä enemmän informaatiota, mikä olisi auttanut tekemään toisenlaisen ratkaisun?

  1. Ei, ainakaan kovin helposti. Teit silloin käytettävissä olevilla tiedoilla todennäköisesti parhaan ratkaisun, mutta kävi huono tuuri. Mene eteenpäin!
  2. Kyllä, mutta unohtui hyödyntää. Muista ensi kertaa vastaavassa tilanteessa hyödyntää käytettävissä oleva informaatio hieman huolellisemmin. Mutta hei, olet nyt yhtä kokemusta viisaampi ja vahvempi tulevaisuutta ajatellen. Mene siis eteenpäin!

Uutta matoa koukkuun

Totaalinen luovuttaminen ja piiloutuminen poteroon yhden ikävän sattumuksen takia ei johda mihinkään. Jokaisen menestystarinan takana on lukuisia epäonnistumisia. Niitä kutsutaan oppirahoiksi. Talvivaaran osakkeissa olen itsekin hävinnyt rahaa ja siitä tullut oppi voisi mennä seuraavasti: ”Aloitetaan sittenkin sijoittamaan osingonmaksukykynsä todistaneisiin firmoihin, joiden liiketoiminta on helpompi ymmärtää. Sitten kun omaisuus ja kokemus on hieman karttunut voi ehkä tehdä pienen kokeilun alkuvaiheen riskibisnekseen, jonka liikevoitot ovat vasta haavenumeroita PowerPoint-kalvolla”

Perhosvaikutuksessa Ashton Kutcherin esittämä päähenkilö tekee lopussa stopin menneisyyden jossittelulle jatkamalla vaan matkaa nähdessään kadulla elämän toisen skenaarion suuren ihastuksen. Eli menee eteenpäin.

Statistickon steesit:

  1. Elämä on niin monen sattuman summa ettemme voi varmaksi tietää, mihin olisimme päätyneet erilaisilla valinnoilla
  2. Epäonnistumisen jälkeen on tärkeintä mennä entistä vahvempana eteenpäin informaatiota paremmin hyödyntäen
  3. Muista iloita niistä positiivisista sattumuksista mitä on tapahtunut

”Jos käännyt katsomaan
taaksesi, näetkö silloin eteen”

Tulivuoria – Pariisin Kevät

https://www.youtube.com/watch?v=r7D-k7rYdL8

Facebooktwitterredditpinterestlinkedinmail

Useat tulonlähteet

Vossikka

Vossikka

Teknologia kehittyy ja maailma muuttuu kokoajan. Taxi-kuskit ovat tällä hetkellä huolissaan työpaikkojensa puolesta ja protestoivat Uber-kuskeja vastaan. Muistaakohan kukaan, että taxi-autoilijoiden ammattikunta on aikoinaan kaapannut markkinat vossikkakuskeilta?

 Useat tulonlähteet tulevaisuuden turvana

Kehitykseen kuuluu luonnollisena se, että joillekin töille on jatkossa vähemmän tarvetta ja tilalle tulee uusia ammatteja. Koska elämme sattuman sekoittamassa maailmassa, on vaikea ennustaa, mikä on oman nykyisen ammattiosaamisen kysyntä 10 vuoden päästä.

Kannatan ajatusta, että olisi hyvä olla useita tulonlähteitä, jolloin on paremmin suojautunut maailman muutoksien tuomia riskejä vastaan. Helpoin tapa sivutienesteille, mikä itselleni tulee mieleen, on aloittaa säännöllinen sijoittaminen vähäkuiluisiin indeksirahastoihin ja päästä näin käsiksi passiivisiin sijoitustuloihin. Tästä löytyy esimerkki edellisestä postauksestani. Toisille taas sopii paremmin asuntosijoittaminen, mikä tosin vaatii hieman enemmän aktiivisuutta ja isompaa kertasijoitusta.

Menestyspotentiaalin ja itsensä kehittämisen puolesta houkuttelevin vaihtoehto on yrityksen perustaminen ja pyörittäminen palkkatyön ohessa. Nykypäivänä verkkokaupan pystyttäminen ei edes vaadi kovin suuria alkuinvestointeja. Oma yrittäjätaipaleeni alkoi aikoinaan tällaisen verkkokaupan merkeissä. Tosin aikaa joutuu jostakin repimään ja yrittäminen usein kannattaakin aloittaa yhdessä luotettavan kumppanin kanssa, että saa työtaakkaa sekä ajatuksia jaettua.

Moni varmasti ajattelee, että sekä sijoittaminen että yrittäminen on riskialtista. Tottahan se on, mutta omasta mielestäni on vielä riskialttiimpaa, jos koko elämä roikkuu yhden työpaikan varassa. Suomessa sosiaaliturva tuo kyllä toimeentulon puolesta riittävän turvan yhden työn vakituisille työntekijöille, mutta riskinä on oman elämän päätäntävallan valuminen työnantajan ja sosiaaliviranomaisten käsiin. Pomolla on aina valta antaa potkut, mutta sivubisnes antaa myös työntekijälle vallan siirtyä satsaamaan omaan bisnekseen jos tuntuu, että pitää päästä vaihtamaan maisemaa.

Omat tulonlähteeni

Itselläni tulojen jakautuminen on hieman mennyt överiksi. Laskeskelin, että viimeisen kolmen vuoden aikana kuudella eri tulonlähteellä on ollut jonkinlainen rooli itseni elättämisessä. Jonkinlainen fokusoituminen voisi olla jatkossa paikallaan. Nyt kesäloman kynnyksellä olenkin vähän pureskellut menneiden vuosien bisneksieni hyviä ja huonoja puolia.

1. Yrittäjyys

Yrittäjänä on mahdollisuus saavuttaa oikeasti jotain merkittävää. Se tuo mahdollisuuden työllistää ja olla tärkeä palanen yhteiskuntaa. Vastuu on myös iso eikä virheitä voi täysin välttää. Mutta tyytyväisen asiakkaan palaute korvaa kyllä helposti pettymysten hetket. Saimme juuri Statistin kotisivut uuteen uskoon ja tällä ilmeellä lähdemme ottamaan selvää, missä ensi syksynä data-analyysiosaaminen kohtaa maailman tarpeet.

2. Sijoittaminen

Sijoittaminen avaa portit passiivisille osinko/vuokratuloille. Tämä mahdollistaa haaveen ”taloudellinen riippumattomuus jo ennen virallista eläkeikää” saavuttamisen. Tosin huonolla riskienhallinnalla ja tunteiden vallassa elämisellä sijoittaminen voi myös tärvellä oman talouden. Sijoittaminen tarjoaa analyyttisia haasteita ja omia tuloksiaan voi vertailla tunnettujen ”gurujen” kanssa. Erityisesti osakesijoittaminen on avannut silmät siitä, mitä ympärillä maailmassa oikeasti tapahtuu. Se on myös motivoinut ottamaan selvää historiasta, mikä taas luo pohjaa mielenkiintoisille keskusteluille erilaisten ihmisten kanssa. Sijoittaminen tulee taatusti olemaan vahvasti mukana elämässäni jatkossakin.

3. Akateeminen tutkimus

Tällä hetkellä en ole mukana aktiivisesti missään akateemisessa tutkimuksessa. Olen ollut hieman kriittinen tieteellisten artikkeleiden julkaisuprosesseja kohtaan, mutta ne vaikuttavat kehittyvän parempaan suuntaan. Tiedon kaivaminen sekä jakaminen on lähellä sydäntäni ja olen edelleen avoin mielenkiintoisille tutkimuskohteille.

4. Urheiluvedonlyönti

Urheilu on aina ollut läheinen osa elämääni ja siihen liittyvä data-analyysi on kiehtovaa. Vuosikymmen sitten rahan tekeminen nettivedonlyönnissä onnistui vähän yksinkertaisemmallakin matematiikalla, mutta nykypäivänä tehostuneilla markkinoilla analyysitaidot joutuvat tositestiin. Nostankin nöyrästi hattua niille, jotka elättävät itsensä pelkällä vedonlyönnillä ilman sisäpiiritietoa. Itselläni rahkeet riittävät tällä hetkellä vain tiettyjen erikoistilanteiden ja itseäni viisaampien näkemyksen hyödyntämiseen. Vedonlyöntiharrastukseen liittyy matsin katsomiseen yhdistettynä elämyksiä tuova jännitysmomentti ja aionkin pitää sen mukana harrastuksena ilman isoja tuotto-odotuksia. Jokainen plussamerkkinen euro on kotiinpäin.

5. Nettipokeri

Pokerin pelaaminen (itselläni nopeat ”sit and go” -turnaukset) tyydyttää kilpailuviettiä ja pelaamiseen keskittyminen on erinomainen tapa tyhjentää päätä kaikesta muusta epämääräisestä hälinästä. Menestys ei kuitenkaan ole ollut enää viime vuosina huipputasolla. Edellisen kolmen vuoden sijoitetun pääoman tuotto on +0.8 %. Se ei ole riittävä korvaus stressistä, mikä tulee pokeritulojen hurjasta vaihtelusta. Nettipokeri on myös yksinäistä ja isoina annoksina puuduttava harrastus, enkä halua tehdä sitä niin paljon että nykyisellä tuotto-odotuksella vuositulot olisivat varmasti positiiviset (todennäköisyys tehdä neljän tuhannen vuosittaisella turnaustahdilla ja 0.8 % tuotto-odotuksella positiivinen vuositulos on vain 62 %). Trendi vaikuttaa olevan, että vastustajien taso vaan kovenee vuosi vuodelta, joten ilman huomattavia satsauksia lisäkouluttautumiseen ei omassa tapauksessani ole kyse kovin kannattavasta bisneksestä.

En olevielä valmis ripustamaan korttipakkaa täysin naulaan, mutta jatkossa keskitän pelaamisen vain aikoihin kun tuotto-odottama on väliaikaisesti poikkeuksellisen korkea esim. pelifirman tarjoaman bonuksen vuoksi.

6. Tilastotieteeen opetus yliopistokurssilla

Perusasioiden opettaminen on varsin helppo työ, kun materiaalit ja prosessit ovat vuosien varrella kehittyneet toimiviksi. Kolikon kääntöpuolena työ tulisi jatkossa olemaan samojen asioiden ”jankkaamista” eikä kehittäisi itseäni eteenpäin. Niinpä päätin nyt keväällä luopua kurssin vetämisestä tällä erää.

Yhteenveto

Useampi tulonlähde helpottaa selviytymisestä elämän yllättävistä käänteistä ja ylläpitää oman elämän valinnanvapautta. Ajanhallinta on kuitenkin vaikeaa, jos erilaisia tulonlähteitä yrittää haalia liikaa. Itse aion jatkossa keskittyä enemmän yrittämiseen ja sijoittamiseen sekä vähemmän pokerinpelaamiseen ja opettamiseen. Näin uskon myös vapautuvan enemmän aikaa hyvinvoinnin ylläpitämiseen ja sosiaaliseen elämään.

Facebooktwitterredditpinterestlinkedinmail

Joululahjaksi laadukasta ajattelua

Tähän aikaan vuodesta useilla on pähkäilyn alla ”Mitä hankkia joululahjaksi henkilölle, jolla on jo kaikkea. Mitään turhaa krääsääkään ei viitsisi ostaa…” Oma vinkkini on tajuntaani hurjasti laajentanut kirja Thinking fast and slow tai sen suomennettu versio Ajattelu nopeasti ja hitaasti. Kirjan on kirjoittanut Daniel Kahneman, joka on tutkinut päätöksenteon psykologiaa vuosikymmeniä ja palkittu elämäntyöstään Nobelilla. Thinking fast and slow nitoo yhteen kansantajuisesti oppeja ihmisten psykologisista ajattelun luonnollisista vääristymistä verrattuna matemaattiseen rationaalisuuteen.

Miksi haluaisimme ymmärtää psykologisia heikkouksiamme?

KulutusvalintaOletko joskus huomannut ostaneesi mainoksen perusteella tuotteen, jolle ei ole juuri käyttöä löytynytkään?  Tai oletko äänestänyt vaalimainosten ja -lupausten perusteella poliitikkoa, joka ei oikeasti jaakaan samoja arvoja kanssasi? Jätän lukijan itse pohdittavaksi, kuinka paljon todellisuudessa mainostoimistot tai poliitikot pyrkivät johtamaan kuluttajia harhaan, mutta ei siitä ainakaan haittaa ole, mikäli jatkossa osaamme välttää joitain ansoja ja tehdä enemmän oikeasti hyvinvointiamme edistäviä valintoja.

Oletus rationaalisesta päätöksentekijästä

Taloussysteemimme rakenteita on pyritty ilmaisemaan taloustieteen perusteoksissa yksinkertaisin matemaattisin esityksin. Jotta tämä olisi mahdollista, joudutaan niissä usein tekemään myös hieman epärealistisia oletuksia tyyliin: ”Kuluttajat valitsevat aina sellaisen kulutusratkaisun, mikä maksimoi heidän tulevan hyvinvointinsa.” Koska tällaiset superrationaaliset yli-ihmiset ovat aika harvinaisia, ovat kriittisimmät tyypit valmiita hylkäämään koko taloustieteen ”huuhaana”. ”Juupas-eipäs”-väittelyn sijaan psykologi Daniel Kahneman on yhdessä edesmenneen Amos Tverskyn kanssa selvittänyt urallaan, millä lailla ja kuinka paljon ihmisten tyypillinen ajattelu poikkeaa rationaalisesta päätöksenteosta. Näenkin Kahnemanin&Tverskyn tutkimuksissa sillan tunteita korostavien humanistien ja kylmän rationaalisuuteen pyrkivien taloustieteilijöiden välille toistensa ajatusmaailmoihin.

Sattuman käsittely

Omaa innostusta kirjaa kohtaan ei ainakaan laske se, että Kahneman vaikuttaa myös erittäin pätevältä tilastotieteilijältä. Iso osa hänen tutkimuksistaan koskee sitä, kuinka ihminen tekee valintoja epävarmuuden vallitessa.

Ihmisten aivot kehittyvät evoluution mukana, mutta evoluutio ei ole pysynyt teknologisen kehityksen ja talouskasvun vauhdissa. Teemme herkästi ylireagointeja pienten aineistojen informaatioon, joissa on paljon sattumalla osuutta asiaan. On elonjäämisen kannalta kriittistä osata ylireagoida pieniinkiin vaaran merkkeihin, kun elämme samoilla seuduilla villien petoeläinten kanssa. Sen sijaan turvallisessa Pohjolan hyvinvointiyhteiskunnassa asuen eteen tulevissa valinnoissa ylireagointi ei ole niin hyödyllistä.

Opit rahapelaajille ja kilpaurheilijoille

Sattuman merkityksen ymmärtäminen ei ole todellakaan helppoa. Vaikka takana on vuosien työ tilastoaineistojen parissa erilaisia simulointikokeita tehden, niin sattuma vaan välillä pääsee yllättämään omissa henkilökohtaisissa asioissa, kuten itselläni oman pokerimenestyksen pohdinnassa. Jalkapallotoimittaja Lari Vesander taas avaa blogikirjoituksessaan Kahnemanin oppeja siitä, kuinka kilpaurheilun satunnaisuus hämää jatkuvasti urheiluselostajia ja valmentajia.

Ihmiset tyypillisesti kokevat rahalliset tappiot saman kokoista voittoa suurempana ja painottavat liikaa ajattelussaan pieniä, suuruusluokkaa 0.1% – 5% olevia todennäköisyyksiä. Nämä opetukset ovat myös vallitsevia teemoja pokerin oppi-isäni Tommi Verkasalon pokeripsykologiaa käsittelevässä ansiokkaassa gradussa: Voiton ja häviän vaikutus pokerinpelaajan riskipreferensseihin. Jääkiekossa tappiolla ollessa kannattaa ottaa hurjiakin riskejä (maalivahti pois lopussa) ja johdossa pelata ylivarovaisesti. Sama käyttäytymismalli toistuu kuitenkin myös pokerissa, vaikka siinä jokaisen Euron/Dollarin pitäisi olla yhtä arvokas riippumatta oletko siltä päivältä voitolla vai häviöllä.

Kahnemanin opit myös osaltaan selittävät lotto-tyyppisten arpajaisten ja vakuutusten suosiota (arpalipun hintaa ja pientä vakuutusmaksua ei yleensä koeta tappioksi). Lähinnä matemaattisen riskienhallinnan näkökulmasta kirjoittamani blogipostaukseni vakuutuksista saa kirjassa tuntemuksiin perustuvan jatko-osan.

Valintojen muokkautuminen

Vuosikymmenten akateemisia tutkimustuloksia yhteen paketoiva kirja kuulostaa äkkiseltään aika kuivalta joulupuurolta, mutta Kahneman onnistuu kirjoittamaan helppotajuisesti erilaisilla testeillä lukijaansa viihdyttäen. Yksi suosikeistani on seuraava:

Ongelma 1:

Valitse toinen:

E. 25% mahdollisuus voittaa 240$ ja 75% mahdollisuus menettää 760$.

F. 25% mahdollisuus voittaa 250$ ja 75% mahdollisuus menettää 750$

Ongelma 2:

Kuvittele, että joudut päättämään seuraavasta samanaikaisesta asiaparista. Pohdi ensin kumpaakin päätöstä ja kerro sen jälkeen, mitä valintoja (AC, AD, BC vai BD) suosit.

Päätös (i). Valitse toinen:

A. Varma 240$ voitto

B. 25% mahdollisuus voittaa 1000$ ja 75% mahdollisuus olla voittamatta mitään

Päätös (ii). Valitse toinen:

C. 750$ varma menettäminen.

D. 75%:n mahdollisuus menettää 1000$ ja 25%:n mahdollisuus olla menettämättä mitään.

Ongelma 1:ssä on helppo nähdä, että F on kannattavampi vaihtoehto ja Kahnemanin kokeessa kaikki koehenkilöt valitsivat sen. Ongelma 2:ssa tulee taas hieman vaihtelua. Kokeessa suosituin valintayhdistelmä oli AD (73% koehenkilöistä valitsi sen) ja kaikista epäsuosituin  BC (vain 3% koehenkilöistä). Nyt kun asiaa hieman tarkemmin mietitään tarvittaessa taskulaskimella summaten, niin huomataan että yhdistelmä AD on itse asiassa aivan sama kun Ongelma 1:n  E-vaihtoehto. Ja vähiten suosittu BC… aivan oikein: Ongelma 1:n F, minkä piti olla selvästi järkevämpi valinta.

Järki ja tunteetTämä esimerkki havainnollistaa kuinka helposti normaalit psykologiset ”heikkoudet” ja yksinkertaiset nyrkkisäännöt dominoivat ajattelua kun pitäisi tehdä vähäänkin haastavampaa matemaattista laskentaa. Toisaalta se havainnollista kuinka voidaan saada toinen ihminen olemaan samasta asiasta eri mieltä muotoilemalla asiaa eri muotoon tyypillisiä ajattelun vinoutumia hyödyntäen.

Itselläni tämä kirja tärähti tietokirjallisuuden TOP-listani kärkeen. Päällimmäinen ajatukseni nyt kun takakansi tuli vastaan on ”Pitääpä aloittaa heti alusta uudelleen”.

Joitain Kahnemanin teesejä normaalista ihmisestä tuntemuksineen:

  • pyrkii tekemään ensisijaisesti päätöksiä intuition ja helppojen nyrkkisääntöjen perusteella
  • pyrkii välttämään tappion tunteita ja ylisuojelemaan saavutettuja voittoja
  • aliarvioi sattuman vaikutusta ja yliarvioi oman tietämyksensä
  • korostaa huippuhetkiä ja viimeisiä tapahtumia muistojen onnellisuuden kokemisessa
Facebooktwitterredditpinterestlinkedinmail

Mistä näitä korrelaatioita oikein tulee?

Kirjoitus on julkaistu myös Louhia-blogissa 21.10.2014.

Korrelaatiokerroin on eräs mittari kahden muuttujan välisen yhteyden mittaamiseen. Mikäli termi ei ole ennestään tuttu, sen ideaan voi tutustua esim. täällä. Sosiaalisessa mediassa on kiertänyt tällainen sivusto, jonne on listattu korrelaatiolla mitattuja yhteyksiä mitä eriskummallisimpien ilmiöiden välille. Mikä nämä selittää? Hukuttautuvatko ihmiset nähdessään Nicholas Cagen tähdittämän elokuvan vai onko taulukkolaskentaohjelma mennyt sekaisin?

Korrelaatioiden lähteet

Kahden ilmiön välinen korrelaation suuruus tilastoaineistossa voi johtua seuraavista neljästä asiasta tai jostain niiden yhdistelmästä.

1. Syy-seuraus suhde

Esim. kahvin juonti aiheuttaa verenpaineen kohoamista, mutta yhteys ei toimi toisinpäin. Korkea verenpaine ei yllytä juomaan lisää kahvia. Tällaista yhteyttä kutsutaan myös kausaaliteetiksi.

Dog in the pool

2. Molemminpuolinen riippuvuus

Esim. tietyn kenkämallin kysyntä ja tarjonta: kysynnän kasvaessa yritys alkaa valmistamaan kenkiä lisää ja tarjonta kasvaa. Toisaalta jos syystä tai toisesta kenkiä on valmistettu poikkeuksellisen paljon, yritys pyrkii tehostetulla markkinoinnilla tai alennuksilla lisäämään kysyntää.

3. Ilmiöt eivät suoraan riipu toisistaan, mutta molempiin vaikuttaa joku kolmas ilmiö

Esim. jo legendaarinen jäätelön syönti ja hukkumiskuolemat. Jäätelöä syömällä uimataidot eivät häviä vaan molempien taustalla on kolmas taustatekijä; lämpötila, mikä aiheuttaa samansuuntaista vaihtelua jäätelön syönnin ja hukkumiskuolemien välille.

4. Puhdas sattuma

Esittelemäni SoMe-artikkelin esimerkki, Nicholas Cagen leffaesiintymiset ja hukkumiset uima-altaaseen vuosina 1999-2009 saattaisi hyvinkin kuulua tähän kategoriaan. Ilmeistä on, että yhteys ei tule säilymään, mikäli seurantaa jatketaan vuodesta 2009 eteenpäin tarpeeksi pitkään.

Sattuman tuottamat korrelaatiot

Jos ihmiset eivät tarkoituksella hukuttaudu katsottuaan Cagen elokuvan tai juoksentele sähkölinjoihin mentyään naimisiin Alabamassa, niin mistä näitä merkillisiä korrelaatioita sitten tulee näin paljon? Tehdäänpä pieni kokeilu. Meillä on 7 muuttujaa, jotka voivat kuvata mitä numeroilla mitattavaa ilmiöitä tahansa, mutta niin etteivät ne todellisuudessa riipu millääan tavalla toisistaan. Nimetään muuttujat nyt X1, X2, …, X7. Arvoin kaikille näille muuttujille 12 (tyypillinen otoskoko SoMe-artikkelissa) satunnaislukuhavaintoa toisistaan riipumattomasti. Järkeenkäypää siis olisi, etteivät ne korreloisi keskenään ainakaan merkitsevästi. Tulokset näkyvät seuraavassa grafiikkamatriisissa.

korrelaatiokuvaaja

Vasemmasta ylänurkasta oikeaan alanurkkaan kulkevalla matriisin lävistäjällä on aina yksittäisen muuttujan arvottuja havaintoja kuvaava histogrammi. Vasemmalla alhaalla olevat sirontakuviot kuvaavat kahden muuttujan havaintoja yhtäaikaa niin että pystyakselilla on se muuttuja jonka rivillä ollaan ja vaaka-akselilla sarakemuuttuja.

Oikealla ylhäällä olevissa ruuduissa on kyseisellä rivillä ja sarakkella olevan muuttujan välinen korrelaatiokerroin. Luku on printattu sitä isommalla fontilla, mitä suurempi (itseisarvoltaan) korrelaatio on ja vieressä on punainen tähti osoittamassa mahdollista korrelaatiokertoimen tilastollista merkitsevyyttä. Punainen piste taas tarkoittaa, että korrelaatio on ”melkein merkitsevä” mutta ei aivan ylitä tieteellistä merkitsevyysrajaa.

korrelaatiokuvaaja_yksi_pariNyt  saatiin merkitsevä korrelaatiokerroin 0.69 muuttujien X4 ja X7 välille. Kun otetaan kyseiset muuttujat vielä lähempään tarkasteluun, huomataan että nouseva suora kuvaa hyvin muuttujien välistä yhteyttä aineistossa: X4:n ollessa suuri tuppaa X7 myös saamaan suuria arvoja. Nyt jos muuttujat sattuisivat olevaan vaikka ”Sabina Särkän lehtihaastattelujen lukumäärä yhden vuoden aikana” ja ”Matti Nykäsen vuoden pisimmän hypyn pituus”, SOME-hitti on valmis ja lööpit laulaa. Vain mielikuvitus on rajana keksiessä selityksiä tämän yhteyden välille.

Todennäköisyyslaskenta on tutkijan paras kaveri

Vielä saattaa herätä kysymys, että huijasinko ja toistin arvontoja niin monta kertaa, kunnes tuli tällainen poikkeama. Todellisuudessa tässä ilmentymässä ei ole mitään poikkevaa, koska todennäköisyys saada sattumalta vähintään yksi merkitsevä korrelaatio, kun testataan 21 toisistaan riippumatonta muuttujaparia on n. 66%. Ei tarvita montakaan sataa muuttujaparivertailua, jotta saadaan kasaan SoMe-artikkelissa olevat 19 erikoista ”tilastollisesti merkitsevää” yhteyttä pelkästään sattumalta. Todellisessa tutkimuksessa on todennäköisyyslaskennan avulla syytä säätää korrelaatioiden hyväksymiskriteerejä sen mukaan, onko tärkeämpää löytää paljon potentiaalisia yhteyksiä vai välttää virheellisiä tulkintoja. Aina pitää olla hereillä, kun tekee suurista muuttujamääristä ”machine learning”-tyyppistä datan penkomista. Systemaattinen laskentaprosessi ilman todennäköisyysajattelua päätyy helposti itsensä harhaanjohtamiseen. Ja hauskoihin lööppeihin.

Statistickon steesit:

  1. Yksittäisestä aineistosta löytyy yllättävän suuria korrelaatioita sattumalta varsinkin kun havaintoja on vähän ja muuttujia paljon
  2. Tilastotieteen syvällisempi osaaminen auttaa välttämään riippuvuustutkimuksen sudenkuopat

 

Facebooktwitterredditpinterestlinkedinmail

Taistelu muiden informaatioetua vastaan

Olisi helppoa tehdä fiksuja ratkaisuja, jos tietäisi enemmän kuin kukaan muu. Näin ei juuri koskaan ole, mutta päätöksiä pitäisi silti tehdä. Aiemmassa postauksessani Eetu Extremeurhilija oli mukana kilpailussa, jossa piti ennustaa mahdollisimman hyvin huomisen säätä. Eetulla oli vähemmän tietoa käytettävissä kuin muilla ja näin ollen olisi tarvinnut pläjäyksen tuuria voittaakseen. Seuraavassa käydään läpi, mitä Eetun asemassa voimme tehdä etumatkan kutistamiseen ”paremmintietäviin” nähden. Esimerkkeinä toimii valintatilanteet osakesijoittamisessa, urheiluvedonlyönnissä ja asunnon ostossa.

Osakesijoittaminen

Akten Ordner mit Kette verschlossenSisäpiirisäädökset kieltävät pörssiyrityksen ytimeen kuuluvien henkilöitä käymästä kauppaa yrityksen osakkeilla ajanjaksolla, mikä käsittää kaksi viikkoa ennen neljännesvuosituloksen julkistamista. Tämän ajatellaan olevan aikaa, jolloin tulos alkaa olla hyvin hahmottunut sisäpiiriläisillä, mutta sitä ei ole vielä julkistettu. Sisäpiiriläiset eivät saa koskaan myöskään paljastaa ulkopuolisille yhtiön osakkeiden arvoon vaikuttavia tietoja ennen virallista tiedotusta. Nämä ovat piensijoittajan kannalta loistavia lakeja ja tarjoavat jonkinasteista tasavertaisuutta.

Ehkä olen kuitenkin kyyninen persoona, koska en usko että sisäpiirilaki toteutuu käytännössä täysimääräisenä. Vaikea uskoa, että kaikki pystyisivät olemaan niin jämäköitä, etteivät saattaisi jotain lipsauttaa ”pienellä kiertoilmaisulla” mukavalle kaverille parin tarjotun tuopin jälkeen. Toisekseen yhtiön osakkeilla voi käydä kauppaa henkilöt, jotka ovat töissä firmassa ja kohtuullisen hyvin hajulla seuraavasta tulosjulkistuksesta vaikka eivät aivan sisäpiirirekisteriin kuulukkaan. On siis turvallista ajatella: ”Jotku toimijat markkinoilla aina tietävät enemmän kuin minä.”

Paremmintietävien informaatioetua voi kuitenkin minimoida ainakin kahdella tavalla

1. Tee ”buy and hold” sijoituksia. Älä harrasta aktiivista kaupankäyntiä.

Informaatioedun puute konkretisoituu, kun joudut tekemään sijoituspäätöksen. Näiden päätöksien lukumäärän saat minimoitua ostamalla osaketta ja istumalla sen päällä loppuelämän osinkoja keräillen.

2. Ajoita sijoitukset heti osavuosikatsauksen jälkeen.

Heti osavuosikatsauksen jälkeen on se ajankohta, jollon julkisen tiedon määrä yrityksen tilasta on maksimissaan. Sijoitusmarkkinoiden käyttäytymistä edellisen tulosjulkistuksen (Q2, 2014) jälkeen eri suomalaisten pörssiyhtiöiden kohdalla on ansiokkaasti koottu täällä.

Urheiluvedonlyönti

Yleisin tapa joukkuelajien vedonlyönnissä saada informaatioetua on tietää ensimmäisten joukossa joukkueiden kokoonpanot. Mikäli et kuulu niihin onnellisiin, joille sisäpiiristä tihkutaan ennakkotietoja, on vedonlyönnin ajoituksella merkitystä. Sinulla on kaksi mahdollisuutta päästä paremmintietävien sisäpiiriläisten kanssa lähes samalle viivalle:

1. Jätä vetosi mahdollisimman aikaisin, ennen kun joukkuiden valmentaja päättää kokoonpanoista

Jos valmentaja itsekään ei vielä tiedä lopullista kokoonpanoa, niin kuka muukaan sitä voisi tietää? Jättämällä vedot hyvissä ajoin, joudut tekemään valistuneita arvauksia odotetusta kokoonpanosta samalla lailla kuin kaikki muutkin vedonlyöjät ja vedonlyöntitoimistot.

2. Jätä vetosi juuri ennen ottelun alkua, kun kokoonpanot ovat kaikkien tiedossa

Viimeisen puolentunnin aikana ennen ottelun alkua kokoonpanot ovat yleensä jo julkisesti tiedossa ja paremmintietävien etumatka kaventunut minimiin. Tässä on kuitenkin hyvä muistaa, että lajeissa joissa liikkuu isot rahat, viimeisten hetkien vedonlyöntimarkkinat ovat nykyään jo aika tehokkaat ja ylikertoimia (joukkueen voittotodennäköisyyteen verrattuna liian suuri kerroin, minkä lyöminen on tuottoisaa pitkällä tähtäimellä) on vaikea löytää.

Asunnon osto

Asunnon ostaminen on useimmille rahallisesti elämänsä suurin valintatilanne. Kansalaisten informaation tasoa tasoittaakseen Ympäristöministeriö ylläpitää tilastopalvelua, jossa voi hakea viimeisen vuoden aikana toteutuneita asuntokauppoja erilaisten kriteerien perusteella. Kiinteistövälittäjien informaatioetua tämä palvelu ei kuitenkaan täysin poista, koska heillä on käytössään paljon yksityiskohtaisemmat kauppatilastot pidemmältä ajanjaksolta. Palvelua käytettäessä on vielä muistettava, että usein rajatut haut tuottavat niin vähän tuloksia, että yksittäisiin asuntoihin liittyvät poikkeavuudet vääristävät liikaa kokonaiskuvaa.

Käsittele tietoa paremmin

??????????????????Puhutaanpa sitten sijoittamisesta, vedonlyönnistä tai mistä tahansa muusta päätöksenteosta, on yksi asia, mitä voi tehdä paikatakseen puutteellista absoluuttista informaatiota: käsittele käytettävissä olevaa tietoa paremmin.

Joskus tiedon parempi käsittely tarkoittaa analyysimenetelmien teknistä opettelua ja havaintojen muuttamista numeroiksi. Kuinka paljon jääkiekkojoukkueen voittotodennäköisyys tippuu, kun luotettavan maalivahdin (jäällä yleensä koko ottelun) sijaan kokematon juniori on pelivuorossa ja samalla tulee tieto, että vastustajan tähtilaitahyökääjä (jäällä n. 20 min ottelussa) on loukkaantunut?

Usein saa etua muihin kun yksinkertaisesti ymmärtää olemaan ylireagoimatta pienten aineistojen informaatioon. Ellei ilmiölle ole taustalla vahvaa selitysehdotusta, mitä ei keksitty vain käsiteltävien havaintojen perusteella, pienten otoksien tulokset ovat yleensä merkityksetöntä kohinaa. Tämä siitäkin huolimatta, että toimittajat mielellään nostavat esiin kaivelemalla kaivettuja ”tilastofaktoja” tyyliin ”Kalpa on voittanut putkeen jo viisi peliä, jotka on pelattu kotona parittomien viikkojen torstaina.” (Voit lukea lisää  taustahypoteesien merkityksestä edellisestä postauksesta)

Kerrostaloasuntojen arvottamiseen liittyvä informaation käsittely on tehty poikkeuksellisen helpoksi ASLA-asuntolaskurin avulla (laskurin isä on bloggari itse, mutta Pinjalle iso kiitos kehitystyöstä). Parin havainnon sijaan laskuri antaa kerrostalohuoneistolle arvion tuhansien julkisten kauppatietojen perusteella laskettuun tilastomatemaattiseen malliin. Lisäksi käyttäjälle on tarjoalla työkaluja hallitsemaan sitä vaihtelua hinnoissa, mikä ei suoraan välity julkisista myyntitilastoista.

Statistickon steesit:

  1. Hyväksy, että joillain muilla on enemmän tietoa käytettävissä
  2. Kiri muiden informaatioetumatkaa ajoittamalla päätökset tasapuolisiin ajankohtiin ja käsittelemällä tietoa paremmin

Blogissa esitetyt ajatukset perustuvat kirjoittajan vuosien varrella hahmottuneisiin näkemyksiin, joihin ovat vaikuttaneet omat tiedonjalostuskokemukset ja lukuisat ulkoiset vaikuttajat. Toisinaan näkemykset osoittautuvat myöhemmin vääriksi. Kommentoithan, mikäli pystyt perustelemaan toisenlaisen näkemyksen.

Facebooktwitterredditpinterestlinkedinmail

Tutkimushypoteesit ja pokerimenestys

Virheelliset tutkimukset

Tutkimusaineistoista löytyy aina jotain merkillisyyksiä pelkästään sattumalta, kun datoja tarpeeksi paljon pyöritellään ja kaivellaan. Jos testaamme juuri niitä hypoteeseja, mitkä tulivat mieleen aineiston erikoisuuksia kaivelemalla, niin tottakai saamme tilastollisesti merkitseviä tuloksia. Tulokset eivät vaan ole päteviä, koska riippumattomuusoletukset eivät täyty. Tämä onkin ehkä yleisin tilastojen väärinkäyttötapa, jonka takia maailmassa on julkaistu hurja määrä tutkimustuloksia, mitä ei ole enää seuraavassa saman alan tutkimuksessa pystytty toistamaan (viite). Itse olin lähellä sortua vastaavaan tutkimuskentällä yleiseen virheeseen, kun olin turhautunut omasta heikosta menestyksestäni pokeripöydissä.

Tuuri pokerissa

Pokerimenestyksen tutkiminen

Pokeri on peli, joka on olemukseltaa jossain shakin (pelissä ei tuurielementtiä, parempi pelaaja voittaa) ja ruletin (puhdas tuuripeli) välimaastossa. Matemaattisilla ja psykologisilla taidoilla voi saada edun muita pelaajia vastaan, mutta sattumalla on suuri vaikutus siihen, kuinka yksittäisessä pelissä käy. Itse olen harrastanut pokeria pääasiassa ”texas hold’em sit and go”-turnauksina, joissa matemattiset taidot korostuvat. Nettipokerissa menestyminen oli pari vuotta sitten vielä merkittäväkin tulonlähde, mutta viime vuosi 2013 oli tappiollinen, eikä menneillä oleva alkuvuosikaan ole tuonut vielä suurta parannusta. Nyt mieltä vaivaava kysymys kuuluu: ”Onko lähimenneisyyden huono tulos selitettävissä sattumalla vai pelaavatko vastustajat nykyään paremmin (tai minä huonommin) kuin aikaisemmin?”.

Tilastot turnauksista

Oman nettipokerituurin (ja vastustajien pelityylien) selvittämiseksi olen onneksi vuosi sitten hankkinut apuohjelman, joka kerää aineistoa pelaamistani turnauksista jälkianalyysejä varten. Tilastot paljastavat, että tappiot selittyvät yhden pokerifirman, kutsutaan sitä vaikka nimellä ”Täystöötti”, peleillä. Tällä pokerisivustolla olen pelannut valtaosan peleistäni.

Graafissa punainen käyrä kertoo, mikä todennäköisyyksien mukaan tulokseni pitäisi olla, jos ”all-in” tilanteissa tuurini olisi ollut keskimääräinen. Vihreä käyrä kertoo, mikä todellinen tulokseni on ollut turnausmaksuina. Karkeasti voisi yksinkertaistaa seuraavasti: Mikäli punainen käyrä on nollan yläpuolella, on pelaaja ollut turnausmenestyksen kannalta hyvissä tilanteissa kun kaikki rahat menevät pottiin ja piilokortit käännetään esiin. Jos vihreä käyrä on punaisen käyrän yläpuolella, niin pakasta tulleet viimeiset ratkaisukortit ovat olleet keskimääräistä suotuisampia (ja vastaavasti heikompia, kun ollaan punaisen käyrän alapuolella).

meh_graafi_cannon_180714

Menestys ja ”pakkatuuri”-korjattu menestys Täystöötin peleissä.

hem_graafi_pspp_18072014

Menestys ja ”pakkatuuri”-korjattu menestys muissa kun Täystöötin peleissä.

Täystöötin peleissä vaikuttaisi olleen järkyttävän huonoa tuuria, koska toteutunut käyrä (vihreä) on n. 140 turnausmaksua ”pakkatuuri”-korjatun (punaisen) käyrän alapuolella. Muiden firmojen peleissä taas käyrät käyttäytyvät niinkuin pitkässä juoksussa pitäisikin, eli seurailevat toisiaan. Tässä vaiheessa useimmilla tappion lyömillä pelaajilla herää epäilyksiä, että  Täystöötti huijaa minun vastustajieni eduksi tai vähintäänkin heidän satunnaisgeneraattoriin on lipsahtanut koodausvirhe. Tämän jos voisi tilastollisesti todistaa, niin voisi alkaa vaatimaan heiltä korvauksia tai vähintään boikotoimaan sekä mollaamaan foorumeilla. Jos näillä aineistoilla lähtisin asiaa tilastollisesti testaamaan niin epäilemättä saisin erittäin merkitseviä tilastollisia todistuksia vinoutuneesta satunnaisgeneraattorista. Laajasta menetelmä-työkalupakistani huolimatta en näin kuitenkaan tee.

Tutkimushypoteesi

Meillä olisi nyt seuraava tutkimushypoteesi, mitä lähdettäisiin todistamaan vääräksi:

H0: ”Täystöötin pokeripelien satunnaisgeneraattori on rehellinen”

Testien lopputulokset ovat usein muotoa ”On alle 5% mahdollisuus, että aineistossa ilmenevä poikkeama hypoteesista johtuisi sattumasta. Näinollen hypoteesi ei pidä paikkaansa ja tulos on tilastollisesti merkitsevä”. Huono uutinen tutkimuksellemme on se, että keksimme hypoteesin aineistomme avulla. Tilastolliset testit taas vaativat, että käytössä on hypoteesista riippumaton satunnaisotos.

Tutkimuksen jatko

Parasta mitä tässä tilanteessa voimme tehdä, on alkaa keräämään uutta aineistoa, jolla voimme testata, pitääkö havaitsemamme poikkema todella paikkansa. Tutkimussuunnitelma on nyt seuraava: pelaan 3000 uutta turnausta. Näistä hyväksyn tutkimukseen joka kolmannen aloittaen kolmannesta. Tällä pyrin ehkäisemään peräkkäisten turnausten mahdollista korrelaatiota, mikä on seurausta samoista vastustajista tai edellisen turnauksen lopputuloksesta johtuvasta tunnetilasta. Tämän jälkeen meillä on käytössä myös hypoteesista riippumaton satunnaisotos validin tutkimuksen tekemiseksi.

Entäs silloin kun meillä on vain yksi aineisto, eikä sitä ole tulossa lisää lähitulevaisuudessa? Tutkimushypoteeseja ei ole voitu asettaa etukäteen tai niitä on paljon. Toteammeko, että aineisto on hyödytön ja heitämme kirveen kaivoon? Toki datan antama singnaali on aina jonkunlainen vihje todellisuuden tilasta. Meillä vaan tulee ongelmia todennäköisyyslaskelmissa kun halausimme arvioida kuinka suurella varmuudella voimme yleistää signaalin koskemaan todellisuutta aineiston ulkopuolella. Tapauksesta riippuen voimme joko tehdä korjauksia menetelmien todennäköisyyslaskelmiin tai erottaa ja säästää osa aineistosta tuloksien varmentamiseen. Näistä tekniikoista sekä Täystöötin satunnaisgeneraattorin testaamisen tuloksista lisää myöhemmissä blogipostauksissa.

Statistickon steesit:

  1. Tutkimushypoteesi pitää asettaa ennen tutkimusaineiston tarkastelua
  2. Dataa tutkiskelemalla löytynyt yllättävä seikka on enemmän hypoteesi uudelle tutkimukselle (uudella datalla) kuin yleistettävissä oleva tulos
Facebooktwitterredditpinterestlinkedinmail

Tuurin alkulähteillä

Past Vs Future Dice Today Tomrrow Comparison Betting GambleKirjoitus on julkaistu myös Louhia-blogissa 9.5.2014.

Tilastotieteeseen perustuva analytiikka on jollain tapaa säännönmukaisuuksien ja sattuman erottelua toisistaan. Vastasyntyneen lapsen isää saattaa kiinnostaa, minkä tietojen avulla voidaan laskea lapselle odotettu pituus aikuisiässä (ohjatakseen ajoissa oikean urheilulajin pariin) ja millä todennäköisyydellä pituusennuste menee täysin pieleen. Pokerinpelaajaa saattaa kiinnostaa oliko turnauksen voitto pääosin vain tuurin ansiota vai oliko hän oikeasti muita parempi pelaaja.

Sattuman määrittelyä noppaleikein

Stokastiikka tarjoaa omat matemaattiset perusteet sattumalle, mutta mietitään mitä käytännössä sattuma tarkoittaa. Leikitään, että olemme heittämässä noppaa ja tavoitteenamme on saada heitettyä numero 6. Mietitään tavoitteen onnistumista heitettäessä neljältä eri korkeudelta.

Heitto Heittokorkeus Heittotyyli Todennäköisyys kuutoselle
1. 1 cm Täysin hallittu pudotus. Sattuma ei ehdi vaikuttamaan. 100%
2. 2 cm Halittu pudotus, jonka ilmavirta joskus kääntää väärään numeroon 75% (arvio)
3. 5 cm Suljetaan 2 numeroa pois heittämällä niin, että noppa pyörii vain yhteen suuntaan 25% (=1/4)
4. 100 cm Täysin sattumanvarainen 16.7% (=1/6)

Jossain välillä 5 cm – 100 cm olemme ylittäneet rajan, jonka jälkeen emme enää pysty heittotaidoilla vaikuttamaan kutosen ilmenemiseen. Ilmanvastuksen ja painovoiman vaikutus on sellainen, jota emme osaa hallita/laskelmoida, joten meidän näkökulmasta sattuma määrää täysin lopputuloksen. Todennäköisyysjakaumat määrittävät kuitenkin raamit, missä sattuma operoi. Tässä tapauksessa todennäköisyysjakauma sanoo, että kutonen tulee kerran kuudesta, eli todennäköisyys on 16.7%.

Näin saatiin hahmoteltua sattumalle (= tuurin/säkän vaikutus) käytännönläheinen määritelmä: Sattuma on informaatiota, jota ei tunneta. Kun noppa on pysähtynyt, tiedämme tuloksen eikä tulokseen ole enää sattumalla vaikutusta. Nopan ollessa ilmassa osa lopputuloksen informaatiosta on vielä tuntematonta. Sen määrä riippuu siitä, miltä korkeudelta kutosta yritetttiin tähdätä.

Sattuman tyypit

Tässä vaiheessa jakaisin sattuman vielä kahteen luokkaan.

B-luokan sattuma
Sattumaa, joka on jonkinlaisella tietotaidolla supistettaavissa. Esim. kohdan 2. nopanheitossa joku taitava heittämistä harjoitellut  taikuri saattaisi saavuttaa kutosen todennäköisyyden 98%, vaikka meillä  tavallisilla viskelijöillä se oli 75%.

A-luokan sattuma
Sattuma, josta ei millään päästä eroon vaikka käytettävissä olisi kaikki tämän hetken tietotaito ja teknologiat. Esim. noustaan Puijon torniin heittämään noppaa maahan, niin ei varmasti maailmasta löydy sellaista taikuria, joka pystyisi nostamaan kutosen todennäköisyyttä yli 16.7%:n. (Noppaan ei saa tehdä fyysisiä muutoksia.) Näin ollen kaikki heittoon liittyvä sattuma on A-luokan sattumaa.

Ennusteiden subjektiivisuusFrosch in Hand

Nyt olemme ehkä jo havainneetkin, että sattuma voi olla jossain määrin subjektiivinen (vaihtelee eri henkilöiden välillä) käsite. Havainnollistetaan sitä vielä seuraavalla esimerkillä:

Kolme henkilöä yrittää ennustaa (omilla tiedoilla, ilman netin tai TV:n apua), mikä on lämpötila Helsingissä seuraavana päivänä klo 12.

1. Eetu Extremeurheilija

Eetu on ollut onnettomuuden jäljiltä viimeiset puoli vuotta koomassa. Hän on juuri herännyt ikkunattomassa sairaalasssa. Eetulla onneksi aivot toimivat normaalisti, mutta hänellä ei ole minkäänlaista ajantajua edes vuodenajasta. Eetun tekee näillä tiedoilla parhaan mahdollisen arvauksen ja veikkaa edellisten vuosien arvioitua keskilämpötilaa +7 astetta. Eetu tosin tiedostaa, että arvauksessa on paljon epävarmuutta ja sattumalla on iso vaikutus siihen, kuinka lähelle ennuste osuu.

2. Pera Perustietäjä

Peralla ei ole käytössä analyysimenetelmiä, joista voisi olla hyötyä tarkkojen ennusteiden tekemiseen. Hän kuitenkin järkeilee, että peräkkäiset päivät ovat yleensä jossain määrin samankaltaisia. Omien tietojensa pohjalta hänen paras arvaus onkin tänään päivällä lämpömittarissa paistanut lukema +20.

3. Mauno Mallintaja

Mauno on maailman parhaimmistoon kuuluva metereologi. Hänellä on tiedossa ilmakehän muutoksien systematiikka ja hän osaa hyödyntää monimutkaista matematiikkaa sisältäviä malleja lämpötilojen ennustamiseen. Hän vastaa  ennusteeseensa perustuen +15 astetta ja osaa kertoa myös että 95% varmuudella lämpötila on välillä  +12 ja +18 astetta.

Katsotaan sitten todennäköisyysjakaumien avulla, miltä ilmiö nimeltä ”huomisen lämpötila” näyttää itse kunkin näkökulmasta. Näissä kuvioissa jakauman leveys kuvaa arvauksen liittyvää sattuman määrää ja toisaalta kuvion korkeus ennusteen hvyyyttä kyseisessä kohdassa.

Rplot_ennustajat

Maunon ennusteeseen liittyy pelkästää A-tyypin sattumaa, koska hänellä on käytössä kaikki tämän hetken tietotaito ja parhaat analyysimenetelmät. (Tilanne voi olla toinen esim. viiden vuoden päästä teknologian kehittyessä). Peralla ja Eetulla ennusteeseen liittyy A-luokan sattuman lisäksi B-luokan sattumaa. Osan Eetun B-luokan sattumasta Pera onnistui mallintamaan hyödyntämällä tietoa tämän päivän lämpötilasta. Peran B-luokan sattuman taas Mauno mallinsi pois hyödyntämällä tietoa ilmavirtojen liikehtimisestä. (Jäljelle jääneen sattuman määrä näkyy punaisen epävarmuusjakauman leveytenä.)

Seuraavana päivänä ennustuskisa ratkesi ja tulos oli 17 astetta. Lähimmäksi osui Mauno, mikä oli odotettavissakin. Tosin Perankin ennuste heitti vain 3 astetta. Mikäli muut eivät tietäisi Maunon metereologi-taustasta, saattaisi  hän helposti saada jälkipeleissä ”Hannu Hanhi” -lisänimen.

Statistickon steesit:

  1. Sattuma on tuntematonta informaatiota
  2. Sattuma voi olla osin subjektiivista
  3. A-luokan sattumaa ei voida poistaa millään tämän hetken tietotaidolla tai teknologialla. Teknologian ja tieteen kehitys voi kuitenkin ajan kanssa vähentää A-luokan sattumaa.
  4. B-luokan sattuma johtuu saatavilla olevasta informaatiosta, mitä ei olla hyödynnetty
  5. Tilastotieteen analyysimenelmät pyrkivät mallintamaan ilmiöiden B-luokan sattumaa ja löytämään todennäköisyysjakauman jäljelle jäävälle puhtaalle, ideaalitilanteessa A-luokan, sattumalle. Lopputuloksena saadaan yleensä ”mutu”-arvauksia huomattavasti parempia ennusteita ja arvioita niihin liittyvälle epävarmuudelle.
  6. Arkikielessä sattuman sijaan puhutaan hyvästä/huonosta tuurista
Facebooktwitterredditpinterestlinkedinmail