Rss

  • linkedin

Archives for : tuuri

Tutkimushypoteesit ja pokerimenestys

Virheelliset tutkimukset

Tutkimusaineistoista löytyy aina jotain merkillisyyksiä pelkästään sattumalta, kun datoja tarpeeksi paljon pyöritellään ja kaivellaan. Jos testaamme juuri niitä hypoteeseja, mitkä tulivat mieleen aineiston erikoisuuksia kaivelemalla, niin tottakai saamme tilastollisesti merkitseviä tuloksia. Tulokset eivät vaan ole päteviä, koska riippumattomuusoletukset eivät täyty. Tämä onkin ehkä yleisin tilastojen väärinkäyttötapa, jonka takia maailmassa on julkaistu hurja määrä tutkimustuloksia, mitä ei ole enää seuraavassa saman alan tutkimuksessa pystytty toistamaan (viite). Itse olin lähellä sortua vastaavaan tutkimuskentällä yleiseen virheeseen, kun olin turhautunut omasta heikosta menestyksestäni pokeripöydissä.

Tuuri pokerissa

Pokerimenestyksen tutkiminen

Pokeri on peli, joka on olemukseltaa jossain shakin (pelissä ei tuurielementtiä, parempi pelaaja voittaa) ja ruletin (puhdas tuuripeli) välimaastossa. Matemaattisilla ja psykologisilla taidoilla voi saada edun muita pelaajia vastaan, mutta sattumalla on suuri vaikutus siihen, kuinka yksittäisessä pelissä käy. Itse olen harrastanut pokeria pääasiassa ”texas hold’em sit and go”-turnauksina, joissa matemattiset taidot korostuvat. Nettipokerissa menestyminen oli pari vuotta sitten vielä merkittäväkin tulonlähde, mutta viime vuosi 2013 oli tappiollinen, eikä menneillä oleva alkuvuosikaan ole tuonut vielä suurta parannusta. Nyt mieltä vaivaava kysymys kuuluu: ”Onko lähimenneisyyden huono tulos selitettävissä sattumalla vai pelaavatko vastustajat nykyään paremmin (tai minä huonommin) kuin aikaisemmin?”.

Tilastot turnauksista

Oman nettipokerituurin (ja vastustajien pelityylien) selvittämiseksi olen onneksi vuosi sitten hankkinut apuohjelman, joka kerää aineistoa pelaamistani turnauksista jälkianalyysejä varten. Tilastot paljastavat, että tappiot selittyvät yhden pokerifirman, kutsutaan sitä vaikka nimellä ”Täystöötti”, peleillä. Tällä pokerisivustolla olen pelannut valtaosan peleistäni.

Graafissa punainen käyrä kertoo, mikä todennäköisyyksien mukaan tulokseni pitäisi olla, jos ”all-in” tilanteissa tuurini olisi ollut keskimääräinen. Vihreä käyrä kertoo, mikä todellinen tulokseni on ollut turnausmaksuina. Karkeasti voisi yksinkertaistaa seuraavasti: Mikäli punainen käyrä on nollan yläpuolella, on pelaaja ollut turnausmenestyksen kannalta hyvissä tilanteissa kun kaikki rahat menevät pottiin ja piilokortit käännetään esiin. Jos vihreä käyrä on punaisen käyrän yläpuolella, niin pakasta tulleet viimeiset ratkaisukortit ovat olleet keskimääräistä suotuisampia (ja vastaavasti heikompia, kun ollaan punaisen käyrän alapuolella).

meh_graafi_cannon_180714

Menestys ja ”pakkatuuri”-korjattu menestys Täystöötin peleissä.

hem_graafi_pspp_18072014

Menestys ja ”pakkatuuri”-korjattu menestys muissa kun Täystöötin peleissä.

Täystöötin peleissä vaikuttaisi olleen järkyttävän huonoa tuuria, koska toteutunut käyrä (vihreä) on n. 140 turnausmaksua ”pakkatuuri”-korjatun (punaisen) käyrän alapuolella. Muiden firmojen peleissä taas käyrät käyttäytyvät niinkuin pitkässä juoksussa pitäisikin, eli seurailevat toisiaan. Tässä vaiheessa useimmilla tappion lyömillä pelaajilla herää epäilyksiä, että  Täystöötti huijaa minun vastustajieni eduksi tai vähintäänkin heidän satunnaisgeneraattoriin on lipsahtanut koodausvirhe. Tämän jos voisi tilastollisesti todistaa, niin voisi alkaa vaatimaan heiltä korvauksia tai vähintään boikotoimaan sekä mollaamaan foorumeilla. Jos näillä aineistoilla lähtisin asiaa tilastollisesti testaamaan niin epäilemättä saisin erittäin merkitseviä tilastollisia todistuksia vinoutuneesta satunnaisgeneraattorista. Laajasta menetelmä-työkalupakistani huolimatta en näin kuitenkaan tee.

Tutkimushypoteesi

Meillä olisi nyt seuraava tutkimushypoteesi, mitä lähdettäisiin todistamaan vääräksi:

H0: ”Täystöötin pokeripelien satunnaisgeneraattori on rehellinen”

Testien lopputulokset ovat usein muotoa ”On alle 5% mahdollisuus, että aineistossa ilmenevä poikkeama hypoteesista johtuisi sattumasta. Näinollen hypoteesi ei pidä paikkaansa ja tulos on tilastollisesti merkitsevä”. Huono uutinen tutkimuksellemme on se, että keksimme hypoteesin aineistomme avulla. Tilastolliset testit taas vaativat, että käytössä on hypoteesista riippumaton satunnaisotos.

Tutkimuksen jatko

Parasta mitä tässä tilanteessa voimme tehdä, on alkaa keräämään uutta aineistoa, jolla voimme testata, pitääkö havaitsemamme poikkema todella paikkansa. Tutkimussuunnitelma on nyt seuraava: pelaan 3000 uutta turnausta. Näistä hyväksyn tutkimukseen joka kolmannen aloittaen kolmannesta. Tällä pyrin ehkäisemään peräkkäisten turnausten mahdollista korrelaatiota, mikä on seurausta samoista vastustajista tai edellisen turnauksen lopputuloksesta johtuvasta tunnetilasta. Tämän jälkeen meillä on käytössä myös hypoteesista riippumaton satunnaisotos validin tutkimuksen tekemiseksi.

Entäs silloin kun meillä on vain yksi aineisto, eikä sitä ole tulossa lisää lähitulevaisuudessa? Tutkimushypoteeseja ei ole voitu asettaa etukäteen tai niitä on paljon. Toteammeko, että aineisto on hyödytön ja heitämme kirveen kaivoon? Toki datan antama singnaali on aina jonkunlainen vihje todellisuuden tilasta. Meillä vaan tulee ongelmia todennäköisyyslaskelmissa kun halausimme arvioida kuinka suurella varmuudella voimme yleistää signaalin koskemaan todellisuutta aineiston ulkopuolella. Tapauksesta riippuen voimme joko tehdä korjauksia menetelmien todennäköisyyslaskelmiin tai erottaa ja säästää osa aineistosta tuloksien varmentamiseen. Näistä tekniikoista sekä Täystöötin satunnaisgeneraattorin testaamisen tuloksista lisää myöhemmissä blogipostauksissa.

Statistickon steesit:

  1. Tutkimushypoteesi pitää asettaa ennen tutkimusaineiston tarkastelua
  2. Dataa tutkiskelemalla löytynyt yllättävä seikka on enemmän hypoteesi uudelle tutkimukselle (uudella datalla) kuin yleistettävissä oleva tulos
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Tuurin alkulähteillä

Past Vs Future Dice Today Tomrrow Comparison Betting GambleKirjoitus on julkaistu myös Louhia-blogissa 9.5.2014.

Tilastotieteeseen perustuva analytiikka on jollain tapaa säännönmukaisuuksien ja sattuman erottelua toisistaan. Vastasyntyneen lapsen isää saattaa kiinnostaa, minkä tietojen avulla voidaan laskea lapselle odotettu pituus aikuisiässä (ohjatakseen ajoissa oikean urheilulajin pariin) ja millä todennäköisyydellä pituusennuste menee täysin pieleen. Pokerinpelaajaa saattaa kiinnostaa oliko turnauksen voitto pääosin vain tuurin ansiota vai oliko hän oikeasti muita parempi pelaaja.

Sattuman määrittelyä noppaleikein

Stokastiikka tarjoaa omat matemaattiset perusteet sattumalle, mutta mietitään mitä käytännössä sattuma tarkoittaa. Leikitään, että olemme heittämässä noppaa ja tavoitteenamme on saada heitettyä numero 6. Mietitään tavoitteen onnistumista heitettäessä neljältä eri korkeudelta.

Heitto Heittokorkeus Heittotyyli Todennäköisyys kuutoselle
1. 1 cm Täysin hallittu pudotus. Sattuma ei ehdi vaikuttamaan. 100%
2. 2 cm Halittu pudotus, jonka ilmavirta joskus kääntää väärään numeroon 75% (arvio)
3. 5 cm Suljetaan 2 numeroa pois heittämällä niin, että noppa pyörii vain yhteen suuntaan 25% (=1/4)
4. 100 cm Täysin sattumanvarainen 16.7% (=1/6)

Jossain välillä 5 cm – 100 cm olemme ylittäneet rajan, jonka jälkeen emme enää pysty heittotaidoilla vaikuttamaan kutosen ilmenemiseen. Ilmanvastuksen ja painovoiman vaikutus on sellainen, jota emme osaa hallita/laskelmoida, joten meidän näkökulmasta sattuma määrää täysin lopputuloksen. Todennäköisyysjakaumat määrittävät kuitenkin raamit, missä sattuma operoi. Tässä tapauksessa todennäköisyysjakauma sanoo, että kutonen tulee kerran kuudesta, eli todennäköisyys on 16.7%.

Näin saatiin hahmoteltua sattumalle (= tuurin/säkän vaikutus) käytännönläheinen määritelmä: Sattuma on informaatiota, jota ei tunneta. Kun noppa on pysähtynyt, tiedämme tuloksen eikä tulokseen ole enää sattumalla vaikutusta. Nopan ollessa ilmassa osa lopputuloksen informaatiosta on vielä tuntematonta. Sen määrä riippuu siitä, miltä korkeudelta kutosta yritetttiin tähdätä.

Sattuman tyypit

Tässä vaiheessa jakaisin sattuman vielä kahteen luokkaan.

B-luokan sattuma
Sattumaa, joka on jonkinlaisella tietotaidolla supistettaavissa. Esim. kohdan 2. nopanheitossa joku taitava heittämistä harjoitellut  taikuri saattaisi saavuttaa kutosen todennäköisyyden 98%, vaikka meillä  tavallisilla viskelijöillä se oli 75%.

A-luokan sattuma
Sattuma, josta ei millään päästä eroon vaikka käytettävissä olisi kaikki tämän hetken tietotaito ja teknologiat. Esim. noustaan Puijon torniin heittämään noppaa maahan, niin ei varmasti maailmasta löydy sellaista taikuria, joka pystyisi nostamaan kutosen todennäköisyyttä yli 16.7%:n. (Noppaan ei saa tehdä fyysisiä muutoksia.) Näin ollen kaikki heittoon liittyvä sattuma on A-luokan sattumaa.

Ennusteiden subjektiivisuusFrosch in Hand

Nyt olemme ehkä jo havainneetkin, että sattuma voi olla jossain määrin subjektiivinen (vaihtelee eri henkilöiden välillä) käsite. Havainnollistetaan sitä vielä seuraavalla esimerkillä:

Kolme henkilöä yrittää ennustaa (omilla tiedoilla, ilman netin tai TV:n apua), mikä on lämpötila Helsingissä seuraavana päivänä klo 12.

1. Eetu Extremeurheilija

Eetu on ollut onnettomuuden jäljiltä viimeiset puoli vuotta koomassa. Hän on juuri herännyt ikkunattomassa sairaalasssa. Eetulla onneksi aivot toimivat normaalisti, mutta hänellä ei ole minkäänlaista ajantajua edes vuodenajasta. Eetun tekee näillä tiedoilla parhaan mahdollisen arvauksen ja veikkaa edellisten vuosien arvioitua keskilämpötilaa +7 astetta. Eetu tosin tiedostaa, että arvauksessa on paljon epävarmuutta ja sattumalla on iso vaikutus siihen, kuinka lähelle ennuste osuu.

2. Pera Perustietäjä

Peralla ei ole käytössä analyysimenetelmiä, joista voisi olla hyötyä tarkkojen ennusteiden tekemiseen. Hän kuitenkin järkeilee, että peräkkäiset päivät ovat yleensä jossain määrin samankaltaisia. Omien tietojensa pohjalta hänen paras arvaus onkin tänään päivällä lämpömittarissa paistanut lukema +20.

3. Mauno Mallintaja

Mauno on maailman parhaimmistoon kuuluva metereologi. Hänellä on tiedossa ilmakehän muutoksien systematiikka ja hän osaa hyödyntää monimutkaista matematiikkaa sisältäviä malleja lämpötilojen ennustamiseen. Hän vastaa  ennusteeseensa perustuen +15 astetta ja osaa kertoa myös että 95% varmuudella lämpötila on välillä  +12 ja +18 astetta.

Katsotaan sitten todennäköisyysjakaumien avulla, miltä ilmiö nimeltä ”huomisen lämpötila” näyttää itse kunkin näkökulmasta. Näissä kuvioissa jakauman leveys kuvaa arvauksen liittyvää sattuman määrää ja toisaalta kuvion korkeus ennusteen hvyyyttä kyseisessä kohdassa.

Rplot_ennustajat

Maunon ennusteeseen liittyy pelkästää A-tyypin sattumaa, koska hänellä on käytössä kaikki tämän hetken tietotaito ja parhaat analyysimenetelmät. (Tilanne voi olla toinen esim. viiden vuoden päästä teknologian kehittyessä). Peralla ja Eetulla ennusteeseen liittyy A-luokan sattuman lisäksi B-luokan sattumaa. Osan Eetun B-luokan sattumasta Pera onnistui mallintamaan hyödyntämällä tietoa tämän päivän lämpötilasta. Peran B-luokan sattuman taas Mauno mallinsi pois hyödyntämällä tietoa ilmavirtojen liikehtimisestä. (Jäljelle jääneen sattuman määrä näkyy punaisen epävarmuusjakauman leveytenä.)

Seuraavana päivänä ennustuskisa ratkesi ja tulos oli 17 astetta. Lähimmäksi osui Mauno, mikä oli odotettavissakin. Tosin Perankin ennuste heitti vain 3 astetta. Mikäli muut eivät tietäisi Maunon metereologi-taustasta, saattaisi  hän helposti saada jälkipeleissä ”Hannu Hanhi” -lisänimen.

Statistickon steesit:

  1. Sattuma on tuntematonta informaatiota
  2. Sattuma voi olla osin subjektiivista
  3. A-luokan sattumaa ei voida poistaa millään tämän hetken tietotaidolla tai teknologialla. Teknologian ja tieteen kehitys voi kuitenkin ajan kanssa vähentää A-luokan sattumaa.
  4. B-luokan sattuma johtuu saatavilla olevasta informaatiosta, mitä ei olla hyödynnetty
  5. Tilastotieteen analyysimenelmät pyrkivät mallintamaan ilmiöiden B-luokan sattumaa ja löytämään todennäköisyysjakauman jäljelle jäävälle puhtaalle, ideaalitilanteessa A-luokan, sattumalle. Lopputuloksena saadaan yleensä ”mutu”-arvauksia huomattavasti parempia ennusteita ja arvioita niihin liittyvälle epävarmuudelle.
  6. Arkikielessä sattuman sijaan puhutaan hyvästä/huonosta tuurista
Facebooktwittergoogle_plusredditpinterestlinkedinmail