Rss

  • linkedin

Archives for : Bayes

Kelly-vetoja osakkeiden maailmassa

Pian päättyvä vuosi on ollut sekä tämän blogin että lähes kaiken muunkin vapaa-ajan aktiviteetin osalta aika hiljainen. Suurin yksittäinen selittäjä pandemian lisäksi tälle on se että tämä vuosi päättää seitsemän vuotta sitten alkaneen taloustieteen opiskeluun liittyvän opinto-oikeuden. Vuosi on sisältänyt paljon pitkiä iltoja gradun parissa. Nyt kyseinen apina on selästä pudotettu ja tässä kirjoituksessa kerron mitä iloa graduni voisi muillekin tuottavaa.

Gradun salainen taka-ajatus on ollut kehittää itselleni työkalua, jonka avulla voisin hahmotella sopivaa riskinoton määrää eri sijoituskohteille osakemarkkinoilla. Kun työn kokonaisuus alkoi hahmottumaan, huomasin että tämähän on aika hyvä lähestymistapa sijoittamiseen kelle tahansa satunnaisesti osakesijoittamista harrastavalle.

Romahduksia tulee, mutta ei hävitetä silloin kaikkia palikoita

Vanhana urheiluvedonlyöjänä Kellyn kriteeristä on muodostunut standardi riskinhallinan työkalu. Tässä kirjoituksessa aiemmin jo avasin Kellyn kriteerin saloja yksinkertaisessa vedonlyönnissä. Lyhyesti tavoitteena on maksimoida pitkällä ajanjaksolla varallisuuden kasvuvauhti ilman että missään välissä menee konkurssiin. Gradussa pyrin tarjoamaan yhden ratkaisun Kellyn kriteerin käytännön hyödyntämiseen osakemarkkinoilla, mikä aiheuttaa kipuilua koska osakkeiden tulevaisuuden tuottojen luotettava kuvaaminen matemaattisesti ei ole mikään helppo nakki. Opinnäytetyön pyrin kirjoittamaan tieteelliseen muottiin ja siihen voi tutustua täällä. Nyt blogikirjoituksessa kuitenkin otan vapauden puhua sijoittamisesta vapaasti omien näkemysten mukaan.

Satunnaiselle säästäjälle/sijoittajalle markkinan keskituoton tavoittelu laajasti hajauttavan indeksirahaston avulla on järkiratkaisu. Myös graduni sijoitusstrategiassa indeksi on pääsijoituskohde ja tärkein ratkaistava asia on päättää kuinka suuri osuus omaisuudesta on kiinni osakeindeksissä ja kuinka paljon “riskittömässä” korossa, eli nykyään käytännössä käteisessä.

Mitä tulee markkinoiden tehokkuuteen, itse näen asian subjektiivisena asiana. Kaikista näppärimmät ja nopeimmat hyvin informoidut kaverit pystyvät tekemään systemaattista ylituottoa ja elättämään itsensä käymällä pörssikauppaa. Mutta juuri näiden kavereiden kaupankäynti ajaa hintoja sellaiselle tasolle, että keskivertosijoittajalle markkinat näyttäytyvät varsin tehokkaina. Vaikka tavalliselle päivätyössä käyvälle sijoittajalle suurimmassa osassa yrityksistä on liian vaikea hankkia informaatioetua markkinoihin, minussa asuu kuitenkin ripaus Peter Lynchmäistä optimistisuutta. Mikäli herran kirjallisuus ei ole tuttua, voit aloittaa tutustumisen vaikka tästä Inderesin podista.

Lynchin ydinajatus on että kuka tahansa voi saavuttaa informaatioetua osakesijoittamissa sellaisten yritysten tai toimialojen kohdalla, joiden parissa viettää joka tapauksessa paljon aikaa esimerkisi työn tai harrastuksen takia. Esim. jos työskentelet auton osia valmistavassa firmassa ja toimitat tavaraa usealle kilpailevalle auton valmistajalle, voit olla hajulla siitä millä valmistajalla tänä vuonna myynti kiihyttää eniten ennen kun virallisten raporttien tieto menee ammattianalyytikoille. Tai vaikka intohimoisena peliharrastajana voit olla ensimmäisten joukossa hajulla, minkä firman uudesta pelistä tulee seuraava jättihitti. Kyse on yksinkertaisesti siitä, että pitää tietää jotain tärkeää, mitä suurin osa muista sijoittajista ja analyytikoista ei vielä tiedä.

Vaikkei työskentelisikään sellaisella alalla, missä voisi saada informaatioetua, suora sijoitus yksittäiseen osakkeeseen on perusteltua myös oppimisprosessin ja mielenkiinnon ylläpidon takia. Itselläni osakesijoittamisen aloittaminen vuonna 2009 sytytti aivan uudenlaisen uteliaisuuden kipinän ympärillä pyörivää yhteiskuntaa kohtaan. Uteliaisuus johti lopulta vuonna 2013 taloustieteen opiskelun aloittamiseen ja nyt lopultakin tämän gradun valmistumiseen. Joten olkaahan varovaisia siellä!

Sijoitusmaailmasa vain epävarmuus on varmaa, joten sijoitussalkun runko on hyvä perustaa hajautettuun indeksiin vaikka yksittäisessä firmassa olisikin erittäin hyvin hajulla. Gradussa kehittämässäni algoritmissa riskittömän koron ja osakeindeksin lisäksi on mahdollista sijoittaa myös yhteen yksittäiseen osakkeeseen. Rajaus yhteen johtui puhtaan teknisistä syistä: useamman osakkeen käsittely yhtäaikaa vaatisi myös näiden välisen riippuvuuden mallintamisen (mikä ei selity yleisellä markkinakehityksellä) ja olisi lisännyt työmäärää, mitä riitti näinkin ihan tarpeeksi. Käytännössäkin keskivertosijoittajalla ei voi olettaa olevan kovin montaa oikeasti hyvää sijoitusideaa kerrallaan, joten sen puolesta ehkä on vain hyvä ettei laita paljoa paukkuja kuin parhaaseen ideaansa.

Vaikka tavoiteltavan sijoitustyökalun ideana on käyttäjän itse antaa yksittäiseen osakkeeseen liittyvää omaa “erikoistietämystä”, gradussa yksittäisen osakkeen näkemys pohjautuu analyytikoiden tavoitehintoihin. Tällä hetkellä työkalusta on julkaistu demoversio, mikä noudattaa täysin gradun kaavoja ja antaa tehdä sijoituspäätöksen 31.12.2019 olleilla tiedoilla 20 vuoden historiaan ja sen hetken analyytikoiden tavoitehintoihin pohjautuen. Sijoituskatalogissa valikoimassa on käteinen, Helsingin pörssin osakeindeksi ja valtionyhtiöitä (väh. 10% omistus), joilta on historiadataa 20 vuoden ajalta. Työkaluun voi tutustua täällä.

Ennen kuin teet sijoituspäätöksiä työkalun perusteella on hyvä tiedostaa, että älä tee. Ainakaan pelkästään sen avulla. Käytän hintojen mallintamisessa t-jakaumaa, mikä on paksuhäntäisenä normaalijakaumaa huomattavasti parempi vaihtoehto. Mutta mikäli on Talebinsa lukenut, tietää ettei osakkeiden tuottojakaumien häntien kanssa ihan näin helpolla selviä ja sellaisia ikäviä yllätyksiä on odotettavissa, mihin pelkästään historiadatan avulla ei pystytä varautumaan. Mikäli tämä tai muut mallin yksityiskohdat kiinnostavat, niistä voi lukea lisää gradusta. Tässä kohtaa on oleellista tietää, että työkalu sopii lähinnä omaan riskinsietokykyyn sopivan osakeriskin ylärajan hahmottelemiseen. Käytännössä mustien joutsenien takia riskit kannattaa pitää työkalun suositusta alemmalla tasolla. Kehitystyö varmasti jatkuu, näillä näkymin myös tieteellisen julkaisun muodossa, ja kehitysideoita otan ilomielin vastaan.

Bayes-Kelly osakeportfolion optimointistrategia pähkinänkuoressa:

1. Valitse yksi osake riskivapaan koron ja indeksisijoituksen lisäksi (tai tyydy pelkkään indeksiin)

2. Valitse itsellesi sopiva turvarajoite = “hyväksyttävä vuosittainen tappio prosentteina sijoitusvarallisuudesta”

3. Optimoidaan eri kohteisiin sijoitettavat osuudet varallisuudesta niin että pitkän tähtäimen (tästä hetkestä ikuisuuteen) odotettu varallisuuden kasvuvauhti maksimoituu ja todennäköisyys kohdata yksittäisenä vuonna suurempi tappio kuin turvarajoite on alle 5%.

Tästä pääsee leikkimään työkalun mvp demolla ja tästä lukemaan gradua.

Facebooktwitterredditpinterestlinkedinmail

Sotilaalliset luottamusvälit

Luottamusväli taitaa olla heti keskihajonnan jälkeen yleisimmin käytetty epävarmuutta kuvaava tilastollinen mittari. Siihen liittyy kuitenkin hyvin paljon hämmennystä. Olen monta kertaa päässyt apukirjoittajan tai tilastokonsultin roolissa seuraamaan vierestä tutkijan ja tiedelehden arvioitsijan välistä keskustelua, missä toinen puhuu aidasta ja toinen aidan seipäästä kun kyse on luottamusväleistä. Niinpä arvelen että blogosfäärissä olisi tilaa pienelle tietoiskulle aiheesta.

Varusmiesten paino

Lehdissä näkyy aina välillä huolestuneita kirjoituksia (esim. Yle) koskien muutoksia varusmiesten keskipainossa. Tämä sopii havainnollistavaksi esimerkiksi meidän kuvitteelliseen tutkimukseen.

Sovitaan, että olemme laskeneet keskiarvoksi (kilogrammoina) 77.5 ja keskihajonnaksi 8. Katsotaan millaiseksi luottamusväli muodostuu riippuen siitä, kuinka monta varusmiestä on aineistossa tutkittu. Kaikenkaikkiaan varusmiehiä on 25000 ja heihin tutkimustulokset halutaan yleistää. Tätä koko joukkoa kutsutaan perusjoukoksi. Kaikissa esimerkeissä käytetään 95% luottamusväliä.

  1. Otoskoko 100

Voimme laskea luottamusvälin mekaanisesti tilastotieteen oppikirjan kaavalla:

($ \overline{x}-t_{0.025}\cdot s/\sqrt n$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n$) \approx  (75.9 ; 79.1)

  1. Otoskoko 25000, kaikki sen vuoden varusmiehet

Nyt kun kaikki varusmiehet on tutkittu, pitääkin hetki pysähtyä. Mitä luottamusvälillä oikein haetaankaan? Sen avullahan tavoitellaan ymmärrystä laskelmiin liittyvästä epävarmuudesta. Yleensä nimenomaan otannasta johtuvaa epävarmuutta. Nyt kun kaikki varusmiehet on tukittu, ei ole mitään otannasta johtuvaa epävarmuutta, joten siinä mielessä koko luottamusvälin laskemisessa ei ole tolkkua. Toki meillä vielä voi olla muitakin mielenkiintoisia epävarmuuden lähteitä kuten esim. mittausvirhe, mutta se on eri tarina ja vaatii oman tutkimuksensa mittalaitteen tarkkuudesta.

  1. Otoskoko 15000

Jos kaksi edellistä kohtaa oli tuttua tavaraa niin tässä kohtaa saattaa tulla jotain yllättävää. Se mitä useimmista tilastotieteen perusteiden oppikirjoista unohtuu mainita, on se että kohdassa 1. käytettyyn kaavaan liittyy oletus: ”Tutkittava perusjoukko on kooltaan ääretön”. Nyt meidän perusjoukon koko N = 25000. Usein käytetty nyrkkisääntö kuuluu, että mikäli otoskoko on korkeintaan 5% perusjoukon koosta, kohdassa 1. käytettyä kaavaa voidaan käyttää. Otoskoko 15000 on nyt kuitenkin 60% perusjoukosta, joten peruskaava antaa virheellisiä tuloksia. Kaava, jolla luottamusväli lasketaan on nyt (laskukaavasta lisää täällä):

($ \overline{x}-t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$ ; $\overline{x}+t_{0.025}\cdot s/\sqrt n \cdot \sqrt{\frac{N-n}{N-1}}$) \approx (77.4 ; 77.6)

Tässä tapauksessa ero luottamusvälin leveydessä on vain suuruusluokkaa 0.1 verrattuna kohdassa 1. käytettyyn kaavaan, joten suurta munausta ei olisi tullut vaikka oltaisiin menty peruskaavalla.

Lopuksi vielä graafi, josta näkee kuinka luottamusvälin leveys riippuu otoskoosta. Punainen käyrä kuvaa luottamusvälin leveyttä kohdan 1. Peruskaavalla ja musta käyrä kohdan 3. Tarkkaa kaavaa. Pystyviiva kertoo, missä kohti tulee täyteen nyrkkisääntömme ”5% perusjoukon koosta”. Perusjoukkoon kuuluu kaikki 25000 varusmiestä.

Nähdään, että nyrkkisääntö vaikuttaisi pitävän tässäkin hyvin kutinsa. Äärettöman perusjoukon olettava ”peruskaava” menee käsi kädessä tarkan välin pituuden kanssa, mutta alkaa sen jälkeen hiljalleen erkaantua. Huomataan myös, että tutkittavan joukon kasvattaminen 5000:sta ylöspäin ei enää kovin tehokkaasti kasvata tutkimuksen tarkkuutta luottamusvälin suhteen.

Kun paino jää sivuruuliin

Tahdon vielä nostaa esiin asian liittyen joidenkin tiedejulkaisujen intoon vaatia luottamusvälejä kehiin joka ikisen raportoidun luvun perään. Otetaanpa esimerkiksi tutkimuskysymys: ”Mikä on palvelusaikana syötyjen munkkien määrän vaikutus Cooperin testin tulokseen varusmiehillä?”. Lisäksi mitataan kontrollointitarkoituksessa pituus, paino ja monia terveysmuuttujia.

Näiden sivuroolissa olevin muuttujien keskiarvon ja keskihajonnan raportointi on asiallista toimintaa, jotta tutkimuksen lukija saa kuvan siitä minkä tyyppistä porukkaa taustatiedoiltaan on tällä kertaa otokseen sattunut. Ainoa ilmiö, mitä tutkimuksessa kuitenkin on tarkoitus yleistää, on munkkien ja juoksukunnon yhteys. Mikäli kaikille taustamuuttujillekin vaaditaan vielä lisäksi raportoitavaksi luottamusvälit, ainakin itselläni herää kysymys: Miksi?

Tämä varmaan lopulta on mielipidekysymys, mutta omasta mielestäni tutkimusartikkelit tuppaavat olemaan riittävän raskasta luettavaa ilmankin että tekstin sekaan tungetaan kaikkea mieleen juolahtavaa epäolennaista numeropuuroa.

Tulkinta

Viimeisimpinä, muttei helpoimpana asiana lienee syytä käydä vielä läpi vähän luottamusvälin tulkintaa. Silloin kun harrastin vielä tilastotieteen perusteiden luennointia, paniikkioireet kasvoivat aina kun läheni se hetki, että piti alkaa puhumaan luottamusväleistä. Tuntui mahdottomalta tehtävältä selittää luottamusvälit niin, että se olisi totta ja ettei opiskelijoiden+omat aivot menisi lopullisesti solmuun.

Luottamusvälin kaavat perustuvat frekventistiseen tieteenfilosofiaan. Tässä katsomuksessa mielenkiinnon kohteena oleva ”tutkimusparametri” (esim. Kaikkien varusmiesten keskipaino tai kaikkien varusmiesten keskuudessa vallitseva munkin syönnin sekä juoksukunnon välinen regressiokerroin) on kiinteä luku ja kaikki epävarmuus liittyy vain otanta-aineistoon liittyvään sattumaan. Niinpä puhuminen ”tutkimusparametrin” todennäköisyysjakaumasta on mieletöntä. 95% luottamusväli tulkitaankin otantajakauman avulla: ”Kun saman suuruista otantaa toistetaan ja toistetaan niin 95 prosentissa toistoista todellinen tutkimusparametri osuu luottamusvälille.”

Bayesläinen tieteenfilosofia

Tutkijalle kinkkistä tässä on, että hänen näkökulmastaan nimenomaan tutkimusparametriin liittyy mielenkiintoisin epävarmuus. Eihän koko tutkimusta tarvittaisi, mikäli tutkimuksen kohde olisi jo täsmällisesti tiedossa. Olisi siten luontevampaa kysyä tutkimusparametrin todennäköisyyksiin pohjautuvia kysymyksiä, esim. ”Mikä on otanta-aineistomme perusteella todennäköisyys, että kaikkien varusmiesten keskipaino on suurempi kuin 75 kg?” Vastaus tähän löytyy Bayesläisen tieteenfilosofian avulla. Siihen liittyvät menetelmät ovat välillä laskennallisesti raskaampia, mutta nykyisellä tietokoneiden laskentatehoilla se ei enää ole niin suuri ongelma. Jännityksellä odottelen, milloin Bayesläisyys alkaa lyömään kunnolla läpi akateemisessa maailmassa ja tiedejulkaisut alkavat pärjätä ilman hallitsematonta luottamusvälien ja p-arvojen sarjatulta.

Lisää frekventistisistä luottamusväleistä ja Bayesläisistä todennäköisyysväleistä simulointikokeilla havainnollistettuna voi lukea esimerkiksi täältä.

Statistickon steesit:

  • Kun raportoit (tai vaadit raportoimaan) luottamusvälin, mieti mistä epävarmuudesta olet oikeasti kiinnostunut
  • Kun tutkimuksen otoksena on suuri osuus perusjoukosta, luottamusvälin peruskaava antavat liian leveitä välejä
  • Yleensä luottamusväli määritellään mittatikkuna, jonne tutkimusparametri osuu halutulla varmuudella kun otetaan toistuvasti erilaisia satunnaisotoksia
  • Kun halutaan tehdä todennäköisyyspäätelmiä itse tutkimusparametrista, pitää käyttää Bayesläisiä analyysimenetelmiä
  • Liiallisen epäolennaisen numeerisen informaation viljely raporteissa ja artikkeleissa hankaloittaa lukijan ymmärrystä itse pääviestistiä

Facebooktwitterredditpinterestlinkedinmail