{"id":984,"date":"2017-10-31T21:44:53","date_gmt":"2017-10-31T19:44:53","guid":{"rendered":"http:\/\/statistition.com\/?p=984"},"modified":"2017-10-31T21:44:53","modified_gmt":"2017-10-31T19:44:53","slug":"datan-maara-ei-korvaa-ymmarrysta","status":"publish","type":"post","link":"https:\/\/statistition.com\/?p=984","title":{"rendered":"Datan m\u00e4\u00e4r\u00e4 ei korvaa ymm\u00e4rryst\u00e4"},"content":{"rendered":"<p><a href=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-medium wp-image-992\" src=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math-300x169.jpg\" alt=\"\" width=\"300\" height=\"169\" srcset=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math-300x169.jpg 300w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math-768x432.jpg 768w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math-1024x575.jpg 1024w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/math.jpg 1920w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a>Kun valtamedioista lukee jotain big dataan tai teko\u00e4lyyn liittyv\u00e4\u00e4, mielikuvaksi datan ennakoivasta analyysist\u00e4 voi usein j\u00e4\u00e4d\u00e4 jotain seuraavaa: \u201dpit\u00e4\u00e4 vaan olla massiivinen l\u00e4j\u00e4 dataa niin neuroverkot ja muut koneoppimisalgoritmit kyll\u00e4 taikovat automaagisesti suurta viisautta\u201d. T\u00e4h\u00e4n v\u00e4liin ajattelin tuoda nyt esiin v\u00e4h\u00e4n toista puolta sopan aineksista. Jossain kohtaa nimitt\u00e4in edelleen tarvitaan tutkittavan ilmi\u00f6n ymm\u00e4rt\u00e4mist\u00e4 dataa pursuavista tietokannoista ja fiksuista koneoppimisalgoritmeista huolimatta.<\/p>\n<h2>Kurssisuoritusten ennustaminen<\/h2>\n<p>Viestin havainnollistamista auttakoon meit\u00e4 kuvitteellinen tarina kahdesta Data Scientistist\u00e4, Laiska-Latesta ja Nysv\u00e4-Niilosta. Molemmille on annettu teht\u00e4v\u00e4ksi kehitt\u00e4\u00e4 algoritmi, joka ennustaa etuk\u00e4teen ketk\u00e4 p\u00e4\u00e4sev\u00e4t l\u00e4pi er\u00e4\u00e4n opiston valinnaisen kurssin kokeesta. Koe on vaikea ja se on pisteytetty niin, ett\u00e4 vain puolet yritt\u00e4jist\u00e4 p\u00e4\u00e4sev\u00e4t l\u00e4pi. Opisto kouluttaa naisvaltaiselle alalle ja opiskelijoiden sukupuolijakauma on vuodesta toiseen suurin piirtein 80% naisia ja 20% miehi\u00e4.<\/p>\n<p>Laiska-Late l\u00f6yt\u00e4\u00e4 opiston nettisivuilta kurssilaisista valmista dataa menneilt\u00e4 vuosilta seuraavista tiedoista:<\/p>\n<ul>\n<li>kokeen l\u00e4p\u00e4iseminen<\/li>\n<li>kurssin aikana ker\u00e4tyt harjoituspisteet<\/li>\n<li>sairauspoissaolot oppitunneilta<\/li>\n<\/ul>\n<p>Tietosuojasyist\u00e4 oppilaiden nimi\u00e4 tai muita taustatietoja ei ole kuitenkaan tallennettu. Kaikki henkil\u00f6tiedot on vain korvattu ID-numerolla. Havaintoja on kuitenkin iso \u00a0m\u00e4\u00e4r\u00e4 t\u00e4h\u00e4n tarkoitukseen.<\/p>\n<p>Erilaisten mallien kokeilun ja validointien j\u00e4lkeen Latelle j\u00e4\u00e4 viel\u00e4 5000 havaintoa lopulliseen parametrien optimointiin. H\u00e4n p\u00e4\u00e4tyy logistiseen regressiomalliin, jossa kokeen l\u00e4p\u00e4isy\u00e4 (kyll\u00e4\/ei) ennustaa kurssin aikana ker\u00e4tyt harjoituspisteet. Sairauspoissaolo-tiedosta ei ollut hy\u00f6ty\u00e4 ennustamisessa.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-medium wp-image-985\" src=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_kaikki-300x224.png\" alt=\"\" width=\"300\" height=\"224\" srcset=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_kaikki-300x224.png 300w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_kaikki.png 449w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/p>\n<p>Harjoituspisteiden ja kokeen l\u00e4p\u00e4isemisen riippuvuussuhdetta kuvaa oheinen viiksilaatikko &#8211; kuvaaja, mist\u00e4 n\u00e4kyy ett\u00e4 kokeen l\u00e4p\u00e4isseill\u00e4 on keskim\u00e4\u00e4rin V\u00c4HEMM\u00c4N ker\u00e4ttyj\u00e4 harjoituspisteit\u00e4.\u00a0Late ei t\u00e4h\u00e4n takerru, koska data puhuu \u00a0t\u00e4m\u00e4n puolesta ja ero on selv\u00e4sti tilastollisesti merkitsev\u00e4\u00e4. T\u00e4h\u00e4n riippuvuussuhteeseen perustuu h\u00e4nen ennustusmallinsa ja siin\u00e4 on kaikki mit\u00e4 n\u00e4ill\u00e4 tiedoilla on teht\u00e4viss\u00e4.<\/p>\n<p>Nysv\u00e4-Niilo l\u00e4hestyy ongelmaa hieman eri polkua. H\u00e4n aloittaa tutkimalla tarkemmin, mit\u00e4 kurssi ja erityisesti loppukoe pit\u00e4\u00e4 sis\u00e4ll\u00e4\u00e4n ja jalkautuu opistolle jututtamaan opiskelijoita. T\u00e4ss\u00e4 alkukartoituksessa selvi\u00e4\u00e4 ensinn\u00e4kin, ett\u00e4 koe sis\u00e4lt\u00e4\u00e4 my\u00f6s fyysist\u00e4 nopeutta ja voimaa sis\u00e4lt\u00e4vi\u00e4 osuuksia. N\u00e4in ollen voisi veikata, ett\u00e4 opiston miesopiskelijoilla olisi etuly\u00f6ntiasema naisiin n\u00e4hden. Toinen keskusteluissa esiin tullut huomio on, ett\u00e4 naiset vaikuttavat miehi\u00e4 tunnollisemmilta tekem\u00e4\u00e4n harjoitusteht\u00e4vi\u00e4. Niilokin tiet\u00e4\u00e4 nettisivuilla tarjolla olevasta datasetist\u00e4, mutta koska n\u00e4kee sukupuolen niin t\u00e4rke\u00e4n\u00e4 tekij\u00e4n\u00e4 ilmi\u00f6n kokonaisuutta h\u00e4n p\u00e4\u00e4tt\u00e4\u00e4 alkaa nysv\u00e4\u00e4m\u00e4\u00e4n ja ker\u00e4\u00e4m\u00e4\u00e4n seurantatutkimuksella dataa opiskelijoiden harjoituspisteit\u00e4, koemenestyksest\u00e4 ja sukupuolesta. Rajallisten resurssien ja aikataulun vuoksi h\u00e4n saa kasaan vain 200 havaintoa. N\u00e4m\u00e4 havainnot kuitenkin tukevat Niilon alustavaa hypoteesia siit\u00e4, ett\u00e4 sukupuoli selitt\u00e4\u00e4 sek\u00e4 koetulosta, ett\u00e4 harjoituspistem\u00e4\u00e4ri\u00e4. <a href=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_kaavio.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-medium wp-image-986\" src=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_kaavio-300x184.png\" alt=\"\" width=\"300\" height=\"184\" srcset=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_kaavio-300x184.png 300w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_kaavio.png 547w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a>Oheinen graafi kuvaa Nysv\u00e4-Niilon n\u00e4kemyst\u00e4 oleellisista ilmi\u00f6\u00f6n liittyvist\u00e4 oleellisista riippuvuussuhteista.<\/p>\n<p>Niilo k\u00e4ytt\u00e4\u00e4 my\u00f6s ennustealgoritminaan logistista regressiota, mutta Laten malliin lis\u00e4yksen\u00e4 on sukupuoli toisena selitt\u00e4j\u00e4n\u00e4 ja dataa vain 200 havaintoa.<\/p>\n<p>Niilon datalla piirret\u00e4\u00e4n harjoituspisteiden ja l\u00e4p\u00e4isyjen yhteytt\u00e4 kuvaava graafi, mutta sukupuolittain eriteltyin\u00e4 niin huomataan, ett\u00e4 sukupuoliryhmiss\u00e4 kokeessa hyv\u00e4ksytyt ovat tehneet keskim\u00e4\u00e4rin hieman ENEMM\u00c4N harjoituksia. <a href=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_sp.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright size-medium wp-image-987\" src=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_sp-300x224.png\" alt=\"\" width=\"300\" height=\"224\" srcset=\"https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_sp-300x224.png 300w, https:\/\/statistition.com\/wp-content\/uploads\/2017\/10\/Ymmarrys_boxplot_sp.png 449w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a>T\u00e4m\u00e4h\u00e4n vaikuttaa ristiriitaiselta Laiska-Laten tulokseen verrattuna. Onko se vain sattumaa, koska Nysv\u00e4-Niilon aineisto on niin pieni? Sekin voisi olla mahdollista, mutta t\u00e4ss\u00e4 tapauksessa ei (tied\u00e4n, koska olen itse simuloinut aineiston). Harjoituspisteet ennustavat kyll\u00e4 parempaa menestyst\u00e4 kokeessa, mutta koska fyysisten elementtien takia kokeessa alakynness\u00e4 olevat naiset ovat paljon tunnollisempia harjoitusten tekij\u00f6it\u00e4, n\u00e4ytt\u00e4ytyy riippuvuussuhde p\u00e4invastaisena silloin kun sukupuolta ei huomioida. T\u00e4llaista kolmen muuttujan riippuvuussuhdetta kutsutaan Simpsonin paradoksiksi (<a href=\"https:\/\/fi.wikipedia.org\/wiki\/Simpsonin_paradoksi\" target=\"_blank\" rel=\"noopener\">linkki Wikipedian artikkeliin<\/a>).<\/p>\n<p>Kuinkas sitten k\u00e4yk\u00e4\u00e4n Laten ja Niilon ennusteille tositoimissa? Meneek\u00f6 Laten ennusteet t\u00e4ysin p\u00e4in m\u00e4nty\u00e4? Ei v\u00e4ltt\u00e4m\u00e4tt\u00e4. Vanha viisaus (en muista kenen) sanoo, ett\u00e4 \u201dVaikkei joku korrelaatio johtuisi kausaliteetista, voi siit\u00e4 silti olla hy\u00f6ty\u00e4 ennustamisessa\u201d. Seuraavana vuonna kurssille osallistuu 500 henkil\u00f6\u00e4 ja n\u00e4ille ennustetarkkuudet ovat seuraavat:<\/p>\n<p>Laiska &#8211; Late: 65%<\/p>\n<p>Nysv\u00e4\u00e4j\u00e4 &#8211; Niilo: 68%<\/p>\n<p>Unelmatilanteessa meill\u00e4 olisi paljon sek\u00e4 ymm\u00e4rryst\u00e4 ett\u00e4 dataa. Nyt molemmilla on vain toinen puoli kunnossa. Sen mink\u00e4 Niilon ennusteet voittavat hy\u00f6dyllisen sukupuoli-muuttujan on mittaamisella, h\u00e4n h\u00e4vi\u00e4\u00e4 siin\u00e4, ett\u00e4 vain 200 hengen otoksella h\u00e4nen mallinsa parametreissa on ep\u00e4tarkkuutta. Molemmat kuitenkin p\u00e4rj\u00e4\u00e4v\u00e4t selv\u00e4sti kolikonheittoa paremmin, joten jotain lis\u00e4arvoa he ovat tuoneet.<\/p>\n<p>Iso uutinen tulee kuitenkin vasta seuraavana vuonna. Voimaan tulee uusi asetus, jonka johdosta tasa-arvon nimiss\u00e4 opiston on otettava sis\u00e4\u00e4n yht\u00e4 paljon miehi\u00e4 ja naisia. T\u00e4m\u00e4n uudistuksen j\u00e4lkeisell\u00e4 500 kurssilaisen ennusteilla ennustealgoritmien erot repe\u00e4v\u00e4t.<\/p>\n<p>Laiska &#8211; Late: 58%<\/p>\n<p>Nysv\u00e4\u00e4j\u00e4 &#8211; Niilo: 67%<\/p>\n<p>Algoritmeissa oli piilotettuna oletus \u201dkaikki muut ilmi\u00f6\u00f6n vaikuttavat asiat pysyv\u00e4t samankaltaisena\u201d. Nyt sukupuolijakauman muutos rikkoo t\u00e4m\u00e4n oletuksen Laten algoritmin kohdalla ja t\u00e4lt\u00e4 algoritmilta l\u00e4hti matto alta. Se voittaa lantinheiton en\u00e4\u00e4 vaivoin. Niilon syy-seuraus -suhteita paremmin ymm\u00e4rt\u00e4v\u00e4ss\u00e4 mallissa sukupuoli oli huomioitu, joten se ei uudesta asetuksesta juuri hetkahda.<\/p>\n<h2>Mit\u00e4 pit\u00e4\u00e4 v\u00e4hint\u00e4\u00e4n tiet\u00e4\u00e4?<\/h2>\n<p>Edell\u00e4 kerrottu esimerkki oli tarkoitushakuinen ja \u00e4\u00e4rimm\u00e4istapaus. Toivottavasti se kuitenkin havainnollisti vaaranpaikkoja silloin kun emme ymm\u00e4rr\u00e4 havaintojen muodostumisen taustaprosessia. Sen lis\u00e4ksi, ett\u00e4 algoritmin kehitt\u00e4j\u00e4 hehkuttaa ennusteiden tarkkuutta k\u00e4yt\u00f6ss\u00e4 olevalla datalla, h\u00e4nen pit\u00e4isi pysty\u00e4 vastaamaan my\u00f6s ainakin seuraaviin kysymyksiin:<\/p>\n<ul>\n<li>Miss\u00e4 olosuhteissa algoritmia on turvallista soveltaa ja miss\u00e4 ei?<\/li>\n<li>Osaako algoritmi opettaa itse\u00e4\u00e4n ja milloin algoritmi pit\u00e4\u00e4 kouluttaa t\u00e4ysin uusiksi?<\/li>\n<\/ul>\n<h2>Hy\u00f6dyllisi\u00e4 ty\u00f6kaluja<\/h2>\n<p>Tarkoitukseni ei ole kuitenkaan yleisesti mollata suurten datamassoja ja niiden p\u00e4\u00e4lle rakennettujen koneoppimisalgoritmien hy\u00f6tyj\u00e4. N\u00e4m\u00e4 nimitt\u00e4in mahdollistavat todella siistej\u00e4 ty\u00f6kaluja kuten vaikka el\u00e4inlajin tunnistamista kuvasta tai kielen koneellista ymm\u00e4rryst\u00e4. Molemmat ilmi\u00f6t sopivat hyvin \u201dblack-box\u201d algoritmien (soveltaja ei ymm\u00e4rr\u00e4 tarkalleen mihin algoritmi ennusteensa perustaa) maailmaan, koska ne ovat hyvin stabiileja. Vaikka kieli pikkuhiljaa kehittyy ja joidenkin sanojen merkitys vuosikymmenten saatossa muuttuu, on vaikea kuvitella miksei t\u00e4n\u00e4\u00e4n koulutettu puheentunnistaja voisi toimia l\u00e4hes yht\u00e4 hyvin my\u00f6s vuoden p\u00e4\u00e4st\u00e4. Kissan ja koiran piirteiden muuttumista joutuu odottamaan viel\u00e4kin kauemmin.<\/p>\n<h2>Weapons of math destruction<\/h2>\n<p>Suurimmat vaarat pelkk\u00e4\u00e4n isoon datamassaan ja sen korrelaatioihin luottavaan \u201dblack-box\u201d-algoritmiin tulevat esille, kun se koskee ihmisen luokittelua tai arvottamista. Silloin meill\u00e4 on k\u00e4sill\u00e4 kohonnut riski, ett\u00e4 olemme luomassa algoritmia, jota matemaatikko Cathy O\u2019Neil kutsuu termill\u00e4 \u201dWeapon of math destruction\u201d (<a href=\"https:\/\/www.ted.com\/talks\/cathy_o_neil_the_era_of_blind_faith_in_big_data_must_end\" target=\"_blank\" rel=\"noopener\">TED-talk aiheesta<\/a>). T\u00e4llaiset tuho-algoritmit ovat rasistisia tavalla, jota algoritmin k\u00e4ytt\u00e4j\u00e4t eiv\u00e4t ymm\u00e4rr\u00e4. Esimerkiksi USA:laisessa pankissa voitaisiin arvioida asiakasehdokkaiden luottokelpoisuutta automaattisesti heid\u00e4n lainahakemustensa perusteella. Algoritmi mm. hy\u00f6dynt\u00e4\u00e4 isossa datamassassa havaittua korrelaatiota hakemusten kirjoitusvirheiden m\u00e4\u00e4r\u00e4n ja maksuh\u00e4iri\u00f6merkint\u00f6jen v\u00e4lill\u00e4. Nyt lainaa voisi olla hakemassa suomalainen insin\u00f6\u00f6ri, joka on 23-vuotiaana muuttanut USA:han suorittamaan jatko-opintoja. H\u00e4n on eritt\u00e4in tunnollisesti aina hoitanut velvoitteensa, mutta joutuu syrjityksi asuntolainamarkkinoilla vain koska h\u00e4n tekee maahanmuuttajataustaisena keskim\u00e4\u00e4r\u00e4ist\u00e4 amerikkalaista enemm\u00e4n kielioppivirheit\u00e4.<\/p>\n<p>Kielioppivirheet tuskin kuitenkaan ovat aito syy maksuh\u00e4iri\u00f6ille vaan n\u00e4iden takaa l\u00f6ytyy yhteisi\u00e4 taustatekij\u00f6it\u00e4. Kun kaikkia aitoja selitt\u00e4ji\u00e4 taustalla ei pystyt\u00e4 mittaamaan, auttavat n\u00e4enn\u00e4isetkin korrelaatiot parantamaan ennustetarkkuutta isossa joukossa. Harmi vaan niille jotka joutuvat aiheetta k\u00e4rsim\u00e4\u00e4n siit\u00e4, ett\u00e4 juuri t\u00e4h\u00e4n n\u00e4enn\u00e4iskorrelaatioon sattui algoritmi tarraamaan.<\/p>\n<h2>Loppusanat<\/h2>\n<p>Ennustusalgoritmien rakentamisessa toivottavaa olisi olla hyv\u00e4 tieteellinen ymm\u00e4rrys ilmi\u00f6st\u00e4 ja paljon tarkasti mitattua dataa kaikista oleellisista muuttujista. K\u00e4yt\u00e4nn\u00f6ss\u00e4 tutkittavat ilmi\u00f6t tuppaavat olemaan niin monimutkaisia, ettei kaikkien oleellisten muuttujien mittaaminen ole aina mahdollista. Suurikaan havaintojen m\u00e4\u00e4r\u00e4 ei pysty t\u00e4ysin korvaamaan puutteita muuttujissa, mutta ajassa stabiileihin ilmi\u00f6ihin voi silti rakentaa korrelaatioihin perustuvia hy\u00f6dyllisi\u00e4 algoritmeja. N\u00e4m\u00e4 algoritmit ovat kuitenkin vain ty\u00f6kaluja, joiden ohjaksissa olevien pit\u00e4\u00e4 ymm\u00e4rt\u00e4\u00e4 ty\u00f6kalunsa rajoitteet.<\/p>\n<p>Ymm\u00e4rrykseen pyrkiv\u00e4n analytiikan nostaminen jalustalle voi olla osaltani v\u00e4\u00e4ristynytt\u00e4 hehkutusta, koska oma osaamiseni ja mielenkiintoni on sinne p\u00e4in kallellaan. On siit\u00e4 kuitenkin puhuneet muutkin Data Scientistit, vaikkakin l\u00e4hinn\u00e4 marginaalisimmissa medioissa. <a href=\"https:\/\/www.linkedin.com\/pulse\/why-most-data-scientists-lose-jobs-near-future-manish-tripathi-1\" target=\"_blank\" rel=\"noopener\">T\u00e4ss\u00e4 blogikirjoituksessa<\/a> Manish Tripathi maalailee datan analysoimisen tulevaisuutta ja viesti tiivistettyn\u00e4 kuuluu: koneoppimisalgoritmin koulutus tulee automatisoitumaan ja pelk\u00e4st\u00e4\u00e4n sen parissa ty\u00f6skentelev\u00e4t Data Scientistit alkavat kohtapuoliin menett\u00e4m\u00e4\u00e4n ty\u00f6paikkojaan. Sen sijaan syy-seuraus-suhteita ymm\u00e4rt\u00e4vist\u00e4 Data Scientisteista tulee olemaan pulaa.<\/p>\n<p>Ja loppuksi viel\u00e4 lainaus Hilary Masonilta <a href=\"http:\/\/www.bosslevelpodcast.com\/hilary-mason-on-machine-learning\/\" target=\"_blank\" rel=\"noopener\">t\u00e4st\u00e4 podcastista<\/a>: &#8221;You cannot do AI without machine learning, you cannot do machine learning without data science and you cannot do data science without analytics&#8221;<\/p>\n<a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-facebook nolightbox\" data-provider=\"facebook\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Facebook\" href=\"https:\/\/www.facebook.com\/sharer.php?u=https%3A%2F%2Fstatistition.com&#038;t=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4&#038;s=100&#038;p&#091;url&#093;=https%3A%2F%2Fstatistition.com&#038;p&#091;images&#093;&#091;0&#093;=https%3A%2F%2Fstatistition.com%2Fwp-content%2Fuploads%2F2017%2F10%2Fmath.jpg&#038;p&#091;title&#093;=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"Facebook\" title=\"Share on Facebook\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/facebook.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-twitter nolightbox\" data-provider=\"twitter\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Twitter\" href=\"https:\/\/twitter.com\/intent\/tweet?url=https%3A%2F%2Fstatistition.com&#038;text=Hey%20check%20this%20out\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"twitter\" title=\"Share on Twitter\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/twitter.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-reddit nolightbox\" data-provider=\"reddit\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Reddit\" href=\"https:\/\/www.reddit.com\/submit?url=https%3A%2F%2Fstatistition.com&#038;title=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"reddit\" title=\"Share on Reddit\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/reddit.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-pinterest nolightbox\" data-provider=\"pinterest\" target=\"_blank\" rel=\"nofollow\" title=\"Pin it with Pinterest\" href=\"https:\/\/pinterest.com\/pin\/create\/button\/?url=https%3A%2F%2Fstatistition.com&#038;media=https%3A%2F%2Fstatistition.com%2Fwp-content%2Fuploads%2F2017%2F10%2Fmath.jpg&#038;description=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"pinterest\" title=\"Pin it with Pinterest\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/pinterest.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-linkedin nolightbox\" data-provider=\"linkedin\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Linkedin\" href=\"https:\/\/www.linkedin.com\/shareArticle?mini=true&#038;url=https%3A%2F%2Fstatistition.com&#038;title=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"linkedin\" title=\"Share on Linkedin\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/linkedin.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-mail nolightbox\" data-provider=\"mail\" rel=\"nofollow\" title=\"Share by email\" href=\"mailto:?subject=Datan%20m%C3%A4%C3%A4r%C3%A4%20ei%20korvaa%20ymm%C3%A4rryst%C3%A4&#038;body=Hey%20check%20this%20out:%20https%3A%2F%2Fstatistition.com\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"mail\" title=\"Share by email\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/statistition.com\/wp-content\/plugins\/social-media-feather\/synved-social\/image\/social\/regular\/96x96\/mail.png\" \/><\/a>","protected":false},"excerpt":{"rendered":"<p>Kun valtamedioista lukee jotain big dataan tai teko\u00e4lyyn liittyv\u00e4\u00e4, mielikuvaksi datan ennakoivasta analyysist\u00e4 voi usein j\u00e4\u00e4d\u00e4 jotain seuraavaa: \u201dpit\u00e4\u00e4 vaan olla massiivinen l\u00e4j\u00e4 dataa niin neuroverkot ja muut koneoppimisalgoritmit kyll\u00e4 taikovat automaagisesti suurta viisautta\u201d. T\u00e4h\u00e4n v\u00e4liin ajattelin tuoda nyt esiin v\u00e4h\u00e4n toista puolta sopan aineksista. Jossain kohtaa nimitt\u00e4in edelleen tarvitaan tutkittavan ilmi\u00f6n ymm\u00e4rt\u00e4mist\u00e4 dataa pursuavista [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":992,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[205,12],"tags":[],"class_list":["post-984","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-algoritmit","category-ennustaminen"],"_links":{"self":[{"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/posts\/984"}],"collection":[{"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/statistition.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=984"}],"version-history":[{"count":8,"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/posts\/984\/revisions"}],"predecessor-version":[{"id":996,"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/posts\/984\/revisions\/996"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/statistition.com\/index.php?rest_route=\/wp\/v2\/media\/992"}],"wp:attachment":[{"href":"https:\/\/statistition.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=984"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/statistition.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=984"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/statistition.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=984"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}