Site icon

Onnittelut tilastotieteen opiskelijoille

Kävin lauan­taina pitämässä juh­la­puheen Turun yoliopis­ton tilas­toti­eteen opiske­li­joiden aina­jär­jestön, Sta­tis­tikan 35-vuo­tisjuh­las­sa. Tässä ulko­muis­tista kir­joitet­tu puheen­vuoroni suun­nilleen sel­l­aise­na kuin sen pidin.

Aluk­si halu­an onnitel­la teitä hyvästä ainevalin­nas­ta. Voin koke­muk­ses­ta sanoa, että tilas­toti­eteil­i­jän elämä on mie­lenki­in­toista. Tilas­totiede aut­taa ymmärtämään ja jäsen­tämään maail­maa ja sen ilmiöitä ehkä parem­min kuin mikään muu.

Tapasin joskus koul­u­laise­na kielikurssil­la Hei­del­ber­gis­sä bel­gialaisen kaverin, Philippe van Parijs’n, jon­ka kanssa meil­lä synkkasi todel­la hyvin. Jatkoimme jonkin aikaa kir­jeen­vai­h­toa, mut­ta aikaa myöten yhteys katke­si. Tapasin hänet odot­ta­mat­ta parikym­men­tä vuot­ta myöhem­min eräässä sem­i­naaris­sa Tukhol­mas­sa. Me olimme tehneet elämässämme melkein samo­ja asioi­ta. Olimme esimerkik­si molem­mat kehit­täneet perus­tu­lo­ma­llin ja vieläpä saman­laiset mallin ja perustel­let sitä samal­la, aika poikkeuk­sel­lisel­la tavalla.

Hän oli aloit­tanut opin­not käytän­nöl­lisessä filosofi­as­sa ja jatkanut tilas­toti­eteeseen. ”Tilas­toti­eteessä filosofinen ajat­telu huipen­tuu”, hän sanoi. Vähän pidin tätä ensin yllät­tävänä, mut­ta todel­la. Mitä filosofia sanoo todel­lisu­u­den hah­mot­tamis­es­ta, sen tilas­totiede sanoo täsmällisemmin.

Kun filosofi tyy­tyy sanomaan, että vaik­ka kaik­ki paloau­tot ovat punaisia, ei tästä voi päätel­lä, että kaik­ki punaiset autot ovat paloau­to­ja, tilas­totiede opet­taa laske­maan, mil­lä toden­näköisyy­del­lä vas­taan tule­va punainen auto on paloauto.

Alus­sa oli mil­limetri­pa­peri ja pöytälaskin

Kun aloitin tilas­toti­eteen, ei ollut tietokonei­ta vaan pöytälaskimia eikä ollut elek­tro­n­isia tietokan­to­ja. Tilas­tot naput­te­limme käsin paperi­sista taulukoista.

Min­ut kaa­p­at­ti­in ensim­mäisen opiskelu­vuo­den jäl­keen Postin liike­taloudel­liseen tutkimus­laitok­seen, jota johti pro­fes­sori Leo Törn­qvist. Tuos­sa laitok­ses­sa koulutet­ti­in melkein kaik­ki Suomen parhaat tilas­toti­eteil­i­jät. En tiedä, mitä posti siitä hyö­tyi, mut­ta tuo­hon aikaan tilin­tarkas­ta­jat oli­vat suuripi­irteisem­piä kuin nykyisin.

Juuri tuol­loin tuli­vat ensim­mäiset tietokoneet käyt­töön. Niis­sä ei ollut tilas­tol­lisia ohjelmia, vaan ne piti min­unkin ohjel­moi­da itse. Istahdin maanan­ta­iaa­mu­na tuo­lille, jos­ta per­jan­taina oli läht­enyt Urpo Lep­pä­nen ja perin häneltä tele­type ‑päät­teen, jota min­un piti opetel­la ohjel­moimaan ilman mitään koulutusta.

Hyvänä puole­na tässä oli, että var­masti tiesin mitä kone tekee, kun olin sen itse ohjel­moin­ut. En voi ymmärtää tutk­i­jaa, joka kysyt­täessä, miten tämä tulos on saatu, osaa ker­toa ohjel­man kau­pal­lisen nimen mut­ta ei sitä, mitä tuo ohjel­ma tarkkaan ottaen aineis­tolle tekee.

Törn­qvist opet­ti meille, että tilas­tolli­nen tutkimus on lähin­nä käsi­työtä, jos­sa abstrak­tit kaa­vat ovat vain apu­vä­line. Tärkeäm­pää kuin että regres­sioma­llin stokasti­nen jään­nöster­mi ter­mi on oikein määritel­ty, on että itse malli on järkevä ja kuvaa ilmiötä. Pahin­ta mitä saat­toi tehdä oli ”dimen­siovirhe” – jos esimerkik­si tulos muut­tuu, kun mit­tayk­sikkö muute­taan metreistä jaloik­si, on tehty dimensiovirhe.

Tutkimus aloitet­ti­in aina piirtämäl­lä aineis­tos­ta kuvia. Aluk­si mil­limetri­pa­per­ille, mut­ta myöhem­min toisen leg­en­daarisen pro­fes­sorin, Sep­po ”Ollin isä” Mus­tosen pien­ti­etokone Wang:ille kehit­tämäl­lä Survo-ohjelmistolla.

Tuo­hon aikaan alkoi­vat hienos­tuneem­mat matemaat­tiset mallit tunkea näyt­tämölle. Matemaat­tisem­pi tilas­toti­eteen suun­taus ihas­tui esimerkik­si Box-Jenk­ins ‑mallei­hin, jos­sa aikasar­jan jään­nöster­min oletet­ti­in kiin­teää autore­gress­si­ivistä mallia. Meistä se oli ihan roskaa. Jos­sain paperite­htaan pros­es­sis­sa voi ajatel­la, että viive­malli pysyy vakiona, mut­ta ei yhteiskun­nal­li­sis­sa aikasar­jois­sa yli vuosikym­menten. Me kut­suim­mekin sitä Black-Box Jenk­ins ‑mallik­si.

Ties­imme, mitä on tulos­sa. Lasken­taka­p­a­siteet­ti kehit­ty­isi huimasti ja tulisi val­ta­van paljon suurem­pia data-aineis­to­ja, kun tilas­to­ja alet­taisi­in tehdä sähköisesti.

Kuvit­te­limme, että yhteiskun­nalli­nen tieto muut­tuisi tarkasti ja ennus­teet parani­si­vat val­tavasti. Yrjö Ahmavaara puhui kyber­neti­ikas­ta, opista yhteiskun­nan opti­maalis­es­ta ohjaamis­es­ta, kun kaik­ki vaiku­tus­mekanis­mit tunnettaisiin.

Vapaudut­taisi­in esimerkik­si malleis­sa pien­im­män neliö­sum­man menetelmistä, jot­ka ovat kovin herkkiä poikkeav­ille havain­noille. Eihän kukaan kuvit­tele, että maail­ma nou­dat­taisi multi­nor­maal­i­jakau­maa. Se on vain helpom­pi laskea.

Mut­ta niitä pien­im­män neliö­sum­man malle­ja käytetään edelleen. Epä­lin­eaarisia malle­ja nyt sen­tään on tarjolla.

Räjähdys­mäis­es­ti kas­va­neeseen lasken­taka­p­a­siteet­ti­in ja val­tavi­in tietoaineis­toi­hin näh­den aika vähän on edis­tyt­ty ajoista, jol­loin me teimme omia yksinker­taisia, mut­ta varsin hyvin ennus­tavia mallejamme.

Dataa on, mut­ta sitä ei osa­ta analysoi­da. Tilas­toti­eteil­i­jöitä on aivan liian vähän. Kaiken maail­man toh­elot laske­vat ana­lyy­se­ja tietoko­neo­hjelmil­la, joiden toim­intaa he eivät ymmärrä.

Kuu­lun erääseen Helsin­gin yliopis­ton neu­vot­telukun­taan, johon kuu­luu myös Juhana Var­ti­ainen. Eräässä keskustelus­sa hän sanoi, että yliopis­ton pitäisi opet­taa kaikille tutk­i­jak­oulu­tuk­sen saav­ille tilas­totiedet­tä syvällisesti.

Min­un aikanani ei ollut käsitet­tä työtön tilas­toti­eteil­i­jä, eikä sel­l­aista kuulem­ma ole löy­tynyt täältä Turustakaan.

Todel­la merkit­täviä väärin­tulk­in­to­ja syn­tyy, kun kor­re­laa­tio samais­te­taan kausali­teet­ti­in. Tiedämme esimerkik­si, että työt­tömien ter­veys on heikom­paa kuin työssä ole­vien ter­veys ja että eri­tyisen huono ter­veys on pitkään työt­tömänä olleil­la. Tästä on päätel­ty, että työt­tömyys altistaa ihmisiä sairas­tu­maan ja sik­si työt­tömyysa­jan ter­vey­den­huoltoon tulee panostaa.

Tosi­asi­as­sa sairaus tekee työt­tömäk­si ja mitä huonom­pi on ter­veys työt­tömyy­den alka­es­sa, sitä pidem­pään työt­tömyys kestää. Työt­tömyy­den aikana ter­vey­den­ti­la ei heikkene – itseasi­as­sa vähän para­nee. Niin­pä ratkaisu ongel­maa on muual­la – työelämämme on liian nir­so työn­tek­i­jöi­den ter­vey­den suhteen.

Tääl­lä Turus­sa julk­istet­ti­in tieto, jon­ka mukaan lap­si kan­nat­taa pan­na mah­dol­lisim­man nuore­na päivähoitoon, kos­ka nuore­na päivähoitoon men­estyvät opin­nois­saan paremmin.

Luulen, että jokainen tilas­totiedet­tä osaa­va osasi epäil­lä tulosta ja väärä se olikin. Äidin koulu­tus­ta­so ennus­taa lapsen men­estys­tä ja hyvin koulute­tut naiset panevat lapsen­sa päivähoitoon ymmär­ret­tävistä syistä nopeam­min kuin vaikka­pa val­in­tamyymälän kas­sal­la työsken­televät. Kun äidin koulu­tus­ta­so vakioidaan, mitään seli­tys­tä ei jää päivähoidon aloi­tusiän ja opin­tomen­estyk­sen välille.

Ajat­telin lähet­tää täältä ter­veisiä Helsin­gin Sanomille. Melkein jokainen tämän kaltainen uuti­nen on lehdessä väärin tai ainakin hyvin puut­teel­lis­es­ti selitet­ty. Kan­nat­taisi palkata päivys­tävä tilas­toti­eteil­i­jä tarkas­ta­maan uutiset, jois­sa viitataan johonkin tilas­tol­liseen riip­pu­vu­u­teen. Sama henkilö voisi tark­istaa lehdessä julka­ista­vat graafit, jot­ka ovat melkein aina jotenkin väärin.

Sanoin, että tilas­toti­eteen opin­not aut­ta­vat tekemään elämästä mie­lenki­in­toista. En voi kuitenkaan mie­lenki­in­toista elämää kenellekään luva­ta. Itse se pitää tehdä, mut­ta tilas­totiede antaa siihen hyvät eväät.

Jär­jestäjät pyy­sivät, ettei puheeni olisi poli­it­tis­es­ti kovin kan­taa otta­va. Nyt tulee tuo pelät­ty yhteiskun­nalli­nen osuus.

Olemme siir­tyneet nopeasti totu­u­den jälkeiseen aikaan. Tiedät­te­hän: ”Tosi­asi­at, niil­lä nyt voi perustel­la mitä hyvänsä.”

Tilas­toti­eteil­i­jän pitäisi olla fak­to­jen puolel­la ja ker­toa kär­siväl­lis­es­ti myös siitä, mitä tiedämme kausali­teetista – ja mitä emme tiedä.

Kun olemme yliopis­tol­la, ole­tan, että kuuli­joina on paljon niitä, jot­ka ajat­tel­e­vat tästä maail­mas­ta saman­su­un­tais­es­ti kuin minä. Halu­an sanoa teille, että toive esit­tää fak­to­ja valikoiden omaa maail­manku­vaa pönkit­tävästi ei koske vain ”niitä toisia”, vaan se kos­kee aika ajoin myös meitä.

Tei­dänkin ”hei­monne” odot­taa teiltä puheen­vuoro­ja ja sel­l­aista näyt­töä, joka tukee hei­mon omaa arvo­maail­maa. Joskus tosi­asi­at puhu­vat omaa arvo­maail­maa vas­taan. Sil­loinkin ne on rohjet­ta­va tuo­da jul­ki. Siitä ei aina tule selkään taput­telua, mut­ta pitkäl­lä aikavälil­lä se johtaa kuitenkin parem­paan tulokseen.

Säi­lyt­täkää tutk­i­jan uteliaisu­us ja älylli­nen rehellisyys. Joukos­sa huu­ta­van elävä voi olla helpom­paa, mut­ta mie­lenki­in­toista se ei ole.

Exit mobile version