Site icon

Tilastotieteilijä ihmettelee

Kävin puhu­mas­sa tilas­toti­eteen opiske­li­ja­jär­jestö Mood­in synt­täreil­lä. Juh­la­puhe sisäl­si tietysti men­nei­den muis­telua ja nyky­isyy­den ihmette­lyä. Säästän luk­i­jat muis­teluil­ta ja ihmette­len vain nykyisyyttä.

Tilas­toti­eteil­i­jä on siis henkilö, joka analysoi empi­irisiä aineis­to­ja tilas­tol­lisen mallin avul­la. Siinä käytetään matemaat­tisia apu­vä­lineitä, mut­ta ainakaan min­ulle tilas­totiede ei ole matem­ati­ikkaa vaan päättelytaitoa.

Min­un opiskelu­aiko­jeni jäl­keen tilas­toti­eteil­i­jöi­den työsar­ka on peri­aat­teessa laa­jen­tunut tietokonei­den ansios­ta tavat­tomasti.  Toisaal­ta, kun yhä tehokkaampia tietokonei­ta on kaikkial­la, on mah­dol­lista esti­moi­da yhä parem­pia malle­ja. Ennen kuin lin­eaari­nen regres­sion­al­li oli paras­ta mitä oli tar­jol­la, joudut­ti­in maail­ma olet­ta­maan sel­l­aisek­si, että se sopi näi­hin mallei­hin. Jos todel­lisu­us ja mallit oli­vat ris­tiri­idas­sa keskenään, sen pahempi todel­lisu­udelle. Nyt voidaan tehdä paljon real­is­tisem­pia oletuksia.

Tietokonei­den ansioista myös dataa on saatavil­la läh­es rajattomasti.

Luulisi siis, että tilas­toti­eteil­i­jän ammat­ti­taidolle on kysyn­tää. Ei ole. Kyky analysoi­da dataa on jopa heiken­tynyt, vaik­ka mah­dol­lisu­udet ovat paran­tuneet.  Yhä enem­män tehdään vain triv­i­aale­ja nelikent­tiä, piir­retään kor­relo­di­a­gram­mo­ja ja sovite­taan niihin yksinker­tainen tren­di­vi­i­va. Jos halu­taan tietää, miten muut­tu­ja X vaikut­taa muut­tu­jaan Y pitää muiden rel­e­vant­tien muut­tu­jien vaiku­tus vakioi­da pois. Jos esimerkik­si halu­taan ver­ra­ta eri kouluis­sa annet­tavaa ope­tus­ta, tulee oppimis­tu­lok­sia arvioitaes­sa osa­ta ottaa huomioon se, että toises­sa koulus­sa on ehkä parem­pia oppi­lai­ta kuin toisessa.

Min­un on vaikea ymmärtää sitä, että kun tieto­varan­not ja lasken­tamah­dol­lisu­udet ovat paran­tuneet näin val­tavasti, kyky analysoi­da dataa on jopa heikentynyt.

Exit mobile version