Julkiset tilastot ilmaisiksi!

Yritin erästä esitelmää varten löytää niin yksinkertaisen tiedon kuin maatalousväestön suhteellisen osuuden kehityksen Suomessa 1900-luvulla. Oli todella vaikea löytää. Avustajani löysi lopulta jonkin esitelmän, josta se selvisi.

Tilastokeskuksen tärkeimmät tiedot, esimerkiksi tilastollinen vuosikirja, ovat salasanan ja maksun takana. Näin määrää valtion maksuperusteasetus tai jokin muu pykälä. Tässä ei ole mitään järkeä. Julkisesti kerättyjen tietojen pitäisi olla ilmaisia. Miksi valtio laskuttaa ”omistajiaan” ja tuottaa näin selvää hyvinvointitappiota tiedon alikäytön muodossa.

Paljon sellaista tietoa, joka Suomessa on maksullista, löytyy täysin ilmaiseksiYhdysvalloista, esimerkiksi CIA:n julkisista tilastoista. Yhdysvalloissa osataan edes markkinatalouden perusteesit.

Julkisesti kerätyt tiedot ilmaisiksi, maksullista olkoon edelleen se, jos pyytää Tilastokeskusta laatimaan räätälöityjä tilastoja, mistä koituu selvää lisätyötä.

72 vastausta artikkeliin “Julkiset tilastot ilmaisiksi!”

  1. Yhdysvalloissa ollaan todella selkeästi edellä julkisen sektorin tuottaman informaation julkaisemisessa. Ensisijainen syy tähän on se, ettei liittovaltion työntekijä saa tekijänoikeutta tuottamiinsa teoksiin vaan teokset menevät suoraan public domainiin. Ei olisi yhtään hullumpi idea Suomessakaan.

    Se mistä tämä lienee tullut on ajatus ”meidän rahastamme”, jota käytetään välillä perustelemaan surkeita julkisia palveluita mutta toisalta välillä ihan aiheellisesti vaaditaan tehokkuutta julkiselle sektorille. Ei olisi tämäkään hullumpi näkökulma muistaa Suomessakin!

  2. Noin yleensäkin Suomesta saa huonosti tilastoja. Viime kesänä yritin haeskella kuukausittaista tilastoa bensiinin myynnistä, kun mietin paljonkohan hintojen nousu on vaikuttanut autolla ajamiseen. En löytänyt tilastoa.

    Tilastojen puute on mielestäni este kilpailun toteutumiselle kaupan alalla. Kun ihmisillä ei ole ajankohtaista tietoa, niin sitten sitä ollaan kauppiaiden armoilla. Yksi esimerkki on asuntokauppa, jossa välittäjät toitottavat omia totuuksiaan lähes viikottain ja julkinen tilasto ilmestyy vain 4 kertaa vuodessa ja melko pitkän ajan päästä neljännesvuoden loppumisesta. Ympäristöministeriön asuntojen hintatiedot -palvelu on taas amputoitu välittäjien toimesta sisältämään vain osa kaupoista.

  3. Periaatteessa sen pitäisi tietysti mennä noin, mutta todellisuus ei ole ihan yhtä yksinkertainen. Joskus on tehokkaampaa että Tilastokeskus laskuttaa asiakkailtaan kun lähettää laskun valtiolle. Verot aiheuttavat tehokkuustappiota, joka voi joissain tapauksissa olla suurempi kun tiedon maksullisuuden aiheuttaman tiedon alikäytön aiheuttama hyvinvointitappio. En tiedä minkälaisia arvioita verotuksen syrjäyttävästä vaikutuksesta on Suomessa tehty, mutta joku 10%-20% kuulostaa minun korvaan mahdolliselta (GAOn selvitys ehdottaa että syrjäyttävä vaikutus voisi olla 20% verotuksen bruttosummasta Yhdysvalloissa: http://www.gao.gov/products/GAO-05-878). Kun Tilastokeskuksen maksullinen toiminta tuottaa yhdeksän miljoonaa, aiheuttaisi sen verorahoilla tuottaminen ilmeisesti 1-2 miljoonaa tehokkuustappiota verotuksen kannustinvaikutusten takia. Onko tilastojen alikäyttö tosiaan näin haitallista? En tiedä.

    Maksullisen toiminnan siirtäminen valtion maksettavaksi on myös tulonsiirto veronmaksajilta tilastojen käyttäjille. Kyseessä ei ole isot rahat, mutta jotain kuitenkin. Orvot, eläkeläiset, työttömät, lapsiperheet ja monet muut ihmisjoukot ovat ehkä enemmän tulonsiirtojen tarpeessa kun tilastojenkäyttäjät.

    Tilastokeskuksen organisaation tehokkuudenkin kannalta on hyvä että osa tuotteista on maksullisia. Se antaa Tilastokeskukselle paremman käsityksen heidän toimintansa vaikuttavuudesta ja arvosta. Resurssejen kohdentaminen tehokkaasti on helpompaa, kun pystyy myyntitulojen perusteella arvioimaan mitkä selvitykset ja tilastot ovat kysyttyjä. Jossain vaiheessa näitä suosittuja maksullisia palveluita voidaan toki siirtää maksuttomien piiriin, kun ollaan tultu vakuuttuneiksi siitä että se voisi kiinnostaa myös niitä jotka eivät siitä maksa (eli sen maksullisuus aiheuttaa hyvinvointitappiota). Tämä maksullisuus välissä on kuitenkin tärkeä välivaihe, jotta Tilastokeskus osaa arvioida onko se selvitys hyödyllinen vai ei.

    Ongelmana on myös tiedot jotka tuotetaan maksurahoitteisesti. Siinä vaiheessa kun ne tiedot on tuotettu, tehokkuuden nimissä niiden pitäisi tietysti olla ilmaiseksi saatavilla, mutta mikä insentiivi sitten kenelläkään olisi siitä tiedosta alunperinkään maksaa?

    Tilastollinen vuosikirja on taas tavallaan samanlainen kertatilausmaksu kun mitä kehuit musiikin rahoittamisessa. Kun Tilastollinen vuosikirja myydään vain pakettina, jokaiselle joka haluaa jotain tilastoa tarkemmim, rajakustannus muiden vuosikirjan sisältämien tilastojen käytöstä on nolla. Eli tämä on kompromissi tehokkuuden ja maksullisuuden välillä. Ei mitenkään yksiselitteisen huono idea.

  4. Juu, voitaisiin käyttää vaikka luonnonvaraisten eläinten hoitokotien valtionavut informaation levittämiseen.

    Sama kannattaisi laajentaa koskemaan standardeja. Niiden ilmaisuus parantaisi varmasti sekä koulutuksen että insinöörityön laatua. Harvemmin jaksaa alkaa muutamaa kymppiä jostain standardista, jos ei ole varma tarvitseeko sitä vai ei.

  5. Tilastokeskus ei ole enää tilaskokeskus sanan varisnaisessa merkityksessä. Valtiolla on päällekkäistä toimintaa. Esim. vaalitilastoja tehdään Oikeusministeriössä. Tilastoja maataloudesta löytyy täältä: https://portal.mtt.fi/portal/page/portal/taloustohtori

    Maatalousministeri sanoo selvityttävänsä ruuan hintaa ja sen kehitystä. Lehdessä tilastokeskus vastaa mielipidesivulla, että heillä on valmiina tilastot ja aikasarjat. Kuvauksesta päätellen eivät ole pienellä rahalla tehtyjä vaan kauppojen hyllyhintojen perusteella.

    Miksi valtion laitokset tekevät samoja tilastoja kuin tilastokeskus?

    Kaikkien verorahoilla tuotettujen virallisten ja muiden tilastojen pitää tietenkin olla julkisia ja ilmaisia tehtiinpä ne missä tahansa ja ne pitäisi saada helposti samasta paikasta!

  6. Ilkka
    ”Siinä vaiheessa kun ne tiedot on tuotettu, tehokkuuden nimissä niiden pitäisi tietysti olla ilmaiseksi saatavilla”

    Kannatan tätä vaihtoehtoa. Tämä olisi yleisissä sopimusehdoissa.

    Ne jotka eivät halua kysymäänsä tietoa julkiseksi, voisivat lisämaksusta pitää saman haun edelleen maksullisena. – Pitäisikö sitten julkaista luettelo salatuista hauista ja niiden hakijoista?

  7. Osmo: ”Miksi valtio laskuttaa ”omistajiaan” ja tuottaa näin selvää hyvinvointitappiota tiedon alikäytön muodossa.”

    Miksi junaliput maksavat enemmän kuin sen verran, että junat ovat täynnä? Miksi metrolippu maksaa enemmän kuin, että metro on täynnä?

    Siksi, että näin valtio saa kerättyä kuluttajilta enemmän rahaa. Ja kyllä, aina kun hinnoitellaan yli marginaalikustannusten syntyy hyvinvointitappioita staattisessa tasapainomallissa. Tälle ei vaan mahda mitään, jos halutaan, että tiedon käyttäjät osallistuvat sen tuottamisen kustannuksiin.

  8. Valtion virastojen halu kehittää jatkuvasti omaa informaatioliiketoimintaansa on varovasti sanottuna kummallista. Tämä sivu summaa hyvin PRH:n käytännöt. Yritys- ja yhteisötietolain pykälä:

    Tietojen hankkiminen yritys- ja yhteisötunnusrekisteristä yleisten tietoverkkojen kautta on maksutonta.

    ei menoa hidasta, koska sitä tulkitaan niin että pykälän nojalla voidaan verovaroin hankkia web-pohjainen sovellus jonka tarkoituksena on rajata kyselyt yhteen yritykseen kerrallaan.

    Sanamuoto ”Tietojen hankkiminen rekisteristä X yleisten tietoverkkojen kautta on maksutonta” yleistynee lainsäädännössä vähitellen, on ikävää jos se johtaa de facto tiedon saannin rajoittamiseen vaikka tarkoitus on juuri päinvastainen.

    Maksuperustelain kohta Suoritetta tuottavan viranomaisen asiana on huolehtia siitä, ettei suoritteen tuottamisesta aiheudu enempää kustannuksia kuin, mitä suoritteen tarkoituksenmukainen laatutaso edellyttää. on pelkkää sanahelinää. Käyttäjän kannalta tarkoituksenmukaista on se että fakta X löytyy sekunnissa googlaamalla eli tieto on kertaalleen siirretty palvelimelle Y, tuottajan kannalta on tarkoituksenmukaista polkaista pystyyn projekti jossa hallinnolla riittää mukavaa ja helppoa puuhastelemista pitkäksi aikaa.

  9. Ja kyllä, aina kun hinnoitellaan yli marginaalikustannusten syntyy hyvinvointitappioita staattisessa tasapainomallissa. Tälle ei vaan mahda mitään, jos halutaan, että tiedon käyttäjät osallistuvat sen tuottamisen kustannuksiin.

    Tässä tapauksessa argumentti on tyhjä, koska tietoa jää yhtäältä käyttämättä aivan älyttömästi ja toisaalta tieto kerätään joka tapauksessa, käytettiin sitä tai ei.

    Valtion tehtävänä ei ole kerätä rahaa, vaan sen tehtävänä on hoitaa niitä asioita, joita markkinat eivät hoida tai hoitavat huonosti esimerkiksi ulkoisvaikutusten vuoksi. Jostain syystä suomalaiset tuntuvat kuitenkin ajattelevan, että nimenomaan rahan kerääminen veroilla ja maksuilla olisi valtion tehtävä.

  10. Kyllä nämä uudemmat tilastot löytyy aika hyvin netistä Tilastokeskuksen sivuilta. Osmon etsimään asiaan löytyy taulukoita esim. tuolta:
    http://pxweb2.stat.fi/Database/StatFin/Vrm/tyokay/tyokay_fi.asp
    Sen sijaan pitkiin aikasarjoihin pitää käydä tutustumassa kirjastossa, siellä Helsingissä on esim. mainio Tilastokirjasto, jossa tuli aikoinaan paljonkin aikaa vietettyä.

  11. ”Julkiset tilastot ilmaisiksi!”

    Täysin samaa mieltä.

    Ilkka, olet kirjoituksestasi päätellen ilmeisesti tilastoihmisiä. Osoisitkohan kertoa, mistä löytyy laajennettu ja virallisempi versio perusteista, joita yllä esität? Olen julkissektorin tilastoheppuna hämmästellyt, miksi Tilastokeskus allekirjoituttaa sopimuksia,joiden mukaan julikisen toimijan Tilastokeskukselta tilaamia tietoja, ei saa kattavassa (yksityiskohtaisessa) muodossa antaa julkisuuteen, esim lehdistölle.

  12. Ko. säännös on Valtion maksuperustelaki.

    Asiasta on tehty myös selvityksiä ja annettu toimenpide-ehdotuksia.

    http://herkules.oulu.fi/isbn9514255178/html/x400.html

    Kyseessä on suuren luokan kaupankäynti, jossa osa valtion tuloista tulee maksullisista palveluista.

    Se mikä eniten nyppii on ihmisten tietojen kauppaaminen kaikille halukkaille. AKE ja vastaavat myyvät rekisteritietoja markkinakäyttöön. Itsestään selvää pitäisi olla, että tietojen luovutukseen tulisi kysyä lupa henkilöltä. Nyt tilanne on se, että henkilön pitää hakea itse tiedonluovutuskieltoa.

  13. ”Orvot, eläkeläiset, työttömät, lapsiperheet ja monet muut ihmisjoukot ovat ehkä enemmän tulonsiirtojen tarpeessa kun tilastojenkäyttäjät.”

    Nämä samat ihmiset ovat myös tilastojen käyttäjiä.
    Demokratia toimii sitä paremmin mitä enemmän kansalaisilla on tietoa. Tilastot kertovat paljon yhteiskunnasta.
    Jos tieto suljetaan maksullisuuen taakse syntyy demokratiavajetta, koska vain varakkailla on varaa yhteiskunnalliseen tietoon.

  14. Osmo: ”Miksi valtio laskuttaa ”omistajiaan” ja tuottaa näin selvää hyvinvointitappiota tiedon alikäytön muodossa.”

    Asian voi nähdä myös toisella tavalla.

    Tilastokeskuksen toiminnasta syntyy tietty vuotuinen kulu. Jos tiedoista laskuttaminen lopetettaisiin, pitäisi joko toimintaa supistaa tai lisätä suoraa budjettirahoitusta.

    Nykyinen malli perustuu siihen, että valtio maksaa valtaosan työstä ja tietoa tarvitseva loput. Eikö ole ihan perusteltua, että osa kustannuksesta kohdistetaan sille, joka tietoa tarvitsee?

    Ongelmallinen tilanne olisi vasta, jos Tilastokeskus olisi yksityinen toimija, joka tekisi maksullisena palveluna työn valtiolle ja sitten laskuttaisi vielä toiseen kertaan kansalaisia ja generoisi siten voittoa.

  15. Ehdottomasti asian pitäisi olla näin kuten ehdotettu. Asiaa kuvaa hyvin puolella kapasiteetilla jatkuvasti rullaavat junat (tietyt linjat), onko valtiojohtoisen junaratamme tarkoitus tuottaa valtiolle maksimaalisen voiton vai tuottaa maksimaalinen hyvinvointi sen omistajille (eli tavallisille kansalaisille)?

    Lippujen hintoihin pitäisi soveltaa samaa logiikkaa kuin käytetään lentoyhtiöissä, kun ostat lippusi hyvissäajoin saat sen merkittävästi halvemmalla. Kun juna sitten alkaa täyttymään hinta kipuaa pikkuhiljaa ylöspäin. Tämä maksimoisi itseasiassa sekä voiton että matkustajakapasiteetin käytön.

    Osmon ilmoittama epäkohta on osa suurempaa epäkohtaa jota on tässä blogissa muistaakseni puitu aiemminkin (valtion tuottamat kartat); valtio keskittyy liikaa itseensä eikä sen jäseniin.

  16. Jani:
    Bensiinin myyntitilasto löytyy Kaupan liikevaihtokuvaaja tilaston alta, hae toimialan Polttoaineiden vähittäiskauppa (473) tiedot:
    http://pxweb2.stat.fi/Database/StatFin/kau/klv/klv_fi.asp

    Kyllä Tilastokeskus aika hyvin tekee tietonsa julkisiksi. Joskus ne on hankala löytää, mutta kannattaa rohkeasti kysyä. Tilastokirjasto palvelee.

    Usein haluaisin kyllä tarkempia luokituksia esimkerkiksi koulutuksen tai maantieteellisen alueen osalta, mutta näiden julkaisemisessa yksityisyyden suoja asettaa rajoitteita.
    Esimerkiksi, vaikka Tilastokeskus voisi julkistaa kolme vuotta työelämässä olleiden kansantaloustiedettä opiskelleiden valtiotieteiden maistereiden keskiansiot Helsingissä, yksityisyyden suoja estäisi saman julkaisemista Rovaniemen osalta jos siellä on vain kaksi tällaista henkilöä. Tarkempien luokitusten osalta tulee näitä ongelmia, jonka takia niiden tuottaminen vaatii väistämättä lisätyötä. Jonkun pitää käydä läpi tiedot ja varmistaa ettei ketään yritystä tai henkilöä voida yksilöidä missään olosuhteissa (edes yhdistelemällä muihin tilastoihin tai tietoihin–esim. jos on jo julkistettu kansantaloustieteilijöiden keskinansiot Espoossa ja Kauniaisissa yhteensä, jos julkaistaan keskiansiot Espoossa, niin sen Kauniaisissa olevan kansantaloustieteilijän yksityisyys on uhattu).

    Toisaalta Tilastokeskuksen maksullinenkaan palvelu ei ole tuhottoman hintaista. Tietohan on ilmaista, asiakas maksaa vain siitä lisätyöstä joka sen tiedon hakeminen ja lähettäminen vie. Yksinkertaisten kyselyiden osalla puhutaan lähinnä minuuteista, eikä sellaisesta välttämättä veloiteta ollenkaan.

    Parantamisen varaa toki on, mutta minun kokemukseni mukaan Tilastokeskuksen nettisivut ja palvelut ovat hyvää kansainvälistä tasoa. Yhdysvalloissa tilanne on tosiaan usein parempi, mutta siellä voidaan hyödyntä skaalaetuja aivan eri tavalla kun pienessä Suomessa. Tilastotoimeen liittyvän asiantuntjiatyön määrä on kuitenkin usein riippumaton tilastoitavan alueen koosta. Toisaalta monien tietojen osalta USA on suorastaan kehitysmaa. Siellähän lasketaan väestö kymmenen vuoden välein.

  17. ”web-pohjainen sovellus jonka tarkoituksena on rajata kyselyt yhteen yritykseen kerrallaan.”

    On aivan eri asia luovuttaa rekisteristä tietoja kun luovuttaa koko rekisteri. Käsittääkseni rekisterien hallintaa koskevat ihan omat lainsäädäntönsä, ilmoitusvelvollisuudet tietosuojavaltuutetulle, jne. Usein on perusteltua että yksittäiset tiedot ovat saatavilla, mutta koko rekisterin kopioiminen olisi hyvin ongelmallista. Tästä esimerkikkinä vaikka yllä Fillarittoman paheksunta AKE:n rekisterien myymisestä. Kokonaisen rekisterin luovuttamista pidetään perustellusti eri asiana kun yksittäisten tietojen luovuttamista.

    Hyvän tiedon tuottamisen edellytys on hyvä yksityisyyden suoja. Kyselyihin vastataan totuudenmukaisesti ja luotettavasti vain jos vastaajat luottavat siihen ettei heidän tietojaan käytetä väärin. Luottamuksen voi menettää vain kerran, jonka takia on perusteltua että tilastoviranomaiset ovat näissä asioissa ennemmin liian varovaisia kuin päinvastoin. Esimerkiksi kuukausittaiset tiedot Nokian liikevaihdosta, bonuksista ja palkoista on hyvin arkaluontoista tietoa, mutta tilastojen laatimisen kannalta oleellisia. Toistaiseksi Nokia luottaa siihen että Tilastokeskus osaa käsitellä tiedot oikein. Jos tämä muuttuisi, Nokia voisi lopettaa kyselyihin vastaamisen ja tilastojen laatu kärsii. Tilastoeettiset periaatteet pitää ottaa vakavasti, vaikka ne usein hankaloittavatkin tiedon jakamista. Suomessa näin on yleensä tehty, jonka takia täällä vastausprosentit ja tilastojen luotettavuus on maailmanluokkaa. Siitä kannattaa olla ylpeä ja pitää kiinni.

  18. ”Jos tiedoista laskuttaminen lopetettaisiin, pitäisi joko toimintaa supistaa tai lisätä suoraa budjettirahoitusta.”

    Edellyttäen että toiminta on voitollista.

    Tilastokeskuksen vuosikertomus 2008:

    Maksullisen toiminnan tuotot kasvoivat hieman
    edellisvuodesta. Maksullisesta toiminnasta kertyi
    tuottoja 9,0 miljoonaa euroa. Toiminnan tulos oli
    94 000 euroa ylijäämäinen.

    Uskooko joku tosissaan että 58,6 Me liikevaihtoa tekevän laitoksen sisällä osataan ja halutaan tilastoida yhden pienen osafunktion kannattavuus prosentin tarkkuudella ? Sitäpaitsi tuollainen tarkkuus ei ihan halvalla synny, eikä sillä ole mitään tekemistä organisaation ydintoiminnan kanssa.

  19. Herbert, verkkojulkaisu on varmasti hyvin halpaa verrattuna itse tilastointityöhön. Hätätilassa voisi ajatella niinkin, että perusinformaatio on lukuina ilmaiseksi kaikkien saatavilla, mutta jos haluaa hienoja graafeja tai analyysiä, siitä joutuisi pulittamaan jotain.

  20. Suomen ympäristökeskus ymmärtää asian Tilastokeskusta paremmin. Ympäristökeskus jakaa omia aineistojaan ilmaiseksi tutkimuskäyttöön ja muuhun perusteltuun tarkoitukseen. Kaikki hyötyvät: Aineistosta saadaan aikaan ympäristöasioita edistävää tutkimusta, joka muuten saattaisi jäädä tekemättä.

    Tilastokeskus ja Ilmatieteen laitos ovat päin vastaisia esimerkkejä. Isoissa EU-tutkimushankkeissa on rahaa laajempienkin aineistojen hankkimiseen, mutta monta gradututkimusta tai heikommin rahoitettua väitöskirjatutkimusta ja jäänyt tekemättä Tilastokeskuksen roimien maksujen takia.

    ”Osa kuluista kohdistetaan sille, joka tietoa tarvitsee” on hyvä lähtökohta, mutta ei päde tässä tapauksessa. Toki tutkimuksen tekijä ”tarvitsee tietoja” tutkimukselleen, mutta hänen lopputuotoksensa palvelee yhteiskuntaa enemmän kuin pelkkä raaka numeroaineisto Tilastokeskuksen tietokoneilla. Tutkimustulokset ovat yleensä ei-kaupallisia, joten tutkija ei voi sitä kautta saada rahallista hyötyä tilastoaineiston käytöstä.

    Tilastotieto voi hyvin pysyä maksullisena yrityksille, mutta aineistojen edullinen/ilmainen luovutus valtion kustantamien yliopistojen tutkimuskäytöön luulisi olevan kaikkien etu.

  21. Tiedemies:”Tässä tapauksessa argumentti on tyhjä, koska tietoa jää yhtäältä käyttämättä aivan älyttömästi ja toisaalta tieto kerätään joka tapauksessa, käytettiin sitä tai ei.”

    Jeps, mutta tottakai meidän pitää tasapainottaa tulonsiirtoa veronmaksajilta tiedon käyttäjille ja hyvinvointitappioita, jotka syntyvät, kun hinnoitellaan yli marginaalikustannusten juuri niin kuin ilkka kirjoitti.

    Yleensä reiluna tasapainona pidetään tilannetta, jossa valtio ei tuota palvelulla voittoa, eikä tappiota.

    ”Valtion tehtävänä ei ole kerätä rahaa,”

    Ei ehkä sinun mielestä, mutta mistä tiedät mitä poliitikot ja byrokraatit ajattelevat, kun ne miettivät paljonko tilastokeskuksen pitäisi laskuttaa tiedoistaan?

    ” vaan sen tehtävänä on hoitaa niitä asioita, joita markkinat eivät hoida tai hoitavat huonosti esimerkiksi ulkoisvaikutusten vuoksi.”

    Jeps, ja valtiolla on erilaisia tapoja hoitaa näitä, esim. siten, että se antaa jonkun arvon tulonjaon tasaisuudelle eikä ala ehdoin tahdoin siirtämään varallisuutta veronmaksajilta tutkijoille.

    Meillä pitäisi olla joku menetelmä haarukoida sitä miten paljon hyvinvointitappiota syntyy, kun tilastoilla on nykyiset hinnat. Paljonko Osmon avustajalta meni aikaa tiedon kaivamiseen netistä verrattuna siihen, että hän olisi kaivanut sen tilastokeskuksesta? Kuinka paljon Osmoja meillä on? Miten paljon haittaa tulonjaon epätasaisuus ja verotuksen kannustinvaikutusten muutokset aiheuttavat?

    Herbert:”Ongelmallinen tilanne olisi vasta, jos Tilastokeskus olisi yksityinen toimija, joka tekisi maksullisena palveluna työn valtiolle ja sitten laskuttaisi vielä toiseen kertaan kansalaisia ja generoisi siten voittoa.”

    Jos tilastokeskus olisi yksityinen mitään ongelmaa ei olisi. Valtio saisi tilastonsa sitä halvemmalla mitä enemmän yksityinen toimija onnistuisi hankkimaan tuloja myymällä tietoa muille.

  22. Valtion rahoilla tuotetaan vaikka mitä muutakin tietoa, joka on maksullista tai hankalasti saatavissa.

    Esimerkiksi KOTUS ei julkaise ilmaiseksi verkossa paljoakaan tuottamastaan materiaalista, vaikka lafka pitkälti on olemassa suojellakseen suomen kieltä. Ilmeisesti köyhien tarpeilla ei ole väliä. Ongelma ei olisi suuri, jos vapaehtoistyöllä saataisiin vastaavat materiaalit verkkoon ja KOTUS tarpeettomaksi. Jotain kielioppeja ja oikeinkirjoitusohjeita jo löytyykin, mutta sanakirjoja yms. saadaan odottaa vielä kymmeniä vuosia. Ruotsin KOTUSta vastaava lafka toimii tarkoituksensa mukaisesti eli toimittaa ruotsin kannalta tärkeätä matskua verkkoon.

    Toisena esimerkkinä voisi mainita väitöskirjat. Mielestäni yliopistot ja tohtorit tulisi pääsääntöisesti velvoittaa siirtämään väitökset verkkoon, miksei lisurit ja gradutkin.

    Sitäkin voisi ihmetellä, miksi Suomessa niin harvoin luentoja, puhetilaisuuksia, seminaareja jne. siirretään verkkoon kuunneltaviksi. ON jotenkin järjen vastaista järjestää suurellakin rahalla tärkeä seminaari huolehtimatta siitä, että mahdollisimman moni pääsisi nauttimaan seminaarin annista. Nykytilanteessa tärkeätkin ajatukset pitkälti katoavat ikuisesti tai eivät ainakaan saa ansaitsemaansa julkisuutta. Rahasta ei voi olla kysymys, koska äänittäminen on nykyteknologialla halpaa. Suomi on tässäkin suhteessa jäänyt kehitysmaaksi. En tiedä miksi.

  23. Tilastokeskuksen toiminnasta syntyy tietty vuotuinen kulu. Jos tiedoista laskuttaminen lopetettaisiin, pitäisi joko toimintaa supistaa tai lisätä suoraa budjettirahoitusta.

    No sitten lisätään budjettirahoitusta. Tai otetaan se yhdeksän miljoonaa euroa vaikka mediamaksun tuloista.

  24. Esimerkiksi, vaikka Tilastokeskus voisi julkistaa kolme vuotta työelämässä olleiden kansantaloustiedettä opiskelleiden valtiotieteiden maistereiden keskiansiot Helsingissä, yksityisyyden suoja estäisi saman julkaisemista Rovaniemen osalta jos siellä on vain kaksi tällaista henkilöä.

    Tuollaisessa harmillisessa tapauksessa voi onneksi tsekata kenen tahansa kansalaisen verotiedot ”verokalenterista”.

  25. ”Vino, ainakin väitöskirjoja on verkossa ilmaiseksi, tiedän omasta kokemuksesta…”

    Oulusta jopa aika kattavasti muutamalta viime vuodelta. Mutta tarkoitin sitä, että kaikki pitäisi velvoittaa laittamaan väikkäri ja muutkin opinnäytteet verkkoon ja yliopiston pitäisi tehdä se helpoksi. Nykyinen käytäntö hukkaa valtavan määrän tietoa, koska se on ”kätkössä” parin kirjaston takahuoneissa.

  26. Tulipa vaan yht’äkkia mieleeni hassu ajatus, että josko jokaisella kansalaisella olisi pääsy tiettyihin valtion/kunnan hallinnoimiin tietokantatietoihin, niin eikö sitten samalla voitaisi sallia tietokantahakuja noihin tietokantoihin. Eli ihan puhtalla SQL-kielillä sallittaisiin kansalaisille pääsy tekemään tietokantakyselyjä.

    Jos yo. malli ei kävisi, niin sitten sallittaisiin ainakin se, että voi ns. ”imuroida” data tietokannoista omalle koneelleen myöhempää analynointia varten.

    Mikähän tässä yo. ajatuksessa ei sitten kävisikään virkamiehen ajatukseen.

  27. Tavallinen teknikko on asian ytimessä. Jos data olisi vapaasti käytettävissä hyvin dokumentoidun APIn kautta niin voitaisiin nähdä kaikenlaisia hyödyllisiä sovelluksia. Vaikka sellainen ohjelma joka tarkistaisi lukuja tekstistä, vähän niin kuin oikolukuohjelma, esim. verkkojulkaisuihin. Tai sitten ei nähtäisi. Olennaista on se että emme tiedä, ja emme tule tietämään niin kauan kuin tieto on lukkojen takana. Noiden palveluiden myyntitulot on minusta aika pieni hinta vastauksesta.

  28. miten tämä julkisen hankinnan tiedon omistus oiken menee?

    käsittääkseni karttapohjat yms on tuotettu valtion varoilla ja ne on siirretty jonkin osakeyhtiön (besim. kartakeskus) omaisuudeksi? koskee maa- ja merikarttoja.

    eräissä muissa maissa yhteiskunnan maksamat karttapohjat ovat public domain- tyylisiä. Suomessa taitavat olla jo nyt tai kohta ulkolaisten omistuksessa – ja maksamme kartoista toistamiseen ja ikuisesti.

    näin suomessakin valtion omaisuutta saatetaan edullisesti ilman tarjouskilpailua yksityisiin käsiin – kuten itänapurissa?

  29. ”Julkisesti kerätyt tiedot ilmaisiksi, maksullista olkoon edelleen se, jos pyytää Tilastokeskusta laatimaan räätälöityjä tilastoja, mistä koituu selvää lisätyötä.”

    Juuri noin. Yritäpäs löytää Suomesta THL:n (ex-KTL) tai Kelan tuottamia tietoja ruoka-aineista. Rahalla saa.

    Muualta nuo tiedot löytyvät ilmaiseksi useissa eri tietomuodoissa. Varsinkin USA:ssa dataa suorastaan tyrkytetään.

    Tilastokeskus myös panttaa joitakin tietoja. Yritäpä löytää maatalouden bkt-osuus, kun maatalouden mainitsit.

  30. ”Jos yo. malli ei kävisi, niin sitten sallittaisiin ainakin se, että voi ns. “imuroida” data tietokannoista omalle koneelleen myöhempää analynointia varten.
    Mikähän tässä yo. ajatuksessa ei sitten kävisikään virkamiehen ajatukseen.”

    Sellainen sotii yksityisyyden suojaa ja tilastoeettisiä periaatteita vastaan. Lisää tuosta linkistä (luulen, pdf ei avaudu minun koneella):
    http://stat.fi/org/periaatteet/eettinen_opas.html
    Ei ne Tilastokeskuksen datat tyhjästä ilmesty, vaan ne kerätään kyselyillä kansalaisilta ja yrityksiltä. Jos kaikki raakadata työnnetään nettiin kilpailijoiden ja naapureiden tutkittavaksi, niin veikkaan ettei kyselyihin enää sen jälkeen vastattaisi samalla tavalla. Jos olisi olemassa jokin helppo tapa antaa aineistot yleisön käyttöön, niin kyllä se olisi jo tehty. Tilastokeskus haluaa palvella ja haluaa että sen tietoja käytetään, mutta tilastoetiikka ja lainsäädäntö asettaa tietojen jakamiselle tiettyjä rajoitteita. On absurdi ajatuksenakin että virkamiehet tahallaan pimittäisivät tietoa kansalaisilta. Miksi he niin tekisivät?

    ”Uskooko joku tosissaan että 58,6 Me liikevaihtoa tekevän laitoksen sisällä osataan ja halutaan tilastoida yhden pienen osafunktion kannattavuus prosentin tarkkuudella ? Sitäpaitsi tuollainen tarkkuus ei ihan halvalla synny, eikä sillä ole mitään tekemistä organisaation ydintoiminnan kanssa.”
    Meinaatko että se on niin pieni laitos ettei ammattitaito riitä kannattavuuden seurantaan, vai ettei isot laitokset ylipäätään kykene siihen? Uskoisin että kaikki suuret yritykset seuraavat pienten osafunktioiden kannattavuutta prosentin tarkkuudella. Ei mitään Nokiaa voida johtaa mutu-tuntumalta, vaan kyllä siinä on apuna ihan tilastoja siitä mihin resursseja käytetään ja mitä niillä tuotetaan. Valtion laitoksissa tilanne on sama. Tietoja tarvitaan päätöksenteon apuvälineeksi.
    TK:ssa työntekijät raportoivat muistaakseni vartin tarkkuudella mihin projektiin tai tilastoon työaikansa käyttävät. Kyllä siitä syntyy dataa josta noita kannattavuus numeroita voi tuottaa, vaikkapa sitten promillen tarkkuudella. Ei se tietenkään ilmaista ole että työntekijät raportoivat sellaista, mutta toisaalta jotenkin sitäkin organisaatiota pitää johtaa. Ydintoiminnan tehokas suorittaminen edellyttää sen että puljun johtajat tietävät mihin kaikki resurssit menee. Väittäisin että yleensä valtion lafkoissa tehoton työn organisointi on suurempi ongelma kun tuottavuuden seurantaan käytetty aika, eli se tuottavuuden seuranta on ainakin potentiaalisesti hyödyllistä. Toki on eri asia mitä johtoporras sitten sillä datalla tekee.

  31. Artturi kirjoitti 15.9.2009 kello 15:09

    ”Meillä pitäisi olla joku menetelmä haarukoida sitä miten paljon hyvinvointitappiota syntyy, kun tilastoilla on nykyiset hinnat. Paljonko Osmon avustajalta meni aikaa tiedon kaivamiseen netistä verrattuna siihen, että hän olisi kaivanut sen tilastokeskuksesta? Kuinka paljon Osmoja meillä on? Miten paljon haittaa tulonjaon epätasaisuus ja verotuksen kannustinvaikutusten muutokset aiheuttavat?”

    Jos jonkun mielestä tuossa oli hiukan elitistinen sävy hän lukekoon uudelleen kirjoituksen:

    Jani kirjoitti 15.9.2009 kello 9:41

    ”Noin yleensäkin Suomesta saa huonosti tilastoja. Viime kesänä yritin haeskella kuukausittaista tilastoa bensiinin myynnistä, kun mietin paljonkohan hintojen nousu on vaikuttanut autolla ajamiseen. En löytänyt tilastoa.

    Tilastojen puute on mielestäni este kilpailun toteutumiselle kaupan alalla. Kun ihmisillä ei ole ajankohtaista tietoa, niin sitten sitä ollaan kauppiaiden armoilla. Yksi esimerkki on asuntokauppa, jossa välittäjät toitottavat omia totuuksiaan lähes viikottain ja julkinen tilasto ilmestyy vain 4 kertaa vuodessa ja melko pitkän ajan päästä neljännesvuoden loppumisesta. Ympäristöministeriön asuntojen hintatiedot -palvelu on taas amputoitu välittäjien toimesta sisältämään vain osa kaupoista.”

  32. Ilmastotieteilylaitoksen lämpötilatilastot ovat myös yksi kalliisti hinnoiteltu valtiosalaisuus. Luulisi että lyömällä lämpötilamittausdatat 1900-luvun alusta tiskiin jokainen näkisi miten esim 2000-luvun ja 1930-luvun lämpötilaerot olivatkaan.

    Nyt osa datoista näkyy esim GISSin kautta, mutta alkaen jostain 1950-luvulta, ja sisältäen GISSin ”korjaukset”.

  33. Tämä on näitä asioita, jotka ainakin jollain tasolla ovat Piraattipuolueen agendalla (käsittääkseni). Tiedon vapautta varten Tietoyhteiskuntapuolue yritettiin perustaa ja Piraattipuolue paria astetta populistisempana onnistuttiin perustamaan 🙂

  34. Jeps, ja valtiolla on erilaisia tapoja hoitaa näitä, esim. siten, että se antaa jonkun arvon tulonjaon tasaisuudelle eikä ala ehdoin tahdoin siirtämään varallisuutta veronmaksajilta tutkijoille.

    Argumentti on edelleen tyhjä. Ne tilastot on jo kerätty verovaroin ja pitkälti verovaroin tehtäviä tutkimuksia varten. Maksut, joita niistä nyt maksetaan, ovat pitkälti rahan siirtämistä valtion taskusta toiseen.

    Yksityiset tahot eivät maksa niistä nytkään penniäkään. Sensijaan yliopiston tai (valtiorahoitteisen) tutkimuslafkan byrokraatti päättää, kenen tutkijan tarpeisiin rahaa siirretään valtion yhdestä taskusta toiseen.

    Meillä pitäisi olla joku menetelmä haarukoida sitä miten paljon hyvinvointitappiota syntyy, kun tilastoilla on nykyiset hinnat.

    Nykyisessä tilanteessa kaikki on hyvinvointitappiota, koska sitä rahaa ei edelleenkään kerätä keneltäkään yksityiseltä, vaan sekin raha on verorahaa, jolla näitä maksellaan. Data on niukkaa keinotekoisesti ja joillain tutkijoilla ei ole halua ryhtyä siihen työhön, että saisi ”maksettua” tuon datan verorahoista. Systeemi siis tuottaa vain työtä (joka sekin maksetaan verorahoista liki 100 prosenttisesti), muttei mitään hyötyä eikä mitään rahoitusta tämän datan keräämiseksi.

    Voi olla, että jotkut firmat tms. markkinointitutkimuksiinsa ja sensellaisiin haluavat tuota dataa ja maksavatkin siitä. Voi tietenkin olla, että olen yllä erehtynyt ja että tämä maksu on merkittäväkin tulonlähde, jota ilman tilastoja ei paljoa kerättäisi. Mutta jotenkin en usko.

  35. Crash:
    Tuo sinun mainitsemasi bensan myyntitilasto on saatavilla Tilastokeskukselta. Kaivoin sen linkin esiin aiemmin tässä keskustelussa.

    Tilastot ovat ehdottomasti tärkeitä kilpailun ja demokratian toteutumisen kannalta, mutta pääpiirteissään ne ovat jo hyvin saatavilla. Osmon väite että ”Tilastokeskuksen tärkeimmät tiedot, esimerkiksi tilastollinen vuosikirja, ovat salasanan ja maksun takana” on älytöntä liioittelua. Suurin osa Tilastokeskuksen tuotteista on ilmaisia. Jopa tuon Tilastollisen vuosikirjan, joka lähinnä vaan kokoaa tilastoja jotka ovat saatavilla ilmaiseksi Tilastokeskuksen nettisivuilla, on ilmaiseksi luettavissa kaikissa hyvissä kirjastoissa. Siitä voisi toki laittaa PDFn nettiin, mutta ei se mitenkään itestäänselvästi ole järkevää. Jos se vähentää kirjan myyntituloja, ne puuttuvat rahat pitää sitten verottaa joka on yhteiskunnalle kallista.

    Jos on jotain tilastoja joita tarvitaan yleisesti, mutta maksullisuuden takia niitä alikäytetään, niin niitä pitää toki siirtää maksuttomien piiriin. Myös jos on joku tarve tilastolle, mutta toistaiseksi sellaista ei ole, niin sellaisen tekemistä pitää harkita. Pitää kuitenkin muistaa että tilastot maksavat ja maksullisen toiminnan siirtäminen maksuttomaksi maksaa valtion budjetissa ja yhteiskunnalle verotuksen syrjäyttävän vaikutuksen takia. On varmasti tiettyjä tilastoja joiden saatavuutta pitäisi parantaa (nuo monien mainitsemat sää-datat voisi olla sellainen, en tiedä niistä mitään), mutta ei voi mielestäni yleispätevästi sanoa että tällä hetkellä Suomen tilastolaitos olisi epäonnistunut tiedon välittämisessä. Puutteita on, mutta kyllä suurin osa tärkeistä tilastoista on kaikkien saatavilla. Jos vaan osaa Tilastokeskuksen nettisivuja käyttää tai kehtaa pyytää siihen apua.

    Mitä tulee muihin laitoksiin, niin minun kokemukseni mukaan esimerkiksi OECDn, Eurostatin ja EKPn nettisivut ovat hyvin hankalia verrattuna Tilastokeskuksen sivuihin. On varmaan myös tottumiskysymys, mutta näihin verrattuna Tilastokeskus ei ainakaan joudu häpeämään.

  36. Tiedemies: Ootko sitä mieltä, että kansanedustajien pitäs saada junamatkat ilmaseks, jos junissa on tyhjää?

    Tämä keskustelu ei kyllä edes lähtenyt siitä liikkeelle, että onko tilastokeskuksen data saatavilla ilmaiseksi ihmisille jotka ovat töissä valtiolle, vaan siitä, että Osmo Suomen kansalaisena ei saanut dataa ilmaiseksi.

    ”Nykyisessä tilanteessa kaikki on hyvinvointitappiota”

    Jeps, eli aina kun joku jättää käyttämättä sitä dataa, koska se maksaa likaa syntyy hyvinvointitappioita. Tämä on jo moneen kertaan tässä ketjussa sanottu ja sitä on turha toistaa. Näitä hyvinvointitappioita pitää verrata niihin tappiohin joita syntyisi, jos data jaettaisiin ilmaiseksi ja toimintakustannukset katetaan verovaroista. Ei ole itsestään selvää kummat ovat suuremmat.

    Kyse ei siis ole siitä kerättäisiinkö tilastoja ilman tätä rahoituslähdettä vaan siitä kumpi on pahempi, verotus vai käyttämättä jääneet tilastot. Niissä molemmissa on huonot puolensa.

  37. Hienoa, että Osmo otti aiheen esille. On väärin, että verovaroin tuotettua, kaikille relevanttia dataa pidetään maksumuurin takana. Maksullisuuden lisäksi ongelmana on umpinaiset, epästandardit jakelutavat. Jotta tietoja voisi mielekkäällä tavalla käyttää, visalisoida ja jalostaa edelleen, ei riitä, että niitä voi vain käydä lukemassa kirjastossa tai ladata nettisivulta vaikkapa PDF-muodossa (se korvaa lähinnä kirjastokäynnin). Niiden pitäisi olla käytettävissä standardissa digitaalisessa raakamuodossa (tilastot esimerkiksi tekstinä). Nyt monilla tahoilla on omia, suljettuja systeemejään joissa tietoa kenties jaetaan ilmaiseksikin, mutta niiden sisällyttäminen muualle (mash up) on mahdotonta.

    Paikkatieto on hyvä esimerkki tästä. Paljon kaikille tarpeellista ja hyödyllistä paikkatietoa on olemassa kaupunkien omissa, suljetuissa epästandardeissa karttapalveluissa ja Maanmittauslaitoksen Kansalaisen Karttapaikalla. Ne pitäisi saada käytettäväksi KML-muodossa vaikkapa Google Earthin päällä.

    Lisää pohdintaa Janne Aukian blogissa: Julkishallinnon tietomassat avoimiksi!
    http://janne.aukia.com/kuutio/?p=1214.

  38. En tiedä ketkä Tilastokeskuksen maksullisten palveluiden asiakkaat ovat, mutta olettaisin että esimerkiksi ETLA, EK, SAK, Pellervon taloudellinen tutkimuslaitos ja monet muut yhdistykset ja yritykset ovat myös asiakkaita. Eli kyllä se maksullinen toiminta tuo valtiolle myös ihan oikeasti rahaa. Varmaan kunnat ja valtio ovat kuitenkin tärkeimmät asiakkaat.

    Rahan siirtely valtion taskusta toiseen kuulostaa tyhmältä, mutta kyllä siitäkin on hyötyä. Se mahdollistaa tehokkaan johtamisen, kun voidaan nähdä mitkä ovat toiminnan todelliset kustannukset. Jos VATT haluaa tilata Tilastokeskukselta jonkun hienon tilastollisen selvityksen, sen kulujen pitää näkyä VATT:in budjetissa menopuolella, jotta pystytään kärryillä siitä, kuinka paljon VATT maksaa veronmaksajille. On toki pelko että maksut aiheuttavat hyvinvointitappiota tiedon alikäytön kautta, mutta jos kaikki jotka sitä dataa tarvitsevat maksavat maksun, niin hyvinvointitappiota ei synny. Hyvinvointitappio ei ole mikään vääjämättömyys.

    Palvelun maksullisuus välittää myös Tilastokeskukselle arvokasta tietoa siitä, kuinka paljon ja millaista dataa tarvitaan. Se tieto on arvokasta. Resurssien kohdistaminen oikein on hankalaa. Maksavien asiakkaiden vaatimukset ovat resurssien allokoinnissa hyviä työvälineitä. Kaikki on helpompaa jos oletetaan täydellisesti toimintaansa optimoiva julkinen sektori, mutta se ei ole realismia. Kyllä siellä tarvitaan informaatiota ja hintoja allokoinnin avuksi.

    Missään nimessä kaiken tiedon ei pidä olla maksullista. Tästä kaikki on varmasti samaa mieltä. Valtaosa tilastoista onkin vapaasti saatavilla. Maksullinen toiminta on hyvin pieni osa Tilastokeskuksen toimintaa, ja siitäkin valtaosa on sellaista räätälöityä työtä jota ei voi järkevästi jakaa kaikelle kansalle (ellei sitten perusta jotain ”äskettäin pyydettyjä datoja” osastoa, mutta sellainen ei olisi kovin käyttäjäystävällinen), eikä sen tiedon jakaminen ilmaiseksi olisi edes kovin reilua. Jos jonkun pitää maksaa datasta, ei ole oikein että kaikki muut saavat sen sitten heti ilmaiseksi. Sellainen aiheuttaa vapaamatkustajaongelmaa ja sitä kautta tehokkuustappiota. On olemassa jonkun verran näitä maksullisia vakiopalveluita, esimerkiksi Tilastollinen vuosikirja ja erilaisia tietokantoja, mutta valtaosa tiedoista on tosiaan saatavilla ilmaiseksi. Ne muutamat maksulliset auttavat kohdistamaan kustannuksen oikeaan instanssiin ja allokoimaan Tilastokeskuksen resurssit tehokkaasti.

  39. Opiskellessani huomasin, että St. Louis Fedin tietokannat sisältävät erittäin hyvät aikasarjat monesta taloudellisesta muuttujasta. Näitä oli hyvä käyttää ekonometrian/tilaston harjoituksissa.

    Tilastokeskuksella ei ole vastaavia aikasarjoja tarjolla, eikä myöskään yhtä helposti löydettävässä ja käytettävässä muodossa.

    Kyllä niiden tietovarastojen muodostaminen pitäisi olla helpompaa ainakin noiden makrosarjojen osalta.

    Tietysti yksilöitä koskevia asioita tai tarkkoja yritystietoja sisältävät tietokannat pitääkin olla tarkan suojakäytännön alla.

  40. Tämä keskustelu kiteytyy kainoon kansalaisten toiveeseen, että Tilastollinen vuosikirja voitaisiin saada jossain mielekkäässä muodossa ilmaiseksi verkkoon. Ainakaan PDF ei liene hankala toteutus. Vai onko paperiversion tuottaminen Tilastokeskukselle niin tuottoisaa, että moista ei voida harkita? Veikkaan että ei ole (ja yleensä erehdyn kun veikkaan). Ilkan mainitsemien tutkimuslaitosten yms. kirjaostoksista tuskin kertyy kovin montaa lanttia.

    Tällaisen opuksen kohdalla on vaikea kuvitella, että ihminen ostaisi tai lainaisi paperikopion, jos sähköinen versio on saatavilla. (Ei näitä iltalukemiseksi hankita.) Sikäli mahdollisten myyntivoittojen menettämisen pelko voisi motivoida Tilastokeskusta maksullisuuteen. Mutta tosiaan: kuinka paljon keskus todella tällä teoksella tienaa suhteessa budjettiin?

  41. Tilastojen maksullisuus rajoittaa yksityisiä toimijoita kehittelemästä uusia käyttötapoja tilastoille. Nykytilanteessa on mahdotonta arvioida hyvinvointitappiota tilastojen maksullisuudesta, kun tilastojen hyödyntämisen kustannukset ovat yksityisille toimijoille monesti liian korkeat. Itse näkisin että vapaasti tietokannasta saatavilla olevat tilastot voisivat luoda paljon hyvinvointia luovia uusia palveluja, joihin verrattuna verorahoin kerättyjen tilastotietojen aiheuttamat kustannukset olisivat marginaalisia.

    Eettisten periaatteiden taakse piiloutuminen taas ei argumenttina vakuuta. Itse ainakin luovuttaisin tietojani mieluummin täysin vapaasti hyödynnettävään (anonymisoituun) tietokantaan kuin tilastolaitoksen monopolitilastoihin.

  42. Tässä kun tavallisena teknikkona olen viime vuosia tarkkaillut työttömän silmin, niin on tullut sellainen ajatus pintaan, että kuinka paljon virheellisten tietojen (tilastojen) perustella voidaan vaikuttaa päättävien/korkeittein virkamiesten
    ajatteluun ja sen myötä heidän toimintaansa ja laisäädäntötyöhönsä.

    Sitten vielä tämä päälle, että virastojen työntekijäthän ovat tänään osaltaan tilastolukujen syöttäjiä tietokantoihin samalla kun käsittelevät kansalaisten asioita.

    Mitä tulee tilastokeskuseen, niin eihän tilastokeskuksella käsittääkseni ole mitään tekemistä suoraan sen tiedon kanssa, mitä ministeriöiden virkamiehet tietokoneillaan prosessiaan käsitellessään suoraan syöttävät ”ministeriöitten” tietokantoihin.

    Eikö myös suurien tietomäärien kerääjiä ja tuottajia ole STAKES, TEM ja STM.

    Että puoluetoimistot eivät sitten pääse muka ym. minsiteriöiden tietoihin eikä analysoimiin lopputuloksiin.

    No kuinkahan on, että livahtaako tietoja yo. datan hallitsijoilta esim. vaalien alla poliittisille puolueille.

  43. Artturi:Näitä hyvinvointitappioita pitää verrata niihin tappiohin joita syntyisi, jos data jaettaisiin ilmaiseksi ja toimintakustannukset katetaan verovaroista. Ei ole itsestään selvää kummat ovat suuremmat.

    Mihin ihmeen tappioihin? Jos data jaettaisiin ilmaiseksi, niin toimintakustannuksien kattamiseen ei tulisi juuri lainkaan vähempää rahaa. Noista kerätään julkisen sektorin ulkopuolelta niin vähän rahaa, että sillä ei ole mitään merkitystä. On täysin itsestäänselvää kumpi on suurempi paha.

    Ja vastauksena kansanedustajien junamatkoihin, niin jos kansanedustajan junalippu maksetaan jostain kulukorvauksista, joiden hyväksyttäminen on pienenkin paperityön takana, niin olisi kaikkien kannalta parempi, että saisivat vain matkustaa ilmaiseksi, koska se paperinpyörittely ja rahan siirtäminen taskusta toiseen ei ”kata” mitään menoja.

  44. Tilastoista ei paljon iloa ole, jos tarpeeksi suuri ja vaikutusvaltainen ryhmä on päättänyt jättää tilastot huomioimatta, esimerkkinä vaikkapa perheväkivalta. Sekä media että STM:n kaltaiset viralliset ja Amnestyn kaltaiset puoliviralliset tahot toitottavat vuodesta toiseen, että 90% prosenttia perheväkivallasta on miesten tekemää. Palkitsipa ”Tasa-arvon neuvottelukunta” juuri hemmon, joka väittää osuuden olevan lähemmäs sataa.

    Lukuisat tutkimukset ja niistä tehdyt meta-analyysit ovat kuitenkin osittaneet, että oikea osuus on noin 50% tai vähän alle. Tämä tieto on kaikkien saatavissa, mutta harvaa se tuntuu kiinnostavan.

    Heidi Hautala, muuten, ojensi TANE:n palkinnon sen sijaan, että olisi korjannut tolkuttoman väitteen.

    Tästä tulee mieleen toinen esimerkki. Suomi on kuulemma poikkeuksellisen väkivaltainen maa. Presidenttiä ja pääministeriä myöten kaikki tuntuvat olevan asiasta yhtä mieltä.

    Haastattelututkimusten mukaan maamme on kuitenkin — näkökulmasta riippuen — väkivallan suhteen EU:n keskikastia tai EU:n väkivallattomimpiin maihin kuuluva. ”Turvallinen Suomi” ei ole myytti.

    Mielenkiintoinen kysymys on, miksi jotkut suomalaiset haluava pitää Suomea poikkeuksellisen väkivaltaisena (siis feministejä lukuun ottamatta, joiden syy valehdella tiedetään).

  45. Tässä vielä yksi esimerkki vajaasta integriteetistä yhteiskunnallisesti. Johanna Kantola valittiin juuri Vuoden tieteentekijäksi. En tunne hänen tieteellisiä ansioitaan, mutta ainakin hän on valmis uusintamaan myyttiä suomalaisen miehen poikkeuksellisesta väkivaltaisuudesta. Kommentti The Guardianista:

    ”According to Finnish sociologist Johanna Kantola, Finland has the highest level of domestic violence in western Europe with 40% of women having experienced violence at the hands of men.”

    Todettakoon, että sellaista luotettavaa tutkimusta, joka vertailisi perheväkivallan yleisyyttä Länsi-Euroopassa ei ole olemassa. Varmaa kuitenkin on, että 40% naisista ei ole kokenut väkivaltaa miesten taholta — jos väkivallaksi ei sitten määritellä vinoa katsetta etc.

    Ylioppilaslehdessä Kantola kertoi muun paskan ohella:

    ”Tilastot puhuvat silti karua kieltään. Suomalaiset miehet ovat väkivallan tekijöitä naisia, lapsia ja miehiä kohtaan.”

    Miehet ovat toki kaduilla naisia väkivaltaisempia. Perheissä väkivalta jakautuu aika tasan — paitsi kaikkein puolustuskyvyttömimpien kohdalla. Pikkulapsia nimittäin pahoinpitelee ja tappaa nainen selvästi miestä useammin.

    Tämä sattui Kantolalta unohtumaan.

    Ei tiedä pitäisikö itkeä vai oksentaa, mutta missään nimessä en koskaan kirjoittaisi, että suomalainen nainen on tilastojen mukaan lastentappaja.

  46. Tiedemies:”Jos data jaettaisiin ilmaiseksi, niin toimintakustannuksien kattamiseen ei tulisi juuri lainkaan vähempää rahaa.”

    No mistä sä nyt tämän päättelit? Tämähän voi tarkoittaa, että hintaa pitäisi nostaa, eikä laskea riippuen juuri tuosta ilkan esille nostamasta vaihtokaupasta verotuksen aiheuttamien hyvinvointitappioden ja yli marginaalikustannusten hinnoittelun välillä ja tämän lisäksi maksullisuus tuottaa tietoa kustannuksista julkisen sektorin sisällä kuten ilkka kirjoitti myöhemmin.

    Sinulla on nyt tämän asian suhteen ihan ihmeellinen asenne, että näitä hyötyjä ei saa mainita tai pohtia ollenkaan. Ikään kuin tämä olisi ihan oikeasti ilmainen lounas.

    Väität, että datalla ei saada kerättyä yksityiseltä sektorilta juuri mitään rahaa, mutta samalla, että data on niin kallista, että se aiheuttaa suuria hyvinvointitappiota, eli että meillä on paljon porukkaa, joita data hyödyttäisi vähän. Millä perusteella?

  47. ”Miehet ovat toki kaduilla naisia väkivaltaisempia. Perheissä väkivalta jakautuu aika tasan — paitsi kaikkein puolustuskyvyttömimpien kohdalla. Pikkulapsia nimittäin pahoinpitelee ja tappaa nainen selvästi miestä useammin”

    Naisten surmissa Suomi on kuitenkin länsi-Euroopan pahin. Lasten surmissa ei mitenkään poikkeava

  48. ”Ei tiedä pitäisikö itkeä vai oksentaa, mutta missään nimessä en koskaan kirjoittaisi, että suomalainen nainen on tilastojen mukaan lastentappaja.”

    Kannattaa lukea tällainenkin teos, Kantola käyttää samaa aineistoa .

    ”Venla Salmi & Martti Lehti & Reino Sirén &
    Janne Kivivuori & Mikko Aaltonen
    Perheväkivalta Suomessa”

  49. Airbag:
    ”Nykytilanteessa on mahdotonta arvioida hyvinvointitappiota tilastojen maksullisuudesta, kun tilastojen hyödyntämisen kustannukset ovat yksityisille toimijoille monesti liian korkeat.”

    Ei se hyötyjen arviointi sen helpommaksi muutu jos kaikki tarjotaan ilmaiseksi. Kukaan ei tiedä mikä on vaikkapa kuolinsyytilaston tuoma hyöty. Kyselyt paljastavat tietysti että se on käyttäjien mielestä todella arvokas, mutta se ei auta Tilastokeskusta päättämään pitäisikö siihen satsata enemmän vai vähemmän rahaa. Nyt kun maksulliset toimeksiannot on mahdollisia, voi asiakkaat ostaa vaikkapa ammateittain jaotellun kuolinsyytilaston koska kokevat sen tärkeäksi (en tosin keksi missä tarkoituksessa). Nämä ostot tarjoavat informaatiota, jonka perusteella voisi joskus tulevaisuudessa ehkä lisätä ammattiluokituksen tilaston normaaliin julkaisuun. Maksullinen toiminta tuo informaatiota todellisesta hyödystä. Lähtökohtaisesti kehittämistarpeita ja uusien tilastojen tarpeita on loputtomasti. Valinta mihin niistä satsataan on hankala. Jos maksullinen toiminta auttaa siinä ilman että se aiheuttaa merkittäviä hyvinvointitappioita, niin hyvä.

    Austrian:
    ”Opiskellessani huomasin, että St. Louis Fedin tietokannat sisältävät erittäin hyvät aikasarjat monesta taloudellisesta muuttujasta. Näitä oli hyvä käyttää ekonometrian/tilaston harjoituksissa.”
    St. Louis Fedin tietokannat ovat loistavia. Myös Philadelphia Fedillä on hyviä tietokantoja. En tiedä minkälaiset resurssit heillä on, mutta veikkaan että USAssa on tilastotoimella resursseja yhtä paljon kun EU:ssa yhteensä, mutta tilastoitavia maita 27 kertaa vähemmän. Historiallisen aikasarjan muodostamisen ja jakelun kustannusten kannalta on suurinpiirtein yhdentekevää kuvaileeko se aikasarja USAn vai Suomen kokoista maata. Sama määrä indeksi-pistelukuja pitää kaivaa vanhoista paperijulkaisuista ja huomioonotettavia menetelmä-, määritelmä-, luokitus-, ym. muutoksia on kummassakin tapauksessa suurinpiirtein yhteä paljon. Eli on ihan ymmärrettävää että suurella maalla on paremmin varaa tällaiseen työhön kun pienellä. Sellaisten laatiminen vaikuttaa helpolta, mutta todellisuudessa sekin on yllättävän hankalaa ja hidasta. Ehkä jotain kuvastaa että teen nyt töitä sen eteen, että EKP:n käyttämät ”core-inflation”-aikasarjat alkaisivat ennen vuotta 1990. Luulisi että keskuspankilta ei resurssit loppuisi kesken ja tämä olisi sellainen tärkeä tilasto johon olisi panostettu jo aikoja sitten, mutta muilta kiireiltä ei ole ehditty.

    EU yhteistyö on vaatinut paljon työtä tilastojen harmonisoimisessa ja EU-agregaattien muodostamisessa. Nämä ovat olleet ehdottoman tärkeitä töitä, mutta vievät toki resursseja esimerkiksi pitkien aikasarjojen tuottamiselta. Normaali tuotantotyö on kuitenkin ensisijalla, sitä ei voi tehdä myöhemmin. Historialliset aikasarjat voi yhdistää toimivaksi kokonaisuudeksi oikeastaan koska vaan, eli se on työnä sellainen joka on helposti pysyvästi to-do pinon alimmaisena. Lyhyet aikasarjat eivät ole mikään Suomen uniikki-ongelma, vaan realiteetti ympäri Eurooppa. Itseasiassa ainakin niissä aikasarjoissa mitä minä olen käsitellyt, Suomen tilanne on parempi kun monella suuremmalla maalla.

    Eli ne lyhyet aikasarjat joihin voi törmätä ei johdu pelkästään Tilastokeskuksen tietojen pimittämisestä tai laiskuudesta, vaan rajallisten resurssien asettamista rajoitteista. Suurilla mailla on varaa satsata moniin asioihin enemmän. Tilastomiehen toki kannattaisin huomattavasti suurempaa budjettia Tilastokeskukselle, mutta se ei tässä valtion tuottavuusohjelman -maailmassa ole realismia. Eikä se välttämättä olisi yhteiskunnan edunkaan mukaista. Olisi sille rahalle varmasti muutakin käyttöä.

  50. Naisten surmissa Suomi on kuitenkin länsi-Euroopan pahin. Lasten surmissa ei mitenkään poikkeava

    Tää on ikävä kyllä esimerkki tilastojen väärinkäytöstä. Selvennetään (vaikka joku tilastotieteilijä olisikin parempi tässä):

    Ensinnäkin miehet eivät tapa naisia vaan jotkut todella harvat miehet (ja naiset) tappavat.

    Toiseksi, henkirikokset ovat Suomessa (tai, tarkemmin sanottuna, tietyissä osissa Suomea) yleisempiä kuin muissa Länsi-Euroopan maissa. Siksi ei ole yllätys, että naisiakin tapetaan enemmän.

    Kolmanneksi, äitinsä (tai isänsä) rääkkäämää lasta ei paljon ilahduta teoreettiset pohdinnat väkivallan jakautumisesta.

    Kantola ei muuten käytä aineistonaan Perheväkivalta Suomessa -tutkimusta, koska se julkaistiin vasta tänä vuona ja Kantolan paskanjauhanta on vanhempaa perua — tai siis mitä väliä, parisuhteissa naiset ovat jonkin verran miehiä väkivaltaisempia meta-analyysien mukaan. Nuoret naiset ovat moninkertaisesti väkivaltaisempia kuin nuoret miehet.

  51. Mahtava avaus Osmolta!

    Julkisen datan kysymys on paljon tilastoja laajempi. Dataa kannattaa saattaa enemmän jakoon raakamuodossa, ilmaiseksi, rajapintojen kautta jne.

    MUTTA: Avaamistyötä ei tarvitse aloittaa vaikeimmasta päästä eli nykyisin maksullisista datoista ja sitä ei pidäkään ulottaa mihinkään yksityisyydensuojaa vaarantavaan.

    Data on informaatioajan yhteiskunnassa raaka-ainetta, kuitenkin sillä erotuksella, että sen antaminen jollekin ei ole suoraan pois antajalta.

    Einsteinin kuuluisa lause pätee: ”Jos minä annan sinulle pennin, olet sinä pennin rikkaampi ja minä taas pennin köyhempi. Mutta jos annan sinulle idean, on sinulla uusi idea, mutta minulla on edelleen omani.”

    Tämä ei tietenkään poista sitä tosiasiaa, että esim. tilastodatan tuottaminen (vrt. metsänhoito tai soran kaivuu) vaatii myös resursseja. Tapauskohtaisesti kannattaa miettiä, että onko resursointi kannattavaa tehdä valtion subventiona vai tarvitsija maksaa periaatteella.

    Suuri osa julkishallinnon tuottamasta datasta on kuitenkin hallinnon omiin tarpeisiin (tieverkon tiedot, rekisteri anniskelupaikoista, ympäristömittaukset) tai erityisesti avoimuuden lisäämiseksi ja kansalaisten hyödyksi koostettu (lainsäädäntö, julkiset hankinnat, eduskunnan tilastot, junien aikataulut).

    Tällaisissa tapauksissa data pitäisi ehdottomasti jakaa ilmaiseksi eteenpäin, koska se voisi hyödyttää jotakuta muutakin ja sen jakaminen ei ole antajalta pois mitenkään.

    Vallitseva käytäntö on, että julkishallinto pyrkii jalostamaan datasta kansalaisia hyödyttäviä palveluita (portaaleja) sen, minkä kerkiää, mutta itse dataa ei ole tajuttu antaa.

    Tämä on kuitenkin maailmalla ja Suomessakin muuttumassa vauhdilla. Yhdysvalloissa avattiin loppukeväästä http://www.data.gov sivusto ja sen jälkeen vain parissa kuukaudessa on erilaisia kaupunkien ja maiden (mm. Ruotsissa on http://www.opengov.se) datakatalogeja syntynyt kuin sieniä sateella.

    Olen työskennellyt nyt puoli vuotta julkisen datan avoimuuden parissa. Aikaansaannokset ovat toistaiseksi:

    * Pienenpieni Suomalainen datakatalogi (koostamiseen meni noin kuukauden täysipäiväinen työ!) http://www.suomi.fi/datakatalogi

    * Julkisen datan hyödyntämiseen tähtäävä kilpailu: http://www.mindtrek.org/2009/democracy_finland

    * Avoimet (joskus jopa innostuneet) keskusteluyhteydet asiasta mm. ministeriöihin (LVM, TEM) , pariin kaupunkiin, kirjastoon, YLE:en, Sitraan, jne.

    * Alustava suunnitelma Suomalaisen avoimen datan ekosysteemin (datan tuottajat ja käyttäjät boostavat toistensa toimintaa) synnyttämiseen.

    Toivotan kaikki asiasta kiinnostuneet ottamaan minuun yhteyttä esim. antti.poikola miumau gmail.com

  52. Ilkka:
    Ei se hyötyjen arviointi sen helpommaksi muutu jos kaikki tarjotaan ilmaiseksi. Kukaan ei tiedä mikä on vaikkapa kuolinsyytilaston tuoma hyöty. Kyselyt paljastavat tietysti että se on käyttäjien mielestä todella arvokas, mutta se ei auta Tilastokeskusta päättämään pitäisikö siihen satsata enemmän vai vähemmän rahaa. Nyt kun maksulliset toimeksiannot on mahdollisia, voi asiakkaat ostaa vaikkapa ammateittain jaotellun kuolinsyytilaston koska kokevat sen tärkeäksi (en tosin keksi missä tarkoituksessa). Nämä ostot tarjoavat informaatiota, jonka perusteella voisi joskus tulevaisuudessa ehkä lisätä ammattiluokituksen tilaston normaaliin julkaisuun. Maksullinen toiminta tuo informaatiota todellisesta hyödystä. Lähtökohtaisesti kehittämistarpeita ja uusien tilastojen tarpeita on loputtomasti. Valinta mihin niistä satsataan on hankala. Jos maksullinen toiminta auttaa siinä ilman että se aiheuttaa merkittäviä hyvinvointitappioita, niin hyvä.

    Argumenttisi on osittain ihan pätevä, mutta itse olen vahvasti sitä mieltä että vapaat tilastot olisivat nykytilannetta paljon parempi vaihtoehto. Kuten itsekin myöntänet, ei nykytilassakaan eri tilastoja voida käytännössä arvottaa hinnan mukaan. Osa tiedoista on sellaisia että niitä kerätään, tietämättä oikeastaan kuka tai mikä hyötyy. Nykytilassa siis mainitsemasi maksullisuuden hyödyt jäävät kuitenkin lunastamatta.

    Itse näkisin että tietokantana (SQL tms.) vapaa tieto parantaisi eri toimijoiden mahdollisuuksia hakea itselleen merkityksellistä tietoa. Se, että tilastokeskus ei erillistä ammatillisesti jaoteltua kuolinsyytilastoa tee, ei tuossa tilanteessa haittaisi, kunhan raakadatasta ilmenisi sekä kuolinsyy että ammatti.

    Mikään ei estä tilastokeskusta keräämästä erityisiä tietoja ja tekemästä näiden perusteella tilastoja toimeksiantojen perusteella, vaikka itse tietokannat olisivatkin vapaasti saatavilla. Tässä tilanteessa tietojen analysointi tulisi kilpailluksi alaksi ja palvelujen taso paranisi.

  53. Airbag:
    Yksityisyyden suoja ehdottomasti estää yksilötason tiedon laittamisen mihinkään julkiseen SQL-tietokantaan. Vaikka sieltä poistettaisiin nimet ja sosiaaliturvatunnukset, on lähes jokainen henkilö helposti tunnistettavissa esimerkiksi osoitteen, syntymäajan, ammatin, työpaikan, koulutuksen, perheen koon, asunnon suuruuden, kuolinpäivän, ym. yhdistelmän perusteella. Näitä eri tilastoja ja rekisterejä yhdistelemällä voi tehdä vaikka mitä mielenkiintoista tutkimusta, mutta yksityisyyden suoja ehdottomasti estää mikrotason datan laittamisen nettiin. Tämä yksityisyyden suoja on oikeasti tärkeä asia.

  54. ”En tiedä minkälaiset resurssit heillä on, mutta veikkaan että USA:ssa on tilastotoimella resursseja yhtä paljon kun EU:ssa yhteensä, mutta tilastoitavia maita 27 kertaa vähemmän. Historiallisen aikasarjan muodostamisen ja jakelun kustannusten kannalta on suurin piirtein yhdentekevää kuvaileeko se aikasarja USA:n vai Suomen kokoista maata.”

    Tämä nyt osoittaa jo melkomoista tietämättömyyttä USA:n rakenteesta. Kyseessä on todellakin valtioiden muodostama liitto, jossa on 50 osavaltiota ja Puerto Rico ja muut merentakaiset alueet. Yhteistä näille on se, että jokaisesta valtiossa tai kuten suomeksi sanotaan osavaltiossa, on oma tilastotoimensa ja lisäksi liittovaltio pitää omia tilastoja. Ronskisti sanoen tilastoitavia maita on kaksinkertainen määrä Euroopn unioniin verrattuna. Kun Suomea pitää aina verrata koko USAn liittovaltioon, niin olisiko kuitenkin järkevämpää ottaa vertailukohteeksi joku USAn valtioista, joka väestömäärältään ja taloudeltaan vastaa suurin piirtein Suomea?

    Ensi vuonna on muuten taas kaikkien tilastointien äidin eli USAn liittovaltion väestölaskenta.

    http://2010.census.gov/2010census/

    Ihan mielenkiinnon vuoksi kannattaa lukea millaisesta operaatiosta on kyse, kun kansalaisten tietosuoja on aivan eri tasolla kuin meillä. Suomessahan viranomaisrekistereitä on kymmeniä ja niistä ei ikinä pääse eroon jos systeemiin on joutunut.

  55. antikepu:
    En tiedä mistä olet tuollaista tietoa saanut. Yhdysvallat toki muodostuvat monesta osavaltiosta, mutta se ei tarkoita että tilastotoimi olisi hajautettu osavaltioihin. Vertaillaan Yhdysvaltojen liittovaltion, Suomen ja EUn tilastotoimen kustannuksia:
    USAn liitovaltion tilastotoimen kokonaiskustannukset: n. 6000 miljoonaa dollaria (Census-vuonna paljon korkeampi)
    Suomen valtion tilastotoimine kustannukset: n. 71 miljoonaa euroa
    Eurostatin budjetti: 45 miljoonaa euroa (tai 64 miljoonaa euroa)

    Vertailisin mielelläni osavaltioiden tilastolaitoksiin myös, mutta en löytänyt sellaista ainakaan Pennsylvaniasta. Tai siis tällainen löytyi (http://pasdc.hbg.psu.edu/pasdc/About_the_PaSDC/Staff.html), mutta se näyttää olevan kymmenen hengen pulju jolla ei taatusti ole mitään relevanttia roolia tilastojen tuottamisessa.

    Lähteet:
    http://www.whitehouse.gov/omb/assets/information_and_regulatory_affairs/09statprog.pdf
    http://www.stat.fi/org/tilastotoimi/katsaustilastotoimeen.html
    http://epp.eurostat.ec.europa.eu/portal/page/portal/about_eurostat/corporate/organisation

    Eli siis Tilastokeskuksen budjetti on suurempi kun Eurostatin. Se kuvastaa kuinka kansallista tilastojen tuotanto on EUssa. Käytännössä jokainen tilasto tuotetaan ja julkaistaan ensin kansallisesti, Eurostat vain agregoi ne yhteen ja julkistaa EUn yhteisen luvun myöhemmin. Amerikassa liittovaltion tilastotoimen budjetti on sata kertaa suurempi kun Eurostatin. Voi toki olla että Amerikassa myös osavaltiot käyttävät paljon rahaa tilastojen tuotantoon, mutta kun liittovaltion menot ovat tuollaisia, en jotenkin jaksa uskoa että niille jää kovin suurta roolia. En jaksa muiden EU maiden tilastobudjetteja selvittää, mutta per capita Suomen ja USAn tilastotoimen budjetit ovat aika lähellä. Sillä perusteella voidaan ehkä perustellusti olettaa että EUn ja Yhdysvaltojen tilastotoimen kokonaismenot ovat samaa luokkaa. Erona kuitenkin se, että Yhdysvalloissa menot ovat keskitettyä liittovaltiotasolle kun taas EUssa ne ovat jakaantuneet 27 maahan. On huomattavasti yksinkertaisempaa laskea yksi kuluttajahintaindeksi tilasto ja tehdä siitä sitten jälkeenpäin alueellisia jakoja, kun laskea 27 erillistä kuluttajahintaindeksiä ja myöhemmin yhdistää ne yhteen. Sen takia Suomessakin Tilastokeskus laskee kaikki tiedot keskitetysti Kalasatamassa, eikä joka kaupungissa ole omaa tilastolaitosta laskemassa alueen tietoja jotka sitten yhdistellään Tilastokeskuksessa. Helsingin Tietokeskus käyttää lähinnä Tilastokeskuksen keräämiä tietoja, ei päinvastoin. Tässä mielessä EUn tilastotoimi on todella tehoton. Siihen on toki paljon hyviä syitä, mutta se selittää minkä takia Yhdysvalloissa tilastotoimen tulokset ovat hienompia.

    On helppo erehtyä luulemaan että EU ja USA ovat samanlaisia itsenäisten valtioiden liittoja, mutta niillä on oikeasti eroa kuin yöllä ja päivällä. Yhdysvalloissa keskushallinnon rooli on paljon tärkeämpi ja esimerkiksi tilastotoimen skaalaetujen kohdalla siitä on runsaasti iloa. Näiden skaalaetujen tärkeys korostuu etenkin tilastojen jatkoprosessoinnissa, vaikkapa kausitasoitusten, historiallisten aikasarjojen tai julkisten tietokantojen tekemisessä. Varsinaisessa aineiston keruussa tai sen laadun tarkastamisessa skaalaedut eivät ole kovin suuret, mutta valmiiden aikasarjojen käsittelyssä perusjoukon koolla ei ole mitään väliä.

  56. Soininvaaran ehdotus on hyvä ja on kummaa, että asiasta ei ole keskusteltu enempää. Nykytilanteessa Tilastokeskuksella on paljon verovaroin tuotettuja valmiita tilastoja ”varastoissa”, joista niitä ei anneta niistä kiinnostuneiden käyttöön ilmaiseksi. Ilkka puolustaa sinnikkästi Tilastokeskuksen nykykäyttäntöä. Olen tavannut kuitenkin viimeisten 10-15 vuoden aikana lukuisia Tilastokeskuksen edustajia, jotka ovat valmiita laajentamaan tilastojen ilmaista käyttöä. Tiettävästi Tilastokeskus on käynyt asiasta neuvotteluja useammankin kerran valtiovarainministeriön kanssa. Ne eivät ole kuitenkaan johtaneet vielä myönteisiin tuloksiin. Altikan eli aluetietokannan ilmaiskäyttöön saamista tai sitten Statfin-järjestelmään liittämistä on pidetty yleisesti tärkeänä, mutta hanke ei ole juurikaan edennyt moneen vuoteen.
    Ilkan tulonsiirtovertailu on mielestäni asioiden suuruusluokkan tähden ”hupaisa”. Orpojen ja muiden vähäväkisten elinolojen parantaminen on toki tärkeätä. Niitä ongelmia ei kuitenkaan ratkaista tilastojen jakelusta saatavilla muutamilla miljoonilla euroilla. Ilkka toteaa, että Tilastokeskuksen tietojen keruu perustuu kyselyihin kansalaisilta ja yrityksiltä. Sitäkin toki tehdään, mutta suurelta osin tilastot perustuvat eri tahoilta saataviin rekistereihin. Tilastotietojen huono saatavuus heikentää erityyppisten tutkimusten ja suunnitelmien tekemistä. Monissa kunnissa tämä huono saatavuus ja tilastojen vähäinen käyttö ovat johtaneet myös siihen, että esim. asuntokantaa ja asunto-oloja koskevat peruskäsitteetkin ovat jo pahasti unohtumassa.

  57. Kyllä niillä osavaltioilla on jokaisella ihan omat perustuslakinsa, kansanedustuslaitoksensa, oikeuslaitoksensa jne. Puolustus on ulkoistettu US armylle, mutta osavaltioilla on silti oma miliisinsä tai kansalliskaartinsa. Nyt ollaan jo hyvin lähellä itsenäisen valtion tunnusmerkkejä. Rajoituksena on vain, että osavaltion perustuslaki ei saa olla ristiriidassa Liitovaltion perustuslain kanssa. Noin yleisesti ottaen osavaltiot tekevät hyvin itsenäistä hallintoa ja ulkomaailmaan näkyy vain tuo liittovaltiotaso. Myös tilastotoimistoja löytyy esimerkiksi Marylandista:

    http://www.mdp.state.md.us/Msdc/

    Tietysti on järkevää käyttää myös liittovaltiotason keräämää dataa, ja siksi tuossakin linkissä mainitaan, että kyse on partnershipistä.

  58. OlaL:
    Tottahan toki Tilastokeskus haluaa lisätä omaa budjettiaan! Mikä tahansa organisaatio haluaisi että valtio rahoittaisi heidän tuotteensa. Jos jokainen virasto saisi itse sanella oman budjettinsa, Suomen valtion budjetti olisi varmasti monta kertaa suurempi kun BKT. Hyviä rahareikiä on loputtomasti.

    Maksullisuudella on ihan hyviä perusteita, kuten on toki ilmaiseksi jakamisellakin. Olen tässä keskustelussa painottanut maksullisuuden hyötyjä, koska se näkökulma on muuten jäänyt kohtuuttoman vähälle. Useat ovat argumentoineet ikään kuin olisi täysin itsestään selvää että kaikki kannattaa jakaa ilmaiseksi. Totuus ei ole lainkaan niin yksioikoinen. Voi olla että Altikan siirtäminen ilmaiseksi olisi oikeasti järkevää, en siitä tiedä. En mihinkään yksittäistapaukseen voi ottaa kantaa kun en niistä mitään tiedä.

    Ei näillä Tilastokeskuksen rahoilla varmasti maailmaa pelastettaisiin, mutta ei maksullisuuden aiheuttamilla hyvinvointitappioillakaan saateta Suomea tuhoon. Summat ovat pieniä joka suuntaan.

  59. antikepu:
    Olen ihan hyvin perillä Yhdysvaltojen poliittisesta rakenteesta, kiitos. Asuin siellä monta vuotta ja sain opiskella siellä koulussa sekä USAn historiaa että poliittista järjestelmää.
    Tuo sinun löytämäsi Marylandin tilasto-osasto on ilmeisesti viiden hengen organisaatio (lista työntekijöistä: http://www.mdp.state.md.us/msdc/dw_msdcstaff.htm). Tuollaisella puljulla ei ole mitään tekemistä tilastotuotannon kanssa. Toki osavaltioilla on omat miliisinsä ja muuta omaa kivaa, mutta se ei muuta sitä tosiasiaa että Yhdysvalloissa tilastotoimi (ja moni muu asia) on keskitetty liittovaltio-tasolle, kun taas Euroopassa se on hajautettu jokaiseen jäsenvaltioon. Sen takia Yhdysvalloissa saadaan huomattavasti enemmän skaala-etuja ja siellä on paremmin varaa tuottaa erilaisia tietokantoja yleisön käyttöön.

    Sinulla on selvästi hiukan harhainen käsitys osavaltioiden roolista. Joskus 1800-luvulla ne oli ehkä vielä likimain verrattavissa itsenäisiin valtioihin, muttei enää. Jotain ehkä kuvastaa se, että liittovaltion budjetti on suhteessa BKThen neljä kertaa suurempi kun vaikkapa Marylandin. Euroopan Unionin budjetti sen sijaan on suhteessa BKThen kahdeskymmenes osa Suomen valtion budjetista. Eli tällä mittarilla Yhdysvalloissa liittovaltio on suhteessa osavaltioihin kahdeksankymmentä kertaa tärkeämpi kun Euroopassa.

  60. Presidentti saa määrätä kansalliskaartia vaikka osavaltioita vastaan, kuten on tapahtunutkin ainakin kansalaisoikeustaistelun aikana. Että se siitä itsenäisyydestä.

  61. Olen itsekin huomannut että joitakin triviaalejakin tietoja on vaikea löytää.

    Tilastokeskuksella voisi olla ilmainen? viikkotilastot -palvelu.

    Tiedon hakija tekee netissä haluamansa kyselyn tietokantaan. Nämä kyselyt menevät jonoon joka kerran viikossa tsekataan ja laitetaan ajoon. Vastauksen valmistuttua se julkaistaan netissä ”kansalaiskyselyt -sivulla” ja lähetetään linkki sähköpostiin.

    Kansalaiskyselyt ja niiden selaaminen antavat pienellä rahalla tietoa siitä mitkä asiat milloinkin kiinnostavat.

    Hakulausekkeen tekemiseen aivan varmasti löytyy vapaaehtoista työtä opensource yhteisöltä. Todennäköisesti netistä löytyy pian useampiakin robotteja joilla voi muodostaa hakulausekkeita. (Antaahan hakulausekerobotti myös ylläpitäjälleen ilmaista tietoa kansalaisten kiinnostuksen kohteista niin että esim puolueiden sivuilta näitä saattaisi löytyä.)

  62. Tilastokeskuksesta kuuluu hyviä uutisia. Se on laajentamassa tilastojensa ilmaisjakelua, mihin Soininvaara tähtäsi kirjoituksellaan. Monet ovat myös tukeneet hänen ehdotustaan. Tilastokeskuksen tiedote löytyy oheisen linkin kautta.
    http://www.stat.fi/ajk/poimintoja/2009-09-25_maksuttomatjulkaisut.html
    Vaikka laajentumista on nyt tapahtumassa, niin keskustelua asiasta tarvitaan jatkuvasti. Toivoa voi, että tilastojen sisällöstäkin syntyisi enemmän keskustelua. Monet tilastot eivät ole muuttuneet pariin kolmeen vuosikymmeneen. Eri rekisterien ja tietokantojen monipuolisempaan yhteiskäyttöön on kuitenkin tietotekniikan kehittymisen myötä paljon uusia taloudellisesti edullisia mahdollisuuksia.

  63. Tänään oli uutisissa tuoreita tilastokeskuksen väestöennusteita. Halusin katsoa primääritietoa, mutta mutta, jopa väestötilastot ovatko maksullisia!

    Jos näihin tilastoihin on käytetty äyriäkään julkisia varoja, tietojen pitää olla julkisia!

    http://www.tilastokeskus.fi/tup/vaesto_ennakko/index.html

    Tilaston kaupalliset käyttöehdot ovat naurettavat. Tilastokeskus on julkinen laitos, eikä yksityinen yritys. Suora lainaus Tilastokeskuksen sivuilta:

    ”Toiminta-ajatus
    Tilastokeskus yhdistää tietoaineistot ja asiantuntemuksen tilastoiksi ja tietopalveluiksi yhteiskunnan tarpeisiin, edistää tilastojen käyttöä ja kehittää kansallista tilastotointa.

  64. Suuri osa väestötilastoista on ilmaisia:

    http://www.tilastokeskus.fi/til/vrm.html

    Toki näiden tekemiseen käytetään verorahaa, mutta en silti ymmärrä minkä takia pitäisi kategorisesti kieltää tiedolla rahastaminen. On selvää että valtio tarvitsee näitä väestötilastoja, eli ne pitää tehdä verovaroin. Siinä vaiheessa kun ne on tehty, valtiolla on velvollisuus käyttää niitä järkevästi. Osan jakaminen ilmaiseksi on ehdottomasti järkevää, mutta jos myymällä tarkempia tietoja valtio voi kompensoida osan tilastojen tuottamisen kustannuksista, niin se on ehdottomasti harkitsemisen arvoinen ratkaisu. Etenkin jos on olemassa kaksi budjetti-neutraalia vaihtoehtoa:
    – tarjotaan perustieto ilmaiseksi tai
    – tarjotaan perustieto ilmaiseksi ja myydään jalostetumpaa tietoa lisämaksua vastaan
    Tällöin valtion kannattaa ehdottomasti valita jälkimmäinen. Olisi veronmaksajien rahojen tuhlaamista olla käyttämättä liiketoiminta mahdollisuutta. Olisi olemassa myös teoreettinen kolmas vaihtoehto:
    – tarjotaan perustieto ja jalostettu tieto ilmaiseksi
    mutta se on kalliimpi. Ei ole mitenkään itsestään selvää että veronmaksajien kannattaa se lisämaksu maksaa. ”Käyttäjä maksaa” -periaate on ainakin minun korvaan oikeudenmukaisempi kuin ”veronmaksajat maksaa” -periaate. Maksullisuus aiheuttaa varmasti hyvinvointitappiota alikäytön seurauksena, mutta sama ongelma on esimerkiksi tietokone ohjelmistoissa, musiikissa, kirjoissa, lääkkeissä ja melkein kaikilla toimialoilla. Useimmiten valtion ratkaisu näihin markkinavirheisiin ei ole ollut se, että veronmaksaja maksaa kaiken. Ei ole mitenkään itsestään selvää että sen pitäisi olla ratkaisu tilastotoimen rahoituksessakaan.

  65. Nyt Tilastokeskus lopettaa tilastoja säästääkseen rahaa:

    http://www.taloussanomat.fi/kansantalous/2009/10/20/tilastokeskus-lopettaa-monia-tilastoja/200922291/12

    Kuten sanottu, selvästikään tilastotoimella ei ole loputtomasti rahaa. Maksullisesta toiminnasta saatavat lisäpennoset ovat ehdottomasti hyödyksi. Tilastojen lopettaminen on aina todella ikävää, siinähän menetetään pitkä aikasarja johon on käytetty paljon resursseja. Kun sen aikasarjan kerran katkaisee, niin jos tulevaisuudessa halutaankin aloittaa tilasto uudestaan, kestää taas monta vuotta ennen kuin saadaan järkevän mittainen aikasarja jolla voisi jotain hyödyllistä analyysiä tehdä. Eikä sitä katkosta saada koskaan paikattua. Jos jotain asiaa ei nyt tilastoida, ei siitä ole tilastoja koskaan, vaikka siihen käytettäisiin kuinka paljon resursseja.

    Tilastojen siirtäminen maksulliseksi aiheuttaa ehkä jotain hyvinvointitappiota, mutta ainakin tutkijoiden käyttöön aikasarjat säilyvät katkeamattomina. Kun budjettisyistä tilastotuotanto on tällaisen uhan alla, tuntuu jotenkin hölmöltä valittaa maksullisuudesta. Virastot toimivat kuitenkin rajallisten resursseja maailmassa jossa pitää tehdä valintoja. Minä valitsisin koska vaan mielummin maksulliset tilastot kuin lakkautetut tilastot.

  66. Kartat tulivat julkisiksi. Miksi ei tilastot? Esimerkiksi kaupunki- ja seutuindikaattorit pitäisi saada kaikkien vapaaseen käyttöön:

    Kaupunki- ja seutuindikaattorit -tilastopalvelu on Tilastokeskuksen maksullinen Internet-palvelu, joka sisältää monipuolisesti kaupunkeja ja toiminnallisia kaupunkiseutuja kuvaavaa tilastoaineistoa. Tilastopalvelun tietosisältö on kehitetty yhteistyössä sisäasiainministeriön ja kaupunkien kanssa.

    Palvelussa on tilastoja ja indikaattoreita 13 aihepiiristä, mm. väestöstä, asumisesta, aluetaloudesta, työmarkkinoista, koulutuksesta, sosiaali- ja terveyspalveluista, kulttuurista, kunnallistaloudesta ja rakentamisesta. Taulukoita palvelussa on lähes 50.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Notify me of followup comments via e-mail. You can also subscribe without commenting.