Voisiko terveystietojen käytön tutkimukseen järjestää niin, että tutkija saa käyttöönsä anonymisoidut yksilötason tiedot ja väärinkäyttö tarkastetaan jälkikäteen niin, että kaikki tutkijan tekemät toimenpiteet tietokoneella nauhoitetaan ja jälkikäteen selvitetään, onko tutkija pyrkinyt murtamaan anonymisoinnin.
Suomessa on valtavan arvokkaita terveydenhuoltoon liittyviä tietovarantoja, jotka ovat täysin alikäytettyjä. Näiden tietojen antamiseen tutkijoiden käyttöön liittyy toisaalta merkittävä ongelma yksityisyyden suojan kannalta.
Toistaiseksi tietojen hyväksikäyttö on ollut mahdollista niin, että tutkija tarvitsee ensin tutkimusluvan, jonka saaminen voi kestää kuukausia. Tämän jälkeen hän pyytää THL:ää tekemään pyydetyn ristiin ajon kahden rekisterin välillä. Jos tulos osoittaa, että pitää ajaa vähän toisenlainen ajo, sama rutiini toistetaan.
Ymmärtääkseni sana ”tutkia” on peräisin pohjan tutkimisesta samean veden läpi tutkaimen avulla. [Tätä tietoa älköön lainattako ilman sen todenperäisyyden selvittämistä, koska en pysty muistinvaraista tietoa tarkistamaan. Etymologista sanakirjaa ei löydy kirjahyllystäni.] Nykykäytäntö tarkoittaa, että pyydetään lupa kokeilla, onko kivi tässä ja jos ei ollut, hakemaan uusi lupa sen selvittämiseksi, onko se siinä vieressä ja niin edelleen.
Empiiristä tutkimusta ei tehdä näin. Se edellyttää monenlaista aineiston tarkastelua, erilaisten ja yllättävienkin riippuvuuksien etsimistä ja yleensä kuvien piirtämistä riippuvuuden muodon selvittämiseksi. Pelkkien korrelaatoiden tulostaminen ei riitä, koska korrelaatio mittaa lineaarista riippuvuutta ja vain sitä. Tutkijan on saatava analysoida yksilökohtaista dataa.[1]
Esimerkiksi lääkkeiden yllättävien haitallisten yhdysvaikutusten etsiminen ei voi perustua ennalta määrättyihin hypoteeseihin, koska etsitään yllättäviä eikä oletettuja vaikutuksia.
Aineiston voi anonymisoida, mutta jos aineistoa tarkastelee hyvin monipuolisesti, anonymisoinnin voi kyllä murtaa. Kun oikein yrittää, kyllä se Anneli Auer on aineistosta tunnistettavissa. Siksi ollaan varovaisia.
Entä jos väärinkäyttöä valvottaisiin jälkikäteen ja yrityksen murtaa anonymisointi sanktioitaisiin niin, ettei kukaan sellaiseen ryhdy? Tutkija saisi kyllä käyttää yksilötason aineistoa, mutta kaikki hänen analyysinsa nauhoitettaisiin ja jälkikäteen tarkastettaisiinko, ovatko ne olleet asiallisia.
Kommentteja?
[1] Minun ainoa julkaisuni lääketieteen alalla on artikkeli yhdessä ltt Erkki Pulkkisen kanssa koski skitsofrenian ennustetta. Pulkkinen tuli vastaanotolleni tilastotieteen laitokselle mukanaan aineisto, jonka stressihormoni Igan pitoisuus ennusti heikosti sairaalahoidon tarvetta seuraavan viiden vuoden aikana. Korkea stressitaso ennusti vähäistä sairaalahoidon tarvetta, mutta korrelaatio oli niin heikko, ettei sellaisia yleensä lasketa. Suuren otoksen vuoksi korrelaatio oli kuitenkin tilastollisesti merkitsevä. Saksalaiset olivat saaneet samanlaisia tuloksia ja ranskalaisten mukaan taas riippuvuutta ei ollut, jos nyt oikein muistan.
Ehdotin, että piirretään siitä kuva. Niin tehtiin. Kuva oli kuin haulikolla ammuttu, ei mitään riippuvuutta, paitsi että kahdeksan hyvin stressaantuneena sairaalahoitoon tullutta paranivat kahdessa viikossa skitsofreniastaan eivätkä palanneet hoitoon. Väärä diagnoosi. Paranoidisen skitsofrenian kaltaiset oireet johtuivat äärimmäisestä stressistä. Päässä ei ollut vikaa vbaan maailmassa.
Tällaista selvitystä ei voisi tehdä nykyisten tutkimuslupakäytäntöjen vallitessa mitenkään.