Terveystiedon käyttö tutkimuksessa

Voi­si­ko ter­veys­tie­to­jen käy­tön tut­ki­muk­seen jär­jes­tää niin, että tut­ki­ja saa käyt­töön­sä ano­ny­mi­soi­dut yksi­lö­ta­son tie­dot ja vää­rin­käyt­tö tar­kas­te­taan jäl­ki­kä­teen niin, että kaik­ki tut­ki­jan teke­mät toi­men­pi­teet tie­to­ko­neel­la nau­hoi­te­taan ja jäl­ki­kä­teen sel­vi­te­tään, onko tut­ki­ja pyr­ki­nyt mur­ta­maan anonymisoinnin. 

Suo­mes­sa on val­ta­van arvok­kai­ta ter­vey­den­huol­toon liit­ty­viä tie­to­va­ran­to­ja, jot­ka ovat täy­sin ali­käy­tet­ty­jä. Näi­den tie­to­jen anta­mi­seen tut­ki­joi­den käyt­töön liit­tyy toi­saal­ta mer­kit­tä­vä ongel­ma yksi­tyi­syy­den suo­jan kannalta.

Tois­tai­sek­si tie­to­jen hyväk­si­käyt­tö on ollut mah­dol­lis­ta niin, että tut­ki­ja tar­vit­see ensin tut­ki­mus­lu­van, jon­ka saa­mi­nen voi kes­tää kuu­kausia. Tämän jäl­keen hän pyy­tää THL:ää teke­mään pyy­de­tyn ris­tiin ajon kah­den rekis­te­rin välil­lä. Jos tulos osoit­taa, että pitää ajaa vähän toi­sen­lai­nen ajo, sama rutii­ni toistetaan.

Ymmär­tääk­se­ni sana ”tut­kia” on peräi­sin poh­jan tut­ki­mi­ses­ta samean veden läpi tut­kai­men avul­la. [Tätä tie­toa älköön lai­nat­ta­ko ilman sen toden­pe­räi­syy­den sel­vit­tä­mis­tä, kos­ka en pys­ty muis­tin­va­rais­ta tie­toa tar­kis­ta­maan. Ety­mo­lo­gis­ta sana­kir­jaa ei löy­dy kir­ja­hyl­lys­tä­ni.] Nyky­käy­tän­tö tar­koit­taa, että pyy­de­tään lupa kokeil­la, onko kivi täs­sä ja jos ei ollut, hake­maan uusi lupa sen sel­vit­tä­mi­sek­si, onko se sii­nä vie­res­sä ja niin edelleen.

Empii­ris­tä tut­ki­mus­ta ei teh­dä näin. Se edel­lyt­tää monen­lais­ta aineis­ton tar­kas­te­lua, eri­lais­ten ja yllät­tä­vien­kin riip­pu­vuuk­sien etsi­mis­tä ja yleen­sä kuvien piir­tä­mis­tä riip­pu­vuu­den muo­don sel­vit­tä­mi­sek­si. Pelk­kien kor­re­laa­toi­den tulos­ta­mi­nen ei rii­tä, kos­ka kor­re­laa­tio mit­taa line­aa­ris­ta riip­pu­vuut­ta ja vain sitä.  Tut­ki­jan on saa­ta­va ana­ly­soi­da yksi­lö­koh­tais­ta dataa.[1]

Esi­mer­kik­si lääk­kei­den yllät­tä­vien hai­tal­lis­ten yhdys­vai­ku­tus­ten etsi­mi­nen ei voi perus­tua ennal­ta mää­rät­tyi­hin hypo­tee­sei­hin, kos­ka etsi­tään yllät­tä­viä eikä ole­tet­tu­ja vaikutuksia.

Aineis­ton voi ano­ny­mi­soi­da, mut­ta jos aineis­toa tar­kas­te­lee hyvin moni­puo­li­ses­ti, ano­ny­mi­soin­nin voi kyl­lä mur­taa. Kun oikein yrit­tää, kyl­lä se Anne­li Auer on aineis­tos­ta tun­nis­tet­ta­vis­sa. Sik­si ollaan varovaisia.

Entä jos vää­rin­käyt­töä val­vot­tai­siin jäl­ki­kä­teen ja yri­tyk­sen mur­taa ano­ny­mi­soin­ti sank­tioi­tai­siin niin, ettei kukaan sel­lai­seen ryh­dy? Tut­ki­ja sai­si kyl­lä käyt­tää yksi­lö­ta­son aineis­toa, mut­ta kaik­ki hänen ana­lyy­sin­sa nau­hoi­tet­tai­siin ja jäl­ki­kä­teen tar­kas­tet­tai­siin­ko, ovat­ko ne olleet asiallisia.

Kom­ment­te­ja?

 

 

[1] Minun ainoa jul­kai­su­ni lää­ke­tie­teen alal­la on artik­ke­li yhdes­sä ltt Erk­ki Pulk­ki­sen kans­sa kos­ki skit­so­fre­nian ennus­tet­ta. Pulk­ki­nen tuli vas­taa­no­tol­le­ni tilas­to­tie­teen lai­tok­sel­le muka­naan aineis­to, jon­ka stres­si­hor­mo­ni Igan pitoi­suus ennus­ti hei­kos­ti sai­raa­la­hoi­don tar­vet­ta seu­raa­van vii­den vuo­den aika­na. Kor­kea stres­si­ta­so ennus­ti vähäis­tä sai­raa­la­hoi­don tar­vet­ta, mut­ta kor­re­laa­tio oli niin heik­ko, ettei sel­lai­sia yleen­sä las­ke­ta. Suu­ren otok­sen vuok­si kor­re­laa­tio oli kui­ten­kin tilas­tol­li­ses­ti mer­kit­se­vä. Sak­sa­lai­set oli­vat saa­neet saman­lai­sia tulok­sia ja rans­ka­lais­ten mukaan taas riip­pu­vuut­ta ei ollut, jos nyt oikein muistan.
Ehdo­tin, että piir­re­tään sii­tä kuva. Niin teh­tiin. Kuva oli kuin hau­li­kol­la ammut­tu, ei mitään riip­pu­vuut­ta, pait­si että kah­dek­san hyvin stres­saan­tu­nee­na sai­raa­la­hoi­toon tul­lut­ta para­ni­vat kah­des­sa vii­kos­sa skit­so­fre­nias­taan eivät­kä palan­neet hoi­toon. Vää­rä diag­noo­si. Para­noi­di­sen skit­so­fre­nian kal­tai­set oireet joh­tui­vat äärim­mäi­ses­tä stres­sis­tä. Pääs­sä ei ollut vikaa vbaan maailmassa.
Täl­lais­ta sel­vi­tys­tä ei voi­si teh­dä nykyis­ten tut­ki­mus­lu­pa­käy­tän­tö­jen val­li­tes­sa mitenkään.

20 vastausta artikkeliin “Terveystiedon käyttö tutkimuksessa”

 1. Entä jos vää­rin­käyt­töä val­vot­tai­siin jäl­ki­kä­teen ja yri­tyk­sen mur­taa ano­ny­mi­soin­ti sank­tioi­tai­siin niin, ettei kukaan sel­lai­seen ryhdy?

  Miten tuo todetaan?

  1. Se tode­taan nau­hoit­ta­mal­la kaik­ki tie­to­ko­nea­jot. Kyl­lä niis­tä tun­nis­taa sel­lai­sen käy­tön, jos­sa tar­koi­tuk­se­na on mur­taa anonymisointi.

   1. Osmo Soi­nin­vaa­ra:
    Se tode­taan nau­hoit­ta­mal­la kaik­ki tie­to­ko­nea­jot. Kyl­lä niis­tä tun­nis­taa sel­lai­sen käy­tön, jos­sa tar­koi­tuk­se­na on mur­taa anonymisointi.

    Ei kyl­lä tunnista. 

    Kun ne tie­dot ker­ran läh­tee eteen­päin on täy­sin mah­do­ton­ta val­voa mitä niil­lä tie­doil­la tehdään.

    Sitä pait­si jäl­ki­kä­teen ran­kai­su ei auta enää yhtään mitään kun vahin­ko on jo tapah­tu­nut. Jos koko Suo­men ter­veys­tie­dot leviäi­si inter­net­tiin niin se tie­täi­si tämän maan loppua.

 2. Joi­den­kin rekis­te­riai­neis­to­jen osal­ta on etä­käyt­töym­pä­ris­tö­jä, jois­sa on mah­dol­li­suus teh­dä noi­ta asioi­ta. Ei vain tai­da kos­kea ter­vey­den­huol­lon tietoja.

  Täl­löin tut­ki­ja voi teh­dä monia asioi­ta ja kaik­ki eräajot/ohjelmat voi­daan logit­taa. Kun tie­toa ei rivi­ta­sol­la voi­si siir­tää pois tut­ki­musym­pä­ris­tös­tä, niin tie­to­suo­ja­rik­ko­muk­sen ris­ki pie­ne­nee. Toki iso tie­to­mur­to voi­si olla riski.

 3. Osmo Soi­nin­vaa­ra:
  Se tode­taan nau­hoit­ta­mal­la kaik­ki tie­to­ko­nea­jot. Kyl­lä niis­tä tun­nis­taa sel­lai­sen käy­tön, jos­sa tar­koi­tuk­se­na on mur­taa anonymisointi.

  Ja yksi­kään vali­di tut­ki­mus­ajo ei voi vahin­gos­sa­kaan näyt­tää sil­tä, että tar­koi­tuk­se­na on mur­taa ano­ny­mi­soin­ti? Äkkiä aja­tel­tu­na eksoot­tis­ten kor­re­laa­tioi­den etsi­mi­ses­sä tulee väki­sin tulok­sia jois­sa on kovin vähän joi­ta­kin kom­bi­naa­tioi­ta tuloksissa.

 4. Ongel­ma ei ole yhdes­sä tut­ki­jas­sa vaan suu­ris­sa kan­sain­vä­li­sis­sä toi­mi­jois­sa, jot­ka ole­tet­ta­vas­ti säi­lö­vät eri tut­ki­muk­siin saa­dut ano­ny­mi­soi­dut tie­dot ja läh­te­vät sit­ten sitä lou­hi­maan. Ano­ny­mi­soin­nin purun sel­vil­le saa­mi­sek­si on tuos­sa tapauk­ses­sa niin pal­jon estei­tä, että se tus­kin käy­tän­nös­sä onnis­tuu (tie­don siir­to lain­sää­dän­nön ulot­tu­mat­to­miin, yri­tys­sa­lai­suu­det, jne.). Ja vaik­ka asia sel­viäi­si­kin, han­kit­tua dataa ei vält­tä­mät­tä saa­da tuhot­tua eikä ran­gais­tus­ten suu­ruus ole sitä luok­kaa, ettei­kö ris­kiä kan­nat­tai­si ottaa (tai yksin­ker­tai­ses­ti las­kea nor­maa­leik­si lii­ke­toi­min­ta­kus­tan­nuk­sik­si kuten pan­kit tekevät).

 5. Pie­niä aske­lia kiitos. 

  Lai­te­taan ensin hen­ki­lö­re­kis­te­ri­ri­kol­li­suus kuriin. Ei lisää urkin­ta­oi­keuk­sia ennen kuin tuo­miot ovat huo­mat­ta­vas­ti kor­keam­pia ja nii­den perus­teel­la voi­daan erottaa. 

  Polii­sin kes­kuu­des­sa yksi­tyi­syy­den louk­kauk­set näyt­tä­vät ole­van tapa. Jos vie­rei­ses­tä pöy­däs­tä läh­tee kave­ri kah­vil­le lukit­se­mat­ta tie­to­ko­net­ta, kave­rit käyt­tä­vät näi­tä tun­nuk­sia jul­ki­suu­den hen­ki­löi­den, tut­tu­jen ja suku­lais­ten urkkimiseen. 

  1. Lait kun­toon. Isom­mat tuomiot. 

  2. Hen­ki­lö­re­kis­te­rien hal­lin­ta ja vas­tuu yksi­tyi­syy­des­tä eri eri orga­ni­saa­tion rekis­te­rien käyt­tä­jä­or­ga­ni­saa­tiois­ta. Polii­siin ei voi täs­sä asias­sa luot­taa, se on jo sel­keäs­ti havaittu. 

  3. Kah­den mie­hen sään­tö käyt­töön kaik­kiin tär­kei­siin tietokantoihin.

  4. Tut­ki­mus­tie­don ano­ny­mi­soin­ti asian­tun­ti­joi­den toi­mes­ta. Luo­tet­ta­va datan ano­ny­mi­soin­ti on poh­jim­mil­taan tilas­to­tie­teel­li­nen ongel­ma johon on kehi­tet­ty rat­kai­su­ja kuten Dif­fe­ren­tial pri­vacy ‑idea. Lyhyes­ti: Datas­ta on mah­dol­lis­ta saa­da halut­tu tilas­tol­li­nen tark­kuus ja säi­lyt­tää yksi­tyi­syys jos dataan lisä­tään pie­ni mää­rä kohi­naa. On kehi­tet­ty algo­rit­me­ja ja ohjel­mis­to­ja, joil­la tämä tavoi­te voi­daan saa­vut­taa. Esim. expo­nen­tial mec­ha­nism ‑algo­rit­mi.

  http://privacy.cis.upenn.edu

 6. Aluk­si ajat­te­lin, että en usko että onnis­tuu, kos­ka esi­mer­kik­si kuvan­kaap­paus­oh­jel­ma voi sisäl­tää opti­sen merk­kien tun­nis­tus­lait­teis­ton ja siten yksi­lö­ta­son tie­dot voi­daan esim. valo­ku­va­ta tai nau­hoit­taa ja sen jäl­keen pur­kaa toi­ses­sa konees­sa digi­taa­li­seen muotoon.

  Mut­ta ehkä se voi­si onnis­tua niin, että esim jokun vir­tu­aa­li­sen koneen ter­mi­naa­li annet­tai­siin tut­ki­jan käyttöön.

  Täl­löin tut­ki­jal­la ei oli­si var­si­nai­ses­ti pää­syä itse konee­seen, vaan ainoas­taan vir­tu­aa­li­seen ter­mi­naa­liin. Täm­möi­nen ter­mi­naa­li voi­si olla vie­lä­pä asen­net­tu­na jol­le­kin tie­tyn tyyp­pi­sel­le koneel­le jos­sa ei saa olla mui­ta ohjelmistoja.

  Tämän tyyp­pi­sen koneen käyt­töä voi­tai­siin toki nau­hoit­taa ja nau­hoi­te voi­tai­siin teo­rias­sa tois­taa jäl­ki­kä­teen kaik­ki­ne toimintoineen.

  Se ei estäi­si kuvan­kaap­pauk­sen teke­mis­tä, mut­ta vir­tu­aa­li­sen ter­mi­naa­lin toi­min­to­ja voi­tai­siin raja­ta ehkä niin että tie­don vää­rin­käyt­tö oli­si aina­kin todel­la vaikeaa.

 7. tcrown: Ja yksi­kään vali­di tut­ki­mus­ajo ei voi vahin­gos­sa­kaan näyt­tää sil­tä, että tar­koi­tuk­se­na on mur­taa ano­ny­mi­soin­ti? Äkkiä aja­tel­tu­na eksoot­tis­ten kor­re­laa­tioi­den etsi­mi­ses­sä tulee väki­sin tulok­sia jois­sa on kovin vähän joi­ta­kin kom­bi­naa­tioi­ta tuloksissa.

  Tämä hoi­tui­si etä­käyt­töym­pä­ris­tös­sä, jos­sa kaik­ki tie­dot on sinän­sä pseu­do­ny­mi­soi­tu ja rivi­ta­sois­ta tie­toa ei voi lada­ta pois ympäristöstä.

 8. Olen tain­nut itse ehdot­taa jota­kin saman­kal­tais­ta aikai­sem­min (11.11.2013, kom­ment­ti­na Osmon kir­joi­tuk­seen “Sote­pal­ve­lu­jen on uudis­tut­ta­va tek­no­lo­gian mukana”):

  Olen itse­kin miet­ti­nyt ter­veys­tie­to­jen avaa­mis­ta tut­ki­musai­neis­tok­si, ja sii­tä seu­raa­via yksi­tyi­syy­den ongel­mia. “Kaik­ki kai­kil­le avoi­mek­si” ei ole täl­lä het­kel­lä hyväk­syt­tä­vä vas­taus. Nykyi­sin lää­kä­ril­le mene­vä olet­taa ter­vey­son­gel­man­sa pysy­vän mah­dol­li­sim­man yksi­tyi­se­nä. Jos näin ei oli­si, lää­kä­ril­le ei ehkä men­täi­si tut­kit­ta­vak­si yhtä auliis­ti. Tuli­si miet­tiä ennen yhtey­den­ot­toa, onko val­mis sisäl­lyt­tä­mään asian poten­ti­aa­li­ses­ti kai­kil­le avoi­meen tie­to­kan­taan – jos­sa kir­jaus säi­lyy koko loppuelämän.

  Parem­pi kuin syyl­lis­tää nii­tä, jot­ka halua­vat säi­lyt­tää aina­kin joi­ta­kin ter­veys­tie­to­jaan yksi­tyi­se­nä, oli­si miet­tiä, kuin­ka tie­to­jär­jes­tel­mis­tä voi­si lou­hia tie­to­ja mini­moi­den sii­tä yksi­tyi­syy­del­le aiheu­tu­vat hai­tat. Oikeu­det kaik­kien tie­to­jen kat­so­mi­seen tuli­si olla ainoas­taan niil­lä, joil­le se on aivan vält­tä­mä­tön­tä – ja sii­tä pitää jää­dä jäl­jet tie­to­kan­taan, jot­ta sen käyt­tö oli­si vas­tuul­lis­ta ja val­vot­tua. Tie­to­jär­jes­tel­män tie­to­jen käyt­tö tut­ki­muk­sen teke­mi­seen­tu­li­si kui­ten­kin ava­ta mah­dol­li­sim­man monil­le – ei ainoas­taan lää­kä­rin viras­sa oleville.

  Ehkä tut­ki­joil­le voi­si joko tuot­taa eril­li­sen tie­to­kan­nan, joka oli­si puh­dis­tet­tu hen­ki­löi­den yksi­löi­mi­seen tar­vit­ta­vis­ta tie­dois­ta – niin hyvin kuin se oli­si mah­dol­lis­ta. Tai ehkä voi­si luo­da tie­to­jär­jes­tel­mään sel­lai­sia näky­miä, joka mah­dol­lis­ta­vat yleis­ten kor­re­laa­tioi­den löy­tä­mi­sen, mut­ta ei yksit­täis­ten asiak­kai­den tie­to­jen selaa­mis­ta. Käyt­tä­jä voi­si tie­dus­tel­la koneel­ta, onko esi­mer­kik­si kor­re­laa­tio­ta löy­det­tä­vis­sä aikuis­tyy­pin dia­be­tek­sen ja perä­pu­ka­mien välil­lä, ja kone voi­si vas­ta­ta aineis­ton perus­teel­la – anta­mat­ta kenen­kään hen­ki­lön tie­tuet­ta suo­raan tut­ki­jan luettavaksi.

  Yksi­tyi­syy­den ja tie­teen vas­tak­kai­na­set­te­lun sijas­ta oli­si toi­vot­ta­vaa etsiä nii­tä tek­no­lo­gi­sia (ja lai­no­pil­li­sia) inno­vaa­tioi­ta, joil­la voi­daan ava­ta ter­vey­den­huol­lon kerää­mää tie­toa tut­ki­mus­käyt­töön – ihmis­ten yksi­tyi­syyt­tä uhraamatta.

  Aja­tus ver­kos­sa ole­vas­ta kaik­kien suo­ma­lais­ten yksi­löi­ty­jä ter­veys­tie­to­ja sisäl­tä­väs­tä tie­to­kan­nas­ta pitäi­si herät­tää vas­ta­lausei­ta, jos tie­tää mitään eri­tyi­ses­ti val­tioi­den har­joit­ta­mas­ta tie­do­nur­kin­nas­ta. Austria­nin edel­lä mai­nit­se­ma tie­to­mur­to on ilmei­ses­ti vain ajan kysy­mys. En siis pidä hyvä­nä aja­tuk­se­na, että hen­ki­löi­den ano­ny­mi­teet­ti taat­tai­siin yksi­no­maan käyt­tö­liit­ty­män kaut­ta. Itse tie­to­kan­nan oli­si olta­va sii­nä mää­rin puh­dis­tet­tu yksi­löi­tä­vis­tä tie­dois­ta, että sen pää­ty­mi­nen vaik­ka­pa Wiki­leaks-sivus­tol­le ei oli­si mikään kan­sal­li­nen järkytys.

  Applen tänä vuon­na esit­te­le­mä “dif­fe­ren­tial pri­vacy”, jon­ka Dio­di mai­nit­si yllä, osoit­taa, että yksi tie­to­tek­nii­kan jät­ti­läi­nen pitää mah­dol­li­se­na kerä­tä hyö­dyl­lis­tä tie­toa ryh­mis­tä kerää­mät­tä kui­ten­kaan tie­toa yksi­löis­tä. Tie­to­mur­to­kaan ei pal­jas­tai­si kiusal­li­sia tie­to­ja tun­nis­tet­ta­vis­ta yksilöistä.
  (https://www.wired.com/2016/06/apples-differential-privacy-collecting-data/)

  Ero­na ter­veys­tie­to­jen tie­to­kan­taan tie­ten­kin on se, että ter­vey­den­huol­to on jo kerän­nyt yksi­löi­vät tie­dot. Laa­jem­mal­le tut­ki­ja­jou­kol­le tar­jot­ta­vas­ta tie­to­kan­nas­ta ne kui­ten­kin voi­si suo­dat­taa pois. Var­mas­ti sen muka­na mene­tet­täi­siin osa tie­to­jen tut­ki­musar­vos­ta, mut­ta toi­saal­ta saa­tai­siin entis­tä laa­jem­paan käyt­töön (tilas­to­tie­tei­li­jät, opis­ke­li­jat, ulko­maa­lai­set jne.) suu­res­ta popu­laa­tios­ta kerät­tyä tietoa.

  Vie­lä yksi kysy­mys seu­raa­vas­ta kohdasta:
  “Jos vää­rin­käyt­töä val­vot­tai­siin jäl­ki­kä­teen ja yri­tyk­sen mur­taa ano­ny­mi­soin­ti sank­tioi­tai­siin niin, ettei kukaan sel­lai­seen ryh­dy? Tut­ki­ja sai­si kyl­lä käyt­tää yksi­lö­ta­son aineis­toa, mut­ta kaik­ki hänen ana­lyy­sin­sa nau­hoi­tet­tai­siin ja jäl­ki­kä­teen tar­kas­tet­tai­siin­ko, ovat­ko ne olleet asiallisia.”

  Kysy­mys: Jos uskom­me tun­nis­ta­vam­me epä­asial­li­set haut jäl­ki­kä­teen, mik­si emme kyke­ni­si mää­rit­te­le­mään sel­lai­sia jo etu­kä­teen — ja estää epä­asial­lis­ten haku­jen mah­dol­li­suus joko tie­to­kan­nan käyt­tö­liit­ty­mäs­sä tai jopa itse tie­to­kan­nan rakenteessa?

  (Huo­maan, että puhu­mi­nen tie­to­kan­nas­ta joh­dat­taa ajat­te­le­maan infor­maa­tio­ta säi­löt­ty­nä tie­tuei­siin , jois­ta sit­ten pois­te­taan joi­ta­kin tie­to­ja — ja että tie­to­kan­nas­ta teh­tä­vät haut oli­si­vat sel­lai­sia kuin nykyi­sis­sä tie­to­kan­nois­sa. Näin ei kui­ten­kaan tar­vit­si­si olla vaan ter­veys­tie­to­jen “tie­to­kan­ta” voi­si olla jos­sa­kin muus­sa muo­dos­sa — sel­lai­ses­sa muo­dos­sa, joka jo itses­sään rajai­si sil­le esi­tet­tä­viä kysy­myk­siä. Ehkä tie­to­kan­nan infor­maa­tio voi­si olla jo jos­sa­kin mää­rin tilas­tol­li­ses­ti esi­kä­si­tel­tyä eikä koos­tua lain­kaan yksi­lö­koh­tai­sis­ta tie­tueis­ta? Jätän yksi­tyis­koh­dat pro­pel­li­päi­den mietittäväksi. 🙂 )

  1. Ei rii­tä, että kysym­me, onko kor­re­laa­tio­ta dia­be­tek­sen ja perä­pu­ka­mien välil­lä, vaan tut­ki­jan on voi­ta­va piir­tää täs­tä yhtey­des­tä kuva — siis mil­lai­set soke­riar­vot vai­kut­ta­vat — ja lisäk­si voi­ta­va sul­kea pois joi­tain sekoit­ta­via teki­jöi­tä. Tämä tapah­tuu lukuis­ten kokei­den ja epä­on­nis­tu­mis­ten jäl­keen ja edel­lyt­tää kym­me­niä tie­to­ko­nea­jo­ja. Jos jokai­nen niis­tä pitäi­si tila­ta etu­kä­teen ja peräk­käis­ten ajo­jen välil­lä oli­si viik­ko­ja, tulos ei val­mis­tui­si koskaan.

 9. Eräs kan­san­edus­ta­ja aikoi­naan lausui että mik­si nou­dat­taa lakia kun lain rik­ko­mi­ses­ta ei ole sää­det­ty sank­tio­ta ja tie­to­jen mur­ta­mis­ta­han teke­vät (tai sala­kat­se­lua) jo polii­sit­kin vähäl­lä huo­mat­ta­mi­sel­la ja sakon määrällä.

  Siis mikä on nyky­käy­tän­nön mukai­nen sank­tio ter­veys­tie­to­jen ano­ny­mi­tee­tin murtamisesta.

 10. Jos kaik­ki yksi­tyi­set tie­dot oli­si­vat pseu­do­ny­mi­soi­tu, mut­ta eri tie­dos­tot tai tau­lut etä­käyt­töym­pä­ris­tös­sä oli­si mah­dol­lis­ta liit­tää avain­ten perus­teel­la, niin edes tie­to­mur­to ei tuot­tai­si hyök­kää­jäl­le arvo­kas­ta dataa.

  Hetun ja katuo­soit­teen yhdis­tel­män tii­vis­tear­vo tuot­tai­si hen­ki­lön pseu­do­ny­mi­soi­dun tun­nis­tear­von. Eri mit­taus­tie­dos­tot oli­si mah­dol­lis­ta yhdistää.

 11. Itse olen anta­nut luvan käyt­tää vapaas­ti ker­ty­nei­tä ter­veys­tie­to­ja­ni. Mik­si ihmees­sä ei sai­si. Tur­hiin tut­ki­muk­siin ei kan­nat­tai­si veron­mak­sa­jan raho­ja tuh­la­ta. Siis kun tut­ki­ja tavoit­te­lee vain oma kun­ni­aan­sa. Näyt­tää, että sel­lais­ta on paljon.

 12. Tun­nis­te­tie­to­jen pseu­do­ny­mi­soin­ti ei pois­ta iden­ti­fioi­mis­ris­kiä. Pseu­do­nyy­mi ei ole ano­nyy­min synonyymi.

  Ano­ny­mi­soin­ti aut­taa, mut­ta jokai­seen ano­ny­mi­soin­ti­me­ne­tel­mään sisäl­tyy nol­laa suu­rem­pi rei­den­ti­fi­kaa­tio­ris­ki (R=Risk). Lisäk­si jokai­nen mene­tel­mä hei­ken­tää aineis­ton käy­tet­tä­vyyt­tä (U=Utility). Jou­du­taan teke­mään kom­pro­mis­se­ja, jos­kin on väi­tet­ty että ris­ki pie­ne­nee hitaam­min kuin hyöty.

  Kuten blo­gin­pi­tä­jän esi­mer­kis­sä. Epä­li­ne­aa­ri­sen yhtey­den löy­tä­mi­nen ano­ny­mi­soi­dus­ta aineis­tos­ta on han­ka­lam­paa kuin alkuperäisestä.

  Niin­pä tut­ki­joil­le pitää antaa oikeus rivi­ta­soi­seen dataan. Etä­työ­pöy­dät aut­ta­vat vähän, jos­kin pahan­tah­toi­nen löy­tää auk­kon­sa niis­tä­kin. Lisäk­si on kehi­tet­ty eri­lai­sia kont­rol­loi­dum­pia etäkäyttöjärjestelmiä. 

  Kan­nat­taa lukais­ta tämä artik­ke­li: http://www.annualreviews.org/doi/abs/10.1146/annurev-statistics-041715–033438

  Se on vähän van­ha mut­ta pää­osin ajan­koh­tai­nen. Blo­gin­pi­tä­jää miel­lyt­tääk­seen kir­joit­ta­ja lie­nee lisän­nyt talous­tie­teel­lis­tä analyysiä.

 13. Osmo Soi­nin­vaa­ra:
  Ei rii­tä, että kysym­me, onko kor­re­laa­tio­ta dia­be­tek­sen ja perä­pu­ka­mien välil­lä, vaan tut­ki­jan on voi­ta­va piir­tää täs­tä yhtey­des­tä kuva – siis mil­lai­set soke­riar­vot vai­kut­ta­vat – ja lisäk­si voi­ta­va sul­kea pois joi­tain sekoit­ta­via teki­jöi­tä. Tämä tapah­tuu lukuis­ten kokei­den ja epä­on­nis­tu­mis­ten jäl­keen ja edel­lyt­tää kym­me­niä tie­to­ko­nea­jo­ja. Jos jokai­nen niis­tä pitäi­si tila­ta etu­kä­teen ja peräk­käis­ten ajo­jen välil­lä oli­si viik­ko­ja, tulos ei val­mis­tui­si koskaan.

  Perä­pu­ka­mien ja dia­be­tek­sen väli­sen yhtey­den sel­vit­tä­mi­ses­sä on men­nyt jo maa­il­man alus­ta tähän päi­vään asti. Mikä­li tut­ki­mus­tu­los saa­daan nyky­me­ne­tel­mäl­lä vuo­den sisäl­lä, niin tut­ki­mus ei kes­tä mer­kit­tä­väs­ti kau­em­min kuin jos se val­mis­tui­si huomenna.

  Lisäk­si tut­ki­mus val­mis­tuu nopei­ten, kun sen aloit­taa nyt nykyi­sil­lä sään­nöil­lä eikä ensin pyri hank­ki­maan naa­pu­rin ter­veys­tie­to­ja tuijotettaviksi.

  Olen kyl­lä val­mis myy­mään omat ter­veys­tie­to­ni tut­ki­mus­käyt­töön, mut­ta luu­len, että kukaan ei halua mak­saa pyy­tä­mää­ni hintaa.

 14. Sosi­aa­li- ja ter­vey­den­huol­lon tut­ki­mus- ja rekis­te­riai­neis­toi­hin koh­dis­tu­vat tut­ki­mus­lu­vat mah­dol­lis­ta­vat juu­ri yksi­lö­ta­son tie­don käy­tön siten, että tut­ki­ja voi teh­dä eri­lai­sia ajo­ja aineis­toon. Nyky­käy­tän­tö ei siis ole esi­te­tyn kaltainen. 

  Tut­ki­mus­lu­van saa­tua tut­ki­jal­le kui­ten­kin tulee val­mis­taa taval­la tai toi­sel­la vähin­tään pseu­do­ny­mi­soi­tu tut­ki­musai­neis­to, jos­sa voi yhdis­tyä usei­ta eri aineis­to­ja useil­ta eri toimijoilta. 

  Tut­ki­mus­tie­to­jen käy­tös­sä ollaan yhä vah­vem­min siir­ty­mäs­sä koh­ti eri­lai­sia etä­käyt­tö­rat­kai­su­ja, jot­ka on käy­tös­sä mm. Tilas­to­kes­kuk­ses­sa ja samal­la tut­ki­muk­sis­sa, jois­sa käy­te­tään myös Tilas­to­kes­kuk­sen aineis­toi­ja. Täl­löin tut­ki­jat pys­ty­vät teke­mään ajo­ja kont­rol­loi­dus­sa ympä­ris­tös­sä ja jär­jes­tel­mäs­tä saa ulos vain tulok­sia, jot­ka voi­daan auditoida. 

  Mikä­li ana­lyy­sien ja ris­tiin­tau­lu­koin­tien tulok­set riit­tä­vät, voi täl­lai­siä tila­ta erik­seen. Tulos­ai­neis­ton tulee kui­ten­kin olla sel­lai­nen, että sen kaut­ta ei yksi­löi­den välil­li­nen tun­nis­ta­mi­nen ole mahdollista.

 15. erk­ki nii­ni: Itse olen anta­nut luvan käyt­tää vapaas­ti ker­ty­nei­tä terveystietojani.

  Niin siis olet anta­nut luvan hoi­to­hen­ki­lö­kun­nal­le pääs­tä käsik­si hoi­toon (oleel­li­ses­ti) vai­kut­ta­viin tie­toi­hin. Tut­ki­mus­tie­don ker­ryt­tä­mi­seen ei tai­da olla ole­mas­sa vas­taa­vaa tah­toa, mut­ta sel­lai­nen ilman muu­ta tarvittaisiin.

  Minä alle­kir­joit­tai­sin heti.

  Kii­tos muu­ten muis­tut­ta­mi­ses­ta. Tie­to­jen luo­vu­tuk­seen olin­kin anta­nut luvan 2014. Tein lisäk­si elin­ten luo­vu­tus­ta kos­ke­van tah­don tie­dok­si (tosin kiel­sin luo­vut­ta­mas­ta kusi­päil­le joten en tie­dä otta­vat­ko todes­ta ja jos niin miten tämä var­mis­te­taan), ja laa­din samal­la hoitotahdonkin.

  Enää pitäi­si var­mis­taa, että ao. tah­do­nil­mai­sut todel­la kul­ki­si­vat kai­kil­le pir­joil­la ja mar­ja­toil­le ym. jot­ka saat­ta­vat jou­tua käsit­te­le­mään sek­si­käs­tä kroppaani.

  En ala muka­na­ni kul­jet­te­le­maan mitään lip­pusia ja lappusia.

  En voi myös­kään olla abso­luut­ti­sen var­ma, että puo­li­so­ni todel­la toh­ti­si vetää töp­se­lin sei­näs­tä jos ja kun peli alkaa olla ns. game over.

  Pyy­sin, että sai­sin nime­no­maan hers­kaa (toi­vot­ta­vas­ti ei kui­ten­kaan mitään kadul­ta ostet­tua kanan­pas­kal­la jat­ket­tua variant­tia) kos­ka en tyk­kää kivus­ta (ja kuu­lem­ma edel­leen­kin paras kipu­lää­ke mitä kek­sit­ty), ja että kuo­len mie­lum­min ylian­nos­tuk­seen kuin kär­sin kipunoista…

  Kyl­lä NYT on huo­jen­tu­nut olo, ma sanon.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Notify me of followup comments via e-mail. You can also subscribe without commenting.