skip to Main Content

Kanta-datan hyödyntäminen tutkimuskäytössä – ota nämä asiat huomioon jo suunnitteluvaiheessa

Kun suunnittelet Kanta-datan hyödyntämistä tutkimuskäytössä, kannattaa jo suunnitteluvaiheessa kiinnittää huomiota esimerkiksi tietotarpeiden huolelliseen määrittelyyn.

Kanta-datan hyödyntämisellä tutkimuskäytössä on suora vaikutus kansanterveyden edistämiseen ja terveydenhuollon päätöksenteon tukemiseen. Kanta-palvelut on laaja tietovaranto, joka sisältää yli 6,7 miljoonan henkilön terveydenhuollon ja 1,6 miljoonan henkilön sosiaalihuollon tietoja Suomessa.

Kanta-palveluita käytetään niin julkisessa kuin yksityisessä terveydenhuollossa ja sosiaalihuollossa sekä kaikissa apteekeissa. Tämä mahdollistaa yksilöllisen potilashistorian muodostumisen ja tarjoaa arvokasta dataa tieteellisiin tutkimuksiin ilman erillistä tietojen keruuta, säästäen aikaa ja kustannuksia. Tietosuojan ja toisiokäyttölain ansiosta Kanta-palveluista saatu data on turvallisesti ja lainmukaisesti hyödynnettävissä.

Ota nämä asiat huomioon jo tutkimuksen suunnitteluvaiheessa

1. Varaudu pitkään prosessiin

Kanta-palvelut tarjoaa laajan terveys- ja sosiaalihuollon tietojen aarreaitan, jonka hyödyntäminen tutkimustyössä on arvokasta mutta prosessiltaan pitkäjänteistä. Uudet tietolupahakemukset vaativat hyväksynnän Findatalta, mikä voi viedä 3–5 kuukautta. Päätöksen jälkeen aineiston keruuseen on hyvä varata aikaa 3–6 kuukautta.

Täydennyspyynnöt ja tietojen poiminnat voivat olla hieman nopeampia, mutta aina kuitenkin useiden kuukausien mittaisia prosesseja. Tämän vuoksi on ensiarvoisen tärkeää, että tutkimukseen haettava tieto on mahdollisimman tarkkaa ja oikein määriteltyä heti alusta lähtien.

2. Huomioi datan saatavuus

Kanta-palveluiden tutkimuskäyttöön saatavilla olevat tietosisällöt kuvataan aineistokatalogissa, joka pitää sisällään muun muassa Kannan potilastiedon arkistosta löytyvät keskeiset terveystiedot, kuten diagnoosit, riskitiedot ja fysiologiset mittaukset. Tietojen tarkempaa määrittelyä varten on käytettävissä kansallinen koodistopalvelu sekä CDA R2 -dokumenttien tekninen määrittely.

Kansallinen koodistopalvelu sisältää yhtenäiset tietomääritykset, joita käytetään asiakas- ja potilastietojärjestelmissä tiedon tuottamiseen kuten kirjaamiseen. Tutkimuksen kannalta koodistopalvelun käyttö ei kuitenkaan ole täysin suoraviivaista, sillä se sisältää myös määrittelyjä, jotka eivät vielä ole käytännön tasolla käyttöönotettuja.

Lisäksi on syytä huomioida, että pelkkä tietosisällön määrittely ei välttämättä kerro, tallennetaanko dataa Kantaan tosiasiassa tai kuinka pitkältä ajalta tietoja on saatavilla. Esimerkiksi fysiologisiin mittauksiin kuuluva tupakointitieto on määritelty rakenteisesti, mutta sitä käytetään vain harvoin.

3. Määrittele tietotarpeesi huolellisesti

Tutkimuksen suunnitteluvaiheessa haasteeksi muodostuu se, että eri muuttujien ja tietojen määrää koskevaa tilastoa ei ole saatavilla. Tämä vaikeuttaa datan soveltuvuuden suunnittelua – tutkijan on lähdettävä liikkeelle laajasta kuvasta ja määriteltävä tietotarpeensa huolellisesti, jotta Kanta-palveluiden potentiaali saadaan täysimittaisesti käyttöön tutkimustyössä.

4. Tietojen turvaaminen ja niiden eettinen käyttö

Datan turvallinen käsittely on verrattavissa terveydenhuollon ohjelmistokehitykseen, jossa voi olla pääsy arkaluontoisiin tietoihin ja tietojen käyttö on tiukasti säädeltyä. Kun Kanta-palveluiden dataa käytetään tutkimuksessa, on oleellista huolehtia tietojen turvallisuudesta ja eettisestä käytöstä. Käyttöön tulee ottaa sopivat tietoturva- ja tietosuojaprosessit.

Datan käsittelyyn ovat oikeutettuja ainoastaan ennalta määritellyt henkilöt. Yksilötason tietoja ei saa julkaista tai esimerkiksi luovuttaa yhteistyökumppanille tutkimusta tehdessä, vaan tiedot on muutettava tilastolliseen muotoon. Lisäksi tämä vaatii Findatan tarkistusprosessin läpikäymisen. On hyvä huomioida, että tietojen turvaamiseen liittyvät prosessit vaikuttavat aikatauluun.

Taustaa

  • Toisiokäyttölaki 552/2019 26.4.2019 mahdollistaa Kansaneläkelaitoksen, Väestörekisterikeskuksen, Tilastokeskuksen ja Eläketurvakeskuksen henkilötietojen hyödyntämisen laissa määritellyissä käyttötarkoituksissa, joista yksi on tieteellinen tutkimus.
  • Atostekin Jasmine-tutkimusprojekti (Joyful ApparationS of Medical INtelligencE) keskittyy terveystiedon automaattiseen hyödyntämiseen ja jalostamiseen erityisesti koneoppimisen keinoin henkilön terveysriskien ennustamisen näkökulmasta.

Viljami Männikkö
Ohjelmistosuunnittelija

 

 

Klaus Förger
Vanhempi ohjelmistosuunnittelija