skip to Main Content

Potilastiedon hyödyntäminen koneellisesti tekoälyn avulla

Terveydenhuollon resurssit ovat tiukoilla. Potilastietoa on kerätty paljon, mutta sen hyödyntäminen on haastavaa. Tarvitsemme uusia työkaluja helpottamaan ammattilaisten työtaakkaa – tekoälyn avulla voidaan käsitellä suuri massa potilastietoa hetkessä ammattilaisen päätöksenteon tueksi.

Potilastiedon tehokas hyödyntäminen on tärkeää hoidon laadun ja resursoinnin kannalta. Potilasdataa voidaan hyödyntää koneellisesti louhimalla siitä tietoa erilaisilla datankäsittelymenetelmillä tai käyttämällä datasta oppivia tekoälymalleja.

Potilaan riskiä sairastua esimerkiksi sydämen vajaatoimintaan tai aivohalvaukseen on mahdollista ennustaa potilastietoa hyödyntävän sovelluksen avulla. Ennustetta voidaan käyttää seulontaan tai muodostamaan ehdotus toimenpiteille. Riskien laskentaan voidaan käyttää esimerkiksi perinteisiä väestötutkimuksiin perustuvia riskilaskureita sekä käytetystä potilasdatasta oppivia tekoälymenetelmiä.

Potilaskertomuksen hyödyntäminen

Suuri osa potilastiedosta on ei-rakenteisena eli vapaan tekstin muodossa potilaskertomuksessa. Kertomuksissa kuvataan potilaan taustoja, oireita ja niiden kehitystä ajan mittaan sekä potilaan saamaa hoitoa. Tämän runsaasti tietoa sisältävän vapaan tekstin hyödyntäminen on kuitenkin vaikeaa, sillä tietokoneet eivät lähtökohtaisesti ymmärrä sitä eikä sote-ammattilainenkaan usein ehdi sitä läpikotaisesti lukea.

Viime vuosina on tapahtunut paljon kehitystä tekoälyn saralla luonnollisen kielen prosessoinnissa (NLP, natural language processing). Muun muassa ChatGPT on tuonut yleiseen tietouteen alan hurjan edistyksen.

NLP-mallia voidaan käyttää esimerkiksi selvittämään potilaan tupakointimäärää, mikäli tietoa ei ole kirjattu rakenteisena. Kyseisen yksinkertaisenkin asian voi ilmaista niin monella eri tavalla, että sen selvittäminen perinteisellä algoritmilla voi olla haastavaa.

Tekoälyn etuna joustavuus

Perinteiset riskilaskurit eivät välttämättä toimi eri populaatiolle kuin sille, mille alkuperäinen tutkimus on tehty. Tehohoidon potilaiden riski sairastua tutkittuihin tauteihin oli paljon korkeampi kuin riskilaskurin ennustama todennäköisyys. Perinteiset riskilaskurit ovat lisäksi tarkkoja syötearvojen suhteen: mikäli jokin niistä puuttuu, riskiä ei voida laskea. Tämä tekee niiden käytöstä haastavaa koneelliseen käsittelyyn, sillä terveydenhuollon data on usein reikäistä ja epätäydellistä.

Tekoälyyn perustuvien mallien etuna on joustavuus. Mallia voidaan opettaa tai hienosäätää kuhunkin sovellukseen tai joukolle erikseen. Tekoälyä hyödynnettäessä syötearvojen suhteen on enemmän valinnanvaraa, voidaan hyödyntää sitä mitä on saatavilla. Työssä käytetyt tekoälymallit hyödynsivät vain potilaan perustietoja ja diagnoosikoodeja pystyen silti parempiin tuloksiin kuin perinteiset riskilaskurit.

Toisaalta haasteena tekoälyn käytölle on sen tulkittavuus, validointi, sekä terveydenhuollon ammattilaisten ja potilaiden hyväksyntä. Monimutkaisen mallin kanssa syyt seuraukselle hämärtyvät, ja mallia kehittäessä on tärkeää pyrkiä varmistamaan mallin sekä datan oikeellisuus ja reiluus.

Tekoäly osaksi terveydenhuoltoa

Pidän itse todennäköisenä, että tekoäly tulee merkittäväksi osaksi terveydenhuollon prosesseja lähitulevaisuudessa. Suomessa Kanta-arkisto sisältää useista meistä runsaasti käyttökelpoista dataa, mutta sen tehokkaassa hyödyntämisessä on vielä tehtävää. Esimerkiksi potilastiedolla opetettu keskusteleva tekoälymalli voisi tehostaa potilashistorian läpikäymistä suuresti. Alalla tehty tutkimus ja esiin nousevat tarpeet voivat myös auttaa priorisoimaan arkiston kehityssuuntia sinne tallennettavan datan suhteen.

Atostekissa on juuri alkanut toisiokäyttölain ja Findatan mahdollistama tutkimusprojekti, jossa tutkitaan Kanta-arkiston pseudonymisoitua potilastietoa sekä sen soveltuvuutta koneelliseen käsittelyyn ja esimerkiksi riskien laskentaan.

Tutkin diplomityössäni potilasdatan soveltuvuutta riskien laskentaan käyttäen amerikkalaista tehohoidon tietokantaa nimeltä MIMIC-III, joka sisältää kattavat tiedot noin 50 000 potilaasta. Potilaista on saatavilla muun muassa perustiedot, mittaustulokset, laboratoriotulokset, diagnoosien ja tehtyjen toimenpiteiden koodit sekä tekstimuotoiset potilaskertomukset.


Janne Tommola
Ohjelmistosuunnittelija

Aloitin ohjelmistosuunnittelijana Atostekilla vuonna 2019. Valmistuin vuoden 2022 lopulla tietotekniikan diplomi-insinööriksi Tampereen yliopistosta. Olen ollut mukana erilaisissa projekteissa, aihealueina ovat olleet muun muassa konenäkö, terveysdatan tutkiminen ja ilmanvaihtokoneiden suunnitteluohjelma. Työssäni minua kiinnostaa erityisesti uuden suunnittelu sekä tekoälyn tuomat mahdollisuudet.