Datan avoimuus on myös laadun hallintaa

Voiko datan avaaminen parantaa datan laatua? Ehdottomasti voi. Avoimuuden kautta datan käyttäjäjoukko ja käyttökohde laajenevat eli tiedon laatua testataan monipuolisemmin. Datan avaamista ei kannata siis vierastaa vaan valjastaa se yhdeksi datan laadun hallinnan menetelmäksi.

Lähtökohtana ymmärrys datan sisällöstä

Datan pitäisi lähtökohtaisesti olla liiketoiminnalle käyttökelpoista eli siitä pitäisi saada irti jonkinlainen hyöty. Yrityksille ei aina ole selvää millaista dataa julkishallinto tuottaa. Vielä vaikeampi on ymmärtää mitä voitaisiin hyödyntää omassa liiketoiminnassa. Julkishallinnon tuottama data on valtavan monipuolista.  Aina ei kuitenkaan osata sanoa mitä tietoa haluttaisiin tai missä muodossa. Apuna toimisivat organisaatioiden tieto-omaisuuden kuvaukset. Nyt jo useamman organisaation avaamat tietojärjestelmäluettelot eivät vielä riitä, varsinkin kun useimmiten kohta ”järjestelmän sisältämä” tieto ammottaa tyhjyyttään. Tietojen osalta pitäisi päästä riittävän tarkalle tasolle. Esimerkiksi potilastietojärjestelmä voi sisältää myös julkista tietoa tai tiedon anonymisointi voisi mahdollistaa arvokkaan tiedon avaamisen. Tieto-omaisuuden kuvaukset auttaisivat yrityksiä esittämään täsmällisiä avauspyyntöjä, joka voisi myös toimia datan avaamisen priorisoinnin pohjana. Näin pystyttäisiin edistämään datan hyödyntämistä myös liiketoiminnassa. Datakatalogit ovat hyvä tapa jakaa avointa dataa, mutta vielä tarvittaisiin vahvempi linkitys toimintaa eli mihin tämä data liittyy ja mitä se kertoo? Mukaan voitaisiin ottaa vahvemmin markkinointinäkökulma: Me avasimme tämän datan, käyttäkää sitä! Vaatimattomuus ei ole hyvä lähtökohta asioiden esille tuomisessa.

Liiketoiminnan saama hyöty avoimesta datasta ei ole aina uusi sovellus tai palvelu vaan se voi hyödyntää dataa myös omaan analytiikkaan. Tämä tarjoaisi esimerkiksi kasvuyrityksille tai start up -yrityksille mahdollisuuden tarkastella liiketoimintamahdollisuuksia kaupunkien alueilla ja analysoida mahdollisia asiakassegmenttejä. Myös datan avaaja hyötyy. Esimerkiksi kaupunkien näkökulmasta resurssitilanteen avaaminen voisi auttaa kohdistamaan asiakkaat niihin palveluihin, joissa jonotilanne on parempi. Näin jonotilannetta saataisiin helpotettua ja ennen kaikkea asiakas saisi nopeammin haluamansa palvelun. Väliin syntyisi myös liiketoiminnan mahdollisuus esimerkiksi analytiikan tuottajalle.

Edellytyksenä hyvälaatuinen data

Datan laatu on asia, joka usein ajatellaan ”aina jonkun toisen huoleksi”. Usein dataa tuottavat yksiköt pyrkivät huolehtimaan, että data on riittävän hyvälaatuista omaan toimintaan. Lähtökohtaisesti data avataan kuitenkin siinä muodossa kun se on. Tämä tarkoittaa usein ohjeista poikkeamista tai esimerkiksi järjestelmien tietokenttien luovaa käyttöä. Yksikön ihmisillä voi usein olla hiljaisena tietona se, että ”emmehän me tuota oikeaa kenttää käytä, koska se on niin vaikeaa vaan käytämme tuota toista”. Lopputuloksena on data, jonka tulkinta on mahdotonta. Muiden tarpeet dataan liittyen nähdään omassakin organisaatiossa toisarvoisina ja sisäisesti muutoksen aikaansaaminen voi olla haastavaa. Organisaatioiden siiloutuneisuus vaikuttaa vahvasti myös tiedonhallintaan. Avoin data luo uuden ulottuvuuden tähän uusilla käyttötarkoituksilla. Dataa käytetään liiketoimintaan, sen kautta tulkitaan organisaation toimintaa tai sitä yhdistellään muihin tietoihin analytiikan tuottamiseksi.

Käsite ”data governance” eli datan hallintamalli nousee merkittävään rooliin. Käytännössä tämä tarkoittaa rooleja, vastuita ja prosesseja, joita datan hallintaan liittyy. Ensinnäkin kuka omistaa datan, kuka vastaa ylläpitoprosesseista, ja kuka vastaa data laadusta? Datan laadun seurantaan tulisi kehittää käytäntöjä. Hyvinkin yksinkertaiset mittarit voivat riittää: puuttuuko tietoja, onko postinumerokentässä kirjaimia tai nimessä numeroita. Mittareita voidaan kehittää hyvinkin tarkoiksi, mutta tärkeintä olisi, että niitä olisi ja niitä seurattaisiin. Jälkimmäisen voisi vielä alleviivata, sillä se on usein kohta, johon hyvin suunnitellut datan hallinnan toimintamallit kaatuvat. Myös toimintamallin puutteisiin pitäisi puuttua jo tiedon tuottamisessa, jotta data olisi lähtökohtaisesti laadukasta jo organisaation omaan toimintaan.

On tärkeää myös ymmärtää, että datan laatuun vaikuttavia virheitä on useita eri tyyppisiä. Osa virheistä syntyvät esimerkiksi tiedonsiirrossa. Nämä ovat usein systemaattisia ja helposti havaittavissa. Käyttäjistä johtuvat virheet voivat olla systemaattisia tai yksittäisiä. Systemaattisten virheiden osalta vaaditaan usein toimintamallin muutos. Tällöin tiedon omistaja on oleellisessa roolissa, jotta tarvittava muutos saada tehtyä. Yksittäiset virheet ovat usein helposti havaittavissa datan laadun seurannan kautta. Tärkeintä kuitenkin on, että yksittäisten virheiden korjaamiseen on määritelty toimivat prosessit ja vastuuhenkilöt.

Ulkoinen näkökulma laadun hallinnan prosessiin

Datan avaaminen voi edesauttaa laatua tuomalla uudenlaista painoarvoa laadun varmistamiselle. Huonolaatuinen data tuo negatiivista mainosta organisaatiolle. Mikäli avointa dataa käytetään liiketoiminnassa, tuo tämä uuden ulottuvuuden data laadun seurantaan. Yritykset seuraavat datan laatua tarkasti kun se toimii osana myytävää tuotetta. Useita käytännönesimerkkejä avatun datan laadun mittaamisesta on jo. Yksi näistä on Open Knowledge Foundation:n Open Data Census (http://fi-city.census.okfn.org/).

Myös uudet loppukäyttäjät toimivat datan laadun seuraajina. Virheistä ilmoitetaan myös herkästi jos se aiheuttaa ongelmia ostetussa palvelussa. Julkishallinnon organisaatioiden tulisi olla kykyä reagoida palautteisiin ja kehittää avaamansa datan laatua vastaamaan tarpeita. Tätä ei tule nähdä ylimääräisenä työnä, koska hyvälaatuinen data on perusedellytys myös omalle toiminnalle.

Laajimmillaan avoimuus voisi auttaa tietoa tuottavia organisaatioita kehittämään tiedonhallintaa avoimempaan suuntaan.  Monesti siiloutuneille julkishallinnon organisaatioille tämä on selkeä muutos totuttuihin toimintamalleihin, mutta voisi auttaa tuottamaan laadukkaampaa tietoa myös organisaation sisäiseen käyttöön. Avoimuus kannattaisikin hyödyntää yhtenä laadunhallinnan menetelmänä. Näin uskallettaisiin myös avata sitä liiketoiminnalle arvokasta tietoa.

Kuva: Condo Spiral Staircase III by Joe Wolf, (cc-by-nd-2.0)

Riikka Vilminko-Heikkinen

Palveluarkkitehti

Riikka Vilminko-Heikkinen työskentelee Gofore Oy:ssä palveluarkkitehtina ja pohtii miten julkishallinnon avaamaa dataa voisi käyttää laajemmin liiketoiminnassa ja digitalisaation tukena. Hän työskenteli aiemmin julkishallinnossa, jossa ehti muun muassa vastaamaan tietoarkkitehtuurin kehittämisestä ja datan avaamisen käytännöistä tiedon tuottajan näkökulmasta.

Gofore Oy

Gofore on teknologiayritys, jonka missio on muuttaa maailmaa digitalisaation avulla ja työkulttuuria uudistamalla.