Avoimen datan vaikuttavuus – mitä tiedämme, miten tutkia?

Valtionhallinnon tietovarantojen systemaattinen avaaminen vuodesta 2012 alkaen on tehnyt Suomesta yhden julkisen sektorin tietojen avaamisen edelläkävijämaan. Myös suurimmat kaupungit (Helsinki, Espoo, Vantaa, Tampere, Turku ja Oulu) ovat lähteneet kehittämään 6Aika –strategian puitteissa kaupunkien tietovarantojen avaamista ja hyödyntämistä yhteistyössä yritysten ja muiden kehittäjien kanssa.

Avoimen datan vaikuttavuuden mittaamista ja sen kustannustehokasta hyödyntämistä pohditaan tällä hetkellä Valtioneuvoston selvitys- ja tutkimustoiminnan (VN-TEAS) rahoituksella toteutettavassa ”Avoimen datan kustannustehokas hyödyntäminen” –hankkeessa.  Etlan ja Open Knowledge Finlandin yhteishankkeen pohjana käytetään Valtiovarainministeriön julkaisua ”Avoimen tiedon vaikuttavuus – Esitutkimusraportti”.

Minkälaisia yhteiskunnallis-taloudellisia vaikutuksia avoimelta datalta odotetaan?

Ennakollisissa arvioinneissa esitettyjen laskelmien mukaan julkisen datan avaamisesta saadaan mittavia yhteiskunnallis-taloudellisia hyötyjä.

Yritykset kehittävät avoimeen dataan perustuvia uusia tuotteita ja palveluita ja pystyvät tehostamaan toimintaansa uusilla, dataperusteisilla päätöksentekojärjestelmillä.  Tämä voi parhaimmillaan näkyä yritysten kasvuna ja niiden tuottavuuden paranemisena. Myös uusia datan hyödyntämiseen perustuvia yrityksiä syntyy.

Kansalaisille suurimpia avoimen datan taloudellisia hyötyjä on arvioitu syntyvän aiemmin maksullisen tiedon muuttumisesta maksuttomaksi sekä avoimen datan mahdollistamasta ajankäytön tehostumisesta.

Avoin data tarjoaa myös julkisen sektorin organisaatioille mahdollisuuden palveluidensa tehostamiseen ja kustannussäästöihin.

Taloudellisten vaikutusten lisäksi on esitetty iso joukko muita potentiaalisia datan avaamisen yhteiskunnallisia vaikutuksia liittyen mm. koulutukseen, terveyteen, hallinnon ja päätöksenteon avoimuuteen ja läpinäkyvyyteen, kansalaisten vaikutusmahdollisuuksiin ja yhteiskunnalliseen osallistumiseen sekä kestävään kehitykseen ja liikenteeseen.

Avoimen datan vaikuttavuudesta ei ole kattavaa arviota

Tieto julkisten tietovarantojen avaamisen toteutuneista vaikutuksista perustuu yhä paljolti case-esimerkkeihin. Tilastolliseen aineistoanalyysiin perustuvia kvantitatiivisia tutkimuksia avoimen datan vaikuttavuudesta on raportoitu varsin vähän. Kattavaa arviota avoimen datan toteutuneesta vaikuttavuudesta ei ole toteutettu missään maassa.

Keskeisenä syynä tähän on se, että tällä hetkellä avoimen datan hyödyntämisen vaikuttavuutta ei pystytä systemaattisesti tutkimaan olemassa oleviin tai kerättyihin tietoihin perustuen. Esimerkiksi Suomessa lakisääteisiin, säännöllisesti toteutettaviin yritysten toimintaa kartoittaviin kyselyihin kuten Tilastokeskuksen ”Tietotekniikan käyttö yrityksissä” ei sisälly tällä hetkellä avoimen datan hyödyntämistä mittaavia kysymyksiä.

Avoimen datan hyödyntämistä mittaavien kysymysten sisällyttäminen lakisääteisiin kyselytutkimuksiin mahdollistaisi avoimen datan käytön pitkäaikaisen tilastoinnin ja seurannan. Lisäksi avoimen datan taloudellista vaikuttavuutta voitaisiin tutkia kvantitatiivisesti, kehittyneitä tilastollisia menetelmiä käyttäen, kun kyselyaineistot yhdistettäisiin muihin yritys- tai henkilötason tietokantoihin. Samoin muiden yhteiskunnallisten vaikutusten tutkimuksessa voitaisiin hyödyntää kyselytutkimuksia. Näiden vaikutusten analysointiin sopisivat pääasiassa laadulliset tutkimukset.

Onko avoimen datan käyttäjien anonyymius välttämätöntä?

Keskeiset julkisten rekisteriaineistojen hallinnoijat ovat tyypillisesti omaksuneet tiukan avoimen datan periaatteen, ettei tiedon käyttäjän tarvitse rekisteröityä avointa dataa tarjoavaan palveluun eikä tietoja käyttäviä henkilöitä tai yrityksiä pyritä tunnistamaan.  Monessa organisaatiossa käyttäjien anonyymius on nostettu yhdeksi avoimen datan periaatteeksi.

Avoimen datan vaikuttavuuden tutkimuksen näkökulmasta datan käyttäjien anonyymius hankaloittaa työtä. Mikäli avoimen datan vaikuttavuuden tutkimukseen halutaan panostaa, tulisi vakavasti harkita olisiko datan käyttäjien tunnistaminen tutkimuskäyttöä varten mahdollinen ratkaisu. Käyttäjätiedot eivät luonnollisestikaan olisi julkista tietoa vaan – kuten esimerkiksi lakisääteisillä kyselyillä kerätyt tiedot – luottamuksellisina käsiteltäviä ja yksittäistä käyttäjää koskevat tiedot salaisia.  Avoimen datan vaikuttavuuden tutkimiseksi tietoja voitaisiin yhdistää esimerkiksi yritysten tilinpäätöstietoihin samaan tapaan kuin Tilastokeskuksessa yhdistetään yritysten kyselyaineistotietojakin luottamuksellisesti käsiteltävien tutkimusaineistojen muodostamiseksi.

Käyttäjänäkökulmasta avoimen datan käyttäjätietojen kerääminen luottamuksellisiin, vain tutkimuskäytössä hyödynnettäviin tietokantoihin ei tunnu kovin radikaalilta ratkaisulta maailmassa, jossa yritykset keräävät ja myyvät hyvinkin yksityiskohtaisia asiakastietoja kaupallisiin tarkoituksiin.

Heli Koski

Tutkimuspäällikkö

Heli Koski työskentelee tutkimuspäällikkönä Elinkeinoelämän tutkimuslaitoksessa ja toimii lisäksi Aalto-yliopistossa ohjelmajohtajana Suomen Akatemian strategisen tutkimuksen neuvoston “Teknologiamurrokset ja muuttuvat instituutiot” –ohjelmassa.