Konferenssissa keskusteltiin tilastoalan erityiskysymyksistä neljän aihekokonaisuuden alla, joita olivat tiedonhallinta, datan käsittely ja analysointi, tiedon jakaminen ja tietoon liittyvä julkinen keskustelu sekä alan tulevaisuus. Kolmesta pääpuhujasta akatemiaprofessori Samuel Kaski käsitteli tekoälyä ja koneoppimista virallisen tilaston kentällä, kansainvälisten asioiden johtaja Indrek Õnnik Viron valtion tietohallinnosta julkisen sektorin digitalisaatiokehitystä ja presidentti Tarja Halonen tilastotiedon merkitystä päätöksenteossa. Tapahtumassa pidettiin kaikkiaan 72 esitystä.
Tiedonhallinnan ja metatietojen merkitys korostuu tiedon ja sen käytön lisääntyessä
Hyödynnettävissä olevan tiedon määrä on kasvanut viime vuosina voimakkaasti ja kasvu jatkuu digitalisaatiokehityksen myötä alati kiihtyvällä vauhdilla. Tiedonhallintaan liittyvissä esityksissä tuotiinkin voimakkaasti esiin, että tietoa ei kerätä enää vain yhtä käyttötarkoitusta varten, vaan eri tietolähteisiin kerääntyvää tietoa on voitava hyödyntää luovasti mitä moninaisimpiin tarpeisiin. Tämä puolestaan edellyttää nykyistä voimakkaampaa panostusta tietovarantojen hallintaan.
Tietovarantojen monipuolinen ja laajamittainen hyödyntäminen edellyttää hyvin järjestettyjä metatietoja ja niiden päälle rakennettuja metatietopalveluja. Nämä mahdollistavat eri käyttötilanteissa tarvittavien tietojen löydettävyyden ja niiden käytettävyyden arvioinnin. Esimerkiksi Viron tilastoviranomainen on perustanut tätä varten uuden yksikön, jonka tehtävänä on varmistaa, että ylläpidettäviin tietovarantoihin liitetään yhdenmukaiset metatiedot. Lisäksi yksikkö kehittää metatietoihin perustuvia palveluja, jotka helpottavat tietojen löydettävyyttä ja hyödynnettävyyttä. Viron tilastokeskuksen asiantuntijat korostivat esityksessään myös sitä, että metatietojen tulisi olla harmonisoituja niin organisaatioiden sisällä kuin niiden välillä. Hyvän tiedonhallinnan ja metatietojen merkitys korostui monissa muissakin puheenvuoroissa. Tähän on herätty aivan uudella tavalla nyt, kun tietoa on alettu hyödyntää aiempaa enemmän esimerkiksi erilaisissa tekoäly- ja tiedolla johtamisen hankkeissa.
Digitalisaatio tarjoaa tilastoalalle uusia mahdollisuuksia, mutta datan laatua ja yhteentoimivuutta pitää parantaa
Tilastoalalla digitalisaatio merkitsee ennen muuta uudenlaisia mahdollisuuksia tuottaa ja jakaa tarvittavaa tietoa eri ilmiöalueista. Tarjolla on uusia tiedonkeruumenetelmiä ja tietolähteitä, joilla voidaan täydentää tai jopa korvata aiemmin käytettyjä menetelmiä ja tietolähteitä. Tämän lisäksi digitaalisessa muodossa olevat aineistot tarjoavat uusia mahdollisuuksia myös eri lähteistä peräisin olevien tietojen yhdistelyyn ja käsittelyyn.
Uusien tietolähteiden hyödyntämistä on kokeiltu hyvinkin erilaisissa asiayhteyksissä, kuten kuluttajahintaindeksin laskennassa tai matkailijatilastojen laatimisessa. Matkailutilastojen yhteydessä olemassa olevien tietolähteiden rinnalla on testattu esimerkiksi autonvuokraustietojen hyödyntämistä. Tietojen yhdistelymahdollisuuksia on kokeiltu muun muassa yhteispohjoismaisten muuttoliiketilastojen sekä työtapaturmatilastojen laadinnassa. Toisen tyyppistä tietojen yhdistämistä edustaa puolestaan esimerkki, jossa tilastotiedot yhdistetään kohteita kuvaaviin paikkatietoihin. Näiden esimerkkien ohella konferenssin esityksissä käsiteltiin muun muassa koneoppimisen mahdollisuuksia lähtötietojen luokittelussa.
Digitalisaation tuomiin muutoksiin liittyy paljon optimismia, mutta samalla työtä on vielä edessä, jotta uusista mahdollisuuksista päästään kunnolla hyötymään. Positiivisina puolina puhujat näkivät muun muassa työn tehostumisen, inhimillisten virheiden vähenemisen tietoja käsiteltäessä sekä ennen muuta sen, että käyttöön saadaan parempia tietoaineistoja. Samalla asioita voidaan tarkastella aiempaa ilmiölähtöisemmin, sillä käyttöön saadaan aineistoja, jotka valottavat ilmiöitä monipuolisemmin. Eniten huolta puolestaan näyttäisi aiheuttavan edelleen lähtötietojen laatu ja niiden yhteentoimimattomuus. Lähtötiedoissa on yhä paljon puutteita ja suoranaisia virheitä, joita joudutaan korjaamaan jälkikäteen. Tämä on työlästä ja alentaa merkittävästi prosessien tehokkuutta. Lisäksi eri tiedontuottajat käyttävät usein erilaisia käsitteitä, tunnistetietoja tai tiedonkeruumenetelmiä, joista aiheutuu ongelmia tietoja yhdisteltäessä.
Konferenssissa esiintyneet asiantuntijat korostivatkin tiedon tuottajatahojen välisen yhteistyön merkitystä. Tämä tarkoittaa tilastoviranomaisten tai julkisen sektorin välisen yhteistyön lisäksi sitä, että yhteistyötä lisätään myös yksityisen sektorin tiedontuottajien suuntaan. Lisäksi todettiin, että dataan ja datasta johdetun tiedon validiteettikysymyksiin pitää kiinnittää erityistä huomiota. Ylipäätään korostettiin tiedon laatukuvausten tärkeyttä. Vaikka aina ei olekaan mahdollista antaa tarkkoja tilastotieteen menetelmiin perustuvia numeerisia laatuarvioita, niin aina on mahdollista kuvata tiedon laatua sanallisesti.
Vaihtoehtoiset totuudet puhuttavat myös tilastoalalla
Kysymys tilastotiedon ja päätöksenteon välisestä suhteesta on tilastoalan kannalta oleellinen, joten ei liene suuri yllätys, että konferenssin puheenvuoroissa ja keskusteluissa nousi toistuvasti esiin kysymys ns. vaihtoehtoisista totuuksista. Valtava tietomäärä, tiedon analysointimahdollisuudet ja tehokkaat tiedonvälityskanavat antavat mahdollisuuden tulkita todellisuutta dataan perustuen monella eri tavalla. Tämä lisää tahallisten tai tahattomien väärinymmärrysten riskiä. Konferenssissa nousikin vahvasti esiin tilastoalan hyviin käytäntöihin ja luotettaviin tietolähteisiin nojaavan tiedon merkitys, mutta samalla myös huoli siitä, että jämäkkä tieto hukkuu tietotulvaan ja eikä siten saa ansaitsemaansa huomiota.
Pohjoismaiden tilastoviranomaiset ovat tunnistaneet ongelman, ja esitysten perusteella ongelmat johtuvat monista eri tekijöistä. Ensinnäkin luotettavien tietolähteiden tunnistaminen voi olla vaikeaa. Myös tilastojen lukutaitoa tulisi parantaa. Mediakaan ei ole osaton. Vaikka erityisesti laatumediat pyrkivät luotettavaan tietoon ja faktojen käyttöön, monien kohdalla houkutus huomiohakuisiin klikkiotsikoihin nousee liian suureksi, ja taustatietojen huolellinen ja kriittinen tarkastelu unohtuu. Väärät käsitykset leviävät nopeasti ja niiden korjaaminen on vaikeaa. Sosiaalinen media on sitten vielä oma lukunsa. Mielenkiintoinen näkemys oli myös se, että datan avaaminen ei yksinomaan ratkaise ongelmaa. Vaikka tiedon hyödyntäjällä olisi hyvät aikomukset, voi hän päätyä käyttämään sitä harhaanjohtavasti, sillä erilaisten tietolähteiden ja määritelmien kirjo voi hämätä myös kokenutta tiedon hyödyntäjää.
Tilastoalalla on selvästi herätty valeuutisten asettamaan haasteeseen. Esimerkiksi Norjan tilastoviranomainen pyrkii aktiivisesti reagoimaan valeuutisiin ja niiden ilmentymiin muun muassa osallistumalla keskusteluun. Saman tyyppistä toimintatapaa ajaa sisään myös Suomen Tilastokeskus, joka sekin pyrkii lisäämään osallistumista faktapohjaisesti ajankohtaiseen yhteiskunnalliseen keskusteluun.
Konferenssin esityksissä nousi esiin monia muitakin keinoja puuttua valeuutisiin ja niiden vaikutuksiin. Tilastoviranomaiset pyrkivät edistämään kansalaisten tilastojenlukutaitoa esimerkiksi tarjoamalla koulutusta ja järjestämällä tilastoalan kilpailuja lukioissa ja yläasteen kouluissa. Vaikka tilastoja ja muita tietotuotteita hyödyntävät nykyisin erityisesti asiantuntijat, huomiota halutaan kiinnittää jatkossa enemmän myös laajaan joukkoon muita tiedonkäyttäjiä. Erilaiset tiedon käyttäjät ja käyttötilanteet halutaan tunnistaa nykyistä paremmin, jolloin eri käyttötilanteisiin voidaan tuottaa räätälöityjä tietotuotteita.
Tietotuotteiden jalostusastetta halutaan nostaa muutenkin. Esimerkiksi Alankomaiden tilastoviranomainen on ottanut käyttöön uuden lähestymistavan, joka ottaa huomioon ihmiselle tyypilliset piirteet: visuaalisen orientaation sekä kyvyn muistaa tunnepitoisia asioita ja tarinoita paremmin kuin yksittäisiä faktoja. Tämä muuttaa tapaa, jolla tilastoista on totuttu raportoimaan. Digitaaliset julkaisukanavat tukevat visuaalista esitystapaa ja toimivat siten muutoksen katalysaattorina. Tässä yhteydessä tilastoalan asiantuntijat muistuttivat itseään myös siitä, että mielenkiinnon kohteena eivät varsinaisesti ole tilastot itsessään, vaan ilmiöt, joita tilastojen avulla kuvataan. Mielenkiinto tilastoja kohtaan lisääntyy, kun tilastot ja niistä johdetut tulkinnat onnistutaan kytkemään mielenkiintoisella tavalla ajankohtaisiin kysymyksiin.
Oman mausteensa tähän keskusteluun toi myös EU:n saavutettavuusdirektiivi ja tänä vuonna voimaan astunut kansallinen laki digitaalisten palvelujen tarjoamisesta. Näiden avulla pyritään edistämään kaikkien mahdollisuutta toimia digitaalisessa yhteiskunnassa sekä parantamaan digitaalisten palveluiden laatua. Julkishallinnon verkkosivujen ja mobiilisovellusten sekä niiden sisältöjen tulee olla sellaisia, että kuka tahansa voi niitä käyttää ja ymmärtää mitä niissä sanotaan. Kaikilla tulee olla yhdenvertainen pääsy myös tilastoihin ja tutkimustuloksiin.
Alan tulevaisuus näyttää valoisalta, mutta edellyttää uudenlaista osaamista ja työtapoja
Tietotekniikan kehittyminen on tehnyt tiedon keräämisen helpoksi ja nopeaksi, ja monissa tapauksissa käytettävissä on entistä laajempia ja yksityiskohtaisempia tietoaineistoja. Laadukkaalla tiedolla on kysyntää, samoin osaajilla, jotka pystyvät jalostamaan datasta tarvittavaa tietoa ajantasaisesti ja ymmärrettävällä tavalla esitettynä. Käynnissä on lukuisia tilastotieteeseen perustuvia tekoälykokeiluja, ja monilla aloilla tekoälyn hyödyntäminen alkaa olla arkipäivää. Kuten Samuel Kaski esityksessään totesi, tekoälyä hyödynnetään jo nyt kaikilla aloilla, mutta tulevaisuudessa siitä ollaan riippuvaisia. Alan tulevaisuus näyttää siten valoisalta.
Samaan aikaan tilastoviranomaisten perinteinen rooli hallitsevana tiedon kerääjänä ja ylläpitäjänä on muuttunut. Tiedonkeruuta tekevät enenevissä määrin myös muut tahot, ja nämä tiedot eivät aina täytä tilastoviranomaisten perinteisesti tilastoihin kohdistamia vaatimuksia. Jokainen voi valita käyttöönsä sen tiedon, joka tukee heidän omia ajatuksiaan ja jonka he uskovat olevan totta. Tämä lisää riskiä, että tietojen pohjalta tehdään tulkintoja ja yleistyksiä, joihin käytetty tieto ei anna riittävän vahvaa perustaa. Keskeinen kysymys ja haaste onkin, miten tilastoviranomaisten tuottama laadukas tieto pystyy jatkossa kilpailemaan muiden tarjolla olevien tietotuotteiden kanssa.
Monissa esityksissä todettiin, että tilastoalan on muututtava digitaalisen murroksen mukana. Tilastoalan tulee jatkossa tuntea paremmin tiedon käyttäjät ja heidän tarpeensa, ja sen on kyettävä vastaamaan näihin tarpeisiin nykyistä paremmin. Uusia tietolähteitä ja teknologioita on otettava käyttöön ja hyödynnettävä niitä luovasti ja nykyistä tehokkaammin – kuitenkin niin, että mittausmenetelmien kelpoisuudesta ja tulosten oikeellisuudesta pidetään kiinni. Tilastoalan on myös kyettävä tarttumaan rohkeasti ajankohtaisiin aiheisiin ja osallistumaan ajankohtaiseen keskusteluun. Lisäksi sen on tarjottava keskusteluun erilaisia dataan ja ilmiöalueiden tuntemiseen perustuvia tulevaisuuden näkymiä. Työtapa muuttuu yksilökeskeisestä asiantuntijatyöstä tiimityöskentelyyn, jossa tulokset syntyvät usean eri alan osaajan yhteistyönä. Tilastoalan ammattilaisten tuleekin tunnistaa oma roolinsa uudella tavalla ja löydettävä sitä kautta paikkansa osana laajempaa ja muuttuvaa tietoekosysteemiä.
Tilastoalan haasteet ovat kaikkialla samat. Uudet mahdollisuudet pitää käyttää hyväksi, mutta samalla pitää huolehtia asioista, jotka ovat jo pitkään olleet tilastoalan ydintä, kuten tiedon kaikinpuolisesta laadusta ja luotettavuudesta sekä yksilöiden oikeuksista tietosuojaan ja -turvaan. Yhteiskunnallinen kehitys kansallisesti ja kansainvälisesti haastaa tilastoalaa monelta eri suunnalta. Siksi onkin tärkeää, että alan asiantuntijat ja tiedon hyödyntäjät kokoontuvat aika ajoin yhteen vaihtamaan ajatuksia ja oppimaan toisten kokemuksista. Yhteiset tapaamiset edistävät yhteistyötä, joka vaikuttaakin konferenssin esitysten perusteella olevan vireää.
Konferenssin esitykset ovat ladattavissa konferenssin verkkosivuilta osoitteesta: https://nsm2019.fi/(Linkki johtaa ulkoiseen palveluun)