Helsingin historialliset tilastot helpommin käyttöön

Kaupunkitiedon kokoamisella on Helsingissä pitkät perinteet, ja pisimmät tilastojen aikasarjat ulottuvat 1800-luvulle asti. Kiinnostavan tiedon kerääminen tutkimusta tai muuta analysointia varten on silti usein suuren työmäärän takana. Siksi historialliset aikasarjat julkaistaan nyt verkossa avoimena tietona.

Viime vuoden keväällä Helsingin kaupungin tietokeskuksessa käynnistyi projekti, jonka tavoitteena on ollut muodostaa Helsinkiä koskevia pitkiä aikasarjoja ja tuoda ne käyttäjien saataville verkkoon.

Tähän asti näihin tilastollisiin aikasarjoihin on voinut tutustua vanhoissa painetuissa julkaisuissa, mutta nyt osa niistä on saatettu paremmin ja avoimesti hyödynnettävään muotoon.

Kun päätin oman osuuteni projektissa, lopputuotoksena oli 45 kappaletta Helsinkiä eri näkökulmista kuvaavaa tilastoa, pieniä kurkistuksia menneen ajan elämään.

Aikasarjoja löytyy niin väestön, asumisen, työelämän ja elinkeinon kuin koulutuksenkin saralta. Aivan kaikki taulukot eivät ole aikasarjoja, vaan mukaan mahtuu myös muutama poikkileikkausaineisto. Aineistot on nyt julkaistu Aluesarjat-tilastotietokannassa(Linkki johtaa ulkoiseen palveluun) sekä avoimen tiedon palvelu Helsinki Region Infosharessa(Linkki johtaa ulkoiseen palveluun).

Suurin osa kokoamistani historiallisista aikasarjoista on työstetty Helsingin tilastollisen vuosikirjan taulukoista.

Vuodesta 1908 lähtien julkaistu vuosikirja on merkittävä kaupunkitiedon lähde, johon on sen varhaisimmista vuosista alkaen kerätty tietoa muun muassa Helsingin väestöstä, terveydenhoidosta, koulutuksesta, asumisesta, rakentamisesta ja teollisuudesta.

Vanhimmat vuosikirjat sisälsivät tietoa myös esimerkiksi vaivaishoidosta, valaistustoimesta, hyödykkeiden hinnoista ja jopa kaupungin viemärikanavista.

Näitä vuosikirjan sisältämiä tilastoja nostettiin laajalti esille vuonna 2000 ilmestyneessä upeassa juhlajulkaisussa Helsinki tilastoina 1800-luvulta nykypäivään (vain painojulkaisuna, löytyy tietokeskuksen kirjastosta(Linkki johtaa ulkoiseen palveluun)). Kirja osoittaa, millaisten historiakuvausten tekemisen pitkä tilastoperinne mahdollistaa.

Vanhin aikasarja 1800-luvun alusta

Käyttäjän näkökulmasta – olipa tämä sitten tutkija, opiskelija tai historiatiedosta yleisesti kiinnostunut – ongelmallista voi olla tiedon heikko tekninen saatavuus.

Tyypillisesti tutkimustulokset esitellään artikkeleissa koostetaulukoissa, taulukoita joutuu etsimään painetuista julkaisuista, ja jopa digitoitu tieto on käytännössä tarjolla vain pdf-muodossa. Kiinnostavan tiedon kerääminen tutkimusta tai muuta analysointia varten voi olla kohtuuttoman työmäärän takana.

Helsingin kaupunki on sitoutunut avaamaan julkisia tietovarantojaan avoimena datana, toisin sanoen vapaasti ja ilmaiseksi koneluettavassa muodossa käytettäväksi. Helsinki Region Infoshare(Linkki johtaa ulkoiseen palveluun) -palvelusta löytyy jo runsaasti tilastoja ja muuta dataa, joka on tällä tavoin kenen tahansa hyödynnettävissä.

Nyt avattavat historialliset aikasarjat tuovat pienen lisänsä tähän pioneerityöhön.

Pisimmälle historiaan ulottuvat aikasarjat sisältävät tietoa Helsingissä syntyneistä ja kuolleista(Linkki johtaa ulkoiseen palveluun). Aineisto alkaa vuodesta 1811 ja tarkastelee muun muassa kuolleisuuden syitä ja imeväiskuolleisuutta.

Väestötieteestä kiinnostuneille on lisäksi tarjolla ikäryhmittäisiä hedelmällisyyslukuja 1930-luvulta lähtien(Linkki johtaa ulkoiseen palveluun). Ja aikasarjasta Helsingin väkiluku kaupunginosittain vuosina 1875–1960(Linkki johtaa ulkoiseen palveluun) saisi varmasti hienon karttavisualisoinnin!

Itseäni kiinnostaa kansa- ja oppikouluja kuvaavien tilastojen informaatio.  Aineistoista on muun muassa mahdollisuus tutkia kansakoulujen oppilaiden vanhempien sosiaalista taustaa(Linkki johtaa ulkoiseen palveluun) sekä sitä, millainen merkitys sivistyspohjalla oli oppikouluun pääsemisessä(Linkki johtaa ulkoiseen palveluun) ja mitä väylää valtion ja yksityisiin oppikouluihin päästiin.

Ja jo mainituissa poikkileikkausaineistoissa on kyse työväen asunto-oloja kartoittavasta tutkimuksesta(Linkki johtaa ulkoiseen palveluun), jonka myötä Helsingin tilastokonttorikin, nykyisin siis tietokeskus, on saanut alkunsa.

Monia varmasti kiinnostaa vuokra-asuntojen hintakehitys(Linkki johtaa ulkoiseen palveluun), josta siitäkin löytyy tietoa vuodesta 1900 lähtien.

Tiedosta ei saa aina yhteismitallista

Mitä pidemmälle historiassa mennään, sitä haastavampaa yhtenäisten aikasarjojen luominen on. Tilastoinnin kehittyessä tieto toki tarkentuu, mutta vertailtavuus hankaloituu.

Aikasarjojen tekeminen on ollut paljon työläämpää kuin työn aloittaessani uskoinkaan. Tämä on johtunut muun muassa muuttujien määrällisistä ja määritelmällisistä muutoksista ja lähteiden runsaudesta.

Lähteiden merkitsemisessä olen noudattanut erityistä huolellisuutta, sillä historiallisten kehityslinjojen hahmottelemiseksi on erityisen tärkeää kyetä arvioimaan tiedon paikkansapitävyyttä.

Suomella on pitkät tilastoperinteet, mikä moninaisuudessaan asetti työlle omat haasteensa. Väestötaulukoissa vilisivät termit ”todellinen väestö”, ”kaupungissa asuva väestö” ja ”todella läsnäollut väestö”. Lisäksi lähteinä vaihtelivat henkikirjat, kirkonkirjat, väestölaskennat, korjatut väestötiedot jne.

Suomen väestökirjanpito olikin alkujaan jakaantunut kahteen osaan, henki- ja kirkonkirjoihin.

Koska molemmat lähteet antoivat väestön määrästä jokseenkin väärän kuvan, ryhdyttiin 1800-luvun lopulla Helsingissä ja Suomen muissa suurimmissa kaupungeissa toimittamaan väestölaskentoja ”oikean” väkiluvun todentamiseksi. Lainausmerkit sen tähden, että tilastotieto ei voi koskaan antaa käsittelemästään asiasta täysin kattavaa kuvaa, vaan aina joudutaan rajaamaan, poissulkemaan ja tiivistämään.

Vuonna 1950 toteutettiin ensimmäinen koko maan kattava väestölaskenta, jonka avulla vuosikirjojenkin väestötaulukoita on takautuvasti korjattu aina 1900-luvun alkuun.

Edellä esitetyn perusteella on selvää, ettei kaikkea tietoa ole pystytty yhteismitallistamaan, eikä aikasarjojen antamia tietoja voi tulkita absoluuttisesti. Käsillä olevat aikasarjat sisältävät kuitenkin parasta mahdollista saatavilla olevaa tietoa, joten on perusteltua tarjota niitä kaikkien hyödynnettäväksi.

Marjukka Vartiainen toimi projektisuunnittelijana Helsingin kaupungin tietokeskuksessa vuonna 2015. Tarkempia taustatietoja Helsingin historiallisten tilastojen käytön tueksi löytyy kirjoittajan laatimasta oppaasta (pdf-julkaisu).