Mitä asukkaat haluavat sanoa metsistä ja luonnosta Helsingin kaupungille – tuloksia kaupunkilaisten palautteiden analyysista

Metsäaiheisissa palautteissa korostuu etenkin asukkaiden toive, että kaupunki poistaisi luontoalueilta roskia ja muita asioita, jotka häiritsevät kaupunkilaisia heidän ympäristössään. Palauteaiheet ovat melko samankaltaisia eri puolilla kaupunkia. Tässä tutkimuksessa sovellettiin tekoälypohjaista menetelmää aihemallinnusta, joilla suurten palautemäärien sisällöistä voitiin muodostaa kattava kuva. Analyysin tulokset auttavat kaupunkia kehittämään asuinympäristöjä asukkaiden mielipiteet huomioiden.

Helsingin kaupunki saa lisääntyvissä määrin kaupunkilaisilta palautetta eri väyliä pitkin. Keskeisin kanava palautteiden antamiseen on palautejärjestelmä, johon ohjataan kaupungin verkkosivuilla antamaan palautetta palveluista tai ilmoittamaan vaikkapa kuopasta kadulla. Kaupunkilaisten näkemysten selvittäminen lisää heidän osallisuuttaan silloin, kun palautteet aidosti huomioidaan kaupungin kehittämisessä (ks. Arnstein 1969). Helsingin strategisena tavoitteena on hyödyntää asukaspalautetta päätöksenteossaan muun muassa niin, että eri kaupunginosissa asuvat helsinkiläiset todella vaikuttavat omaan asuinympäristöönsä (Helsingin kaupunki 2021).  

Kaupunkilaisten palautteiden kattavaa hyödyntämistä hankaloittaa niiden sisältöjen selvittämisen vaatima työmäärä. Tekoälypohjaiset ohjaamattoman koneoppimisen menetelmät antavat kuitenkin uusia mahdollisuuksia analysoida kaupunkilaisten palautteita (Lybeck et al. 2018, Kowalski et al. 2020). Vaikka nämä jatkuvasti kehittyvät menetelmät mahdollistavat suurten tekstiaineistojen etäluentaa, yhteiskuntatieteellisessä tutkimuksessa on edelleen tärkeää, että tekstiä samalla myös luetaan tarkkaan varmistuen analyysin laadusta ja aineiston tärkeistä sisällöistä (Isoaho et al. 2021, Ylä-Anttila et al. 2022). Esimerkiksi ohjaamattoman koneoppimisen menetelmä aihemallinnus auttaa jäsentämään aineistoa, mutta tarvitsee tutkijan tulkitsemaan mallinnuksen tuloksia (Mohr 2013).

Tässä artikkelissa tarkastellaan Helsingin kaupunkiympäristön toimialan saamia metsä- ja luontoaiheisia palautteita aikavälillä tammikuu 2015 – toukokuu 2023 soveltaen aihemallinnusta. Lähiluontoon liittyy kaupungeissa monenlaisia paineita ja tarpeita. Tutkimuksissa on todettu lähiluonnon tuottavan asukkaille hyvinvointi- ja terveyshyötyjä (mm. Engemann et al. 2019, Maas et al. 2006) ja kaupunkilaisten huoli kaupunkiluonnon puolesta näkyy muun muassa Helsingin toteuttamissa kyselytutkimuksissa (Järvelä 2024, Hirvonen 2023, Keskinen et al. 2023). Kasvun, luontoarvojen ja segregaation ehkäisemisen tavoitteiden yhteensovittaminen on yksi keskeisiä kysymyksiä Helsingin kaupungille.

Aiempi tutkimus: kaupunkilaisten näkökulmia kaupunkiluontoon

Kaupunkiluonnon arvoa voidaan arvioida ekologisesta näkökulmasta esimerkiksi kartoittamalla sen kasvillisuutta, monimuotoisuutta tai meluisuutta. Näiden näkökulmien lisäksi luonnon arvoa voidaan tarkastella ihmisnäkökulmasta selvittäen, millaisen luonnon kaupunkilaiset kokevat itselleen tärkeäksi. Kaupunkilaisten kokemustieto auttaa viheralueiden suunnittelussa ekologisen asiantuntijatiedon rinnalla (esim. Faehnle et al. 2014).  

Usein juuri ekologisesti arvokas luonto koetaan arvokkaaksi myös ihmisten keskuudessa. Silti lähiluonto saattaa olla kaupunkilaisille tärkeää myös viheralueen mitatusta ekologisesta laadusta riippumatta. Viheralueen mitattu biodiversiteetti näyttäisi vaikuttavan positiivisesti helsinkiläisten käsityksiin viheralueen ainutlaatuisuudesta, mutta yhteydet joidenkin ekologista arvoa mittaavien tekijöiden ja ihmisten kokemusten välillä ovat erilaisia (Wang et al. 2019). Myös Espoossa toteutetussa tutkimuksessa havaittiin ympäristön mitatun laadun olevan yhteydessä sen koettuun laatuun, kun katsottiin koko kaupungin kattavaa aineistoa kokonaisuutena. Naapurustotasolla tällaisia yhteyksiä ei kuitenkaan havaittu, mikä saattaisi viitata lähiluonnon koettuun tärkeyteen sen ekologisista arvoista riippumatta. (Kajosaari et al. 2024.)  

Ihmisten näkemyksiä kaupunkiluonnon arvosta voidaan louhia suurista tekstimassoista hyödyntäen aihemallinnusta. Esimerkiksi Etelä-Koreassa haluttiin selvittää kaupunkimetsien kävijöiden motivaatiota viettää aikaansa luonnossa aihemallintamalla sosiaalisen median aineistoja. Tutkimuksessa selvisi, että metsissä käydään rentoutumassa, viettämässä vapaa-aikaa ja urheilemassa ja että esimerkiksi metsien koettu kauneus ja puhtaus ovat näissä käyttötarkoituksissa kävijöille tärkeitä elementtejä. (Kim et al. 2021.)  

Aineisto ja menetelmät  

Tutkimuksen lähtöaineistona olivat Helsingin palautejärjestelmään lähetetyt ja kaupunkiympäristön toimialalle ohjautuneet palautteet aikavälillä tammikuu 2015–toukokuu 2023 (noin 350 000 palautetta). Palautejärjestelmään tulleet palautteet edellyttävät lähtökohtaisesti sitä, että kaupunkilainen itse päättää lähettää viestin haluamastaan aiheesta ja löytää palautekanavan. Kanavana palautejärjestelmä siis eroaa esimerkiksi kyselytutkimusten avovastauksista tai kaavoihin liittyvistä kuulemisista, joissa kaupunki toimittaa kaupunkilaiselle kommentoitavaa materiaalia ja täten myös ohjaa palautteen fokusta. Kaupunkilaisten palautteiden erityinen arvo on siinä, että ne sisältävät mielipiteitä hyvin laaja-alaisesti kaupungin palveluista (Kowalski et al. 2020), sillä kaupunkilaiset itse valitsevat mitä haluavat palautteessaan kommentoida. Kansalaispalautteissa halutaan usein kertoa toimimattomasta palvelusta, johon palautteenantaja tuntee oikeudekseen ehdottaa muutosta (Minelli & Ruffini 2018).

Aineisto anonymisoitiin niin, että henkilötiedot poistettiin aineistosta paikkamerkintöjä lukuun ottamatta. Lisäksi aineisto esikäsiteltiin aihemallinnusta varten. Ensin palautteiden sanat perusmuotoistettiin. Tutkimuskysymykseen vastaamiseksi aineistosta luotiin pienempi aineisto, joka sisälsi ne palautteet, joissa mainittiin sana ”metsä” tai ”luonto”. Lisäksi alkuperäistä aineistoa luettiin valitsemalla siitä palautteita satunnaisesti, ja päätettiin poimia mukaan myös yhdyssanat ”luontoarvo” ja ”luonnonläheisyys”.  Palautteista 65 prosenttia päätyi aineistoon sillä perusteella, että palaute sisälsi sanan ”metsä”. Tässä artikkelissa näin koottuun aineistoon viitataan metsäpalautteina.

Ohjaamattoman koneoppimisen menetelmän aihemallinnuksen avulla tutkittiin, mitkä sanat esiintyivät palautteissa yhdessä muodostaen oman aiheensa. Aihemallinnus laskee jokaiselle palautteelle ja jokaiselle sanalle kuuluvuuden kaikkiin aiheisiin. Aiheiden mielekkyyttä arvioitiin lukemalla eri aiheissa yleisimmin esiintyviä sanoja ja pohtimalla, voidaanko kokonaisuudelle antaa mielekäs tulkinta. Mallin valinnassa kokeiltiin lyhyiden tekstien aihemallinnukseen soveltuvia algoritmeja kiinnittäen huomiota muun muassa aiheiden määrän valintaan1(Link leads to external service) (ks. esim. Abdelmotaleb 2023, Nelimarkka 2019). Aineistosta myös luettiin etenkin parhaiten mallin aiheisiin sopivia yksittäisiä palautteita. Lopulta valittiin seitsemän2(Link leads to external service) aiheen malli, jonka aiheille annettiin nimet.  

Metsäpalautteiden aiheina korostuvat roskat luonnossa ja kaatuneet puut

Valittu aihemalli jakaa metsäpalauteaineiston seitsemään aiheeseen (Taulukko 1). Kaatumassa oleviin ja kaatuneisiin puihin liittyvässä aiheissa näitä yleisesti toivotaan hoidettavan luonnosta pois. Suuret roskat -aiheessa korostuvat palautteet suurikokoisesta roskasta tai muusta luontoon kuulumattomasta materiaalista, kuten leireistä tai nuotioista, jossakin tietyssä kerrotussa sijainnissa. Täydet roskakorit -aiheessa korostuu kaupunkilaisten toive roskakorien lisäämisestä ja luontoon levinneiden roskien siivoamisesta. Kasvillisuuden arvo- ja Eläinten arvo -aiheissa puhutaan suoremmin ekologisesta näkökulmasta: kasvillisuudesta ja eläinten itseisarvosta osana kaupunkiluontoa. Nämä kaksi aihetta ovat palautemäärältään pienempiä aiheita kuin muut. Tiet ja väylät -aiheessa näkyy erityisesti erilaisiin kulkuväyliin liittyvää palautetta. Seitsemättä ja määrältään selvästi suurinta aihetta on edellä kuvattuja aiheita vaikeampaa tulkita. Aiheen yleisimpiin sanoihin lukeutuvat kuitenkin esimerkiksi sanat ”puu” ja ”puisto”. Tämä aihe sisältää merkittävästi puiden hakkuita vastustavaa puhetta ja rakentamista kritisoivaa palautetta, mutta aiheeseen on myös luokittunut muihinkin teemoihin keskittyvää tekstiä. Aihe näyttääkin osin olevan eräänlainen yleisaihe, johon valittu aihemalli sijoittaa palautteita useista erilaisista teemoista. 

Aiheiden yleisimpiä sanoja (ks. taulukko 1) lukemalla aineiston sisällöistä syntyy vastaava kuva, joka saatiin myös tutustumalla aineistoon lukemalla palautteita. Pääosa palautteista näyttäisi olevan vikailmoitustyyppisiä – luonnossa on roskia tai metsässä on kaatumaisillaan oleva puu. Mallinnuksen tuottamat aiheet vastasivat kohtuullisesti myös sitä aiheluokkaa, johon palautteen vastaanottanut ja sitä käsitellyt kaupungin työntekijä oli sen luokitellut. Aihemallinnusta voidaankin käyttää tunnistamaan aineiston keskeisimpiä sisältöjä karkealla tasolla.  

Pääosassa (75 %) metsäpalautteita palautteen antaja oli merkinnyt karttaan tarkan sijainnin, johon hänen antamansa palaute liittyy (Kuvio 1). Palautteet sijoittuivat kohtalaisen tasaisesti ympäri Helsinkiä painottuen odotetusti viheralueille. Myöskään metsäpalautteiden aiheet eivät olleet voimakkaasti alueellisesti eriytyneitä. Helsingin keskusta-alue tosin sai lähinnä täysiin roskakoreihin tai yleisaiheeseen viittaavia palautteita, mikä selittynee sen muita alueita vähäisemmällä vehreydellä.  Itäisen Helsingin länsiosissa (Kivikon ja Hallainvuoren/Viikin metsät) näyttäisi olla muita alueita yleisemmin tarvetta antaa palautetta suurista roskista ja muista metsiin kuulumattomista elementeistä alueella. Läntisessä Helsingissä (esim. Kaarela) taas teihin ja väyliin liittyvä palaute korostuu hieman enemmän kuin muilla alueilla. 

Kaupungin saamien palautteiden määrä on lisääntynyt vuodesta 2015, ja myös metsäaiheisia palautteita on vastaanotettu enenevissä määrin (Kuvio 2.). Merkittävin kasvu metsäpalautteiden kohdalla näkyy vuonna 2020 koronapandemian alkuvaiheessa. Erityisesti roskiin liittyvät palautteet lisääntyivät tuolloin voimakkaasti, mutta näiden palautteiden määrä on sen jälkeen hieman vähentynyt. Sen sijaan katuihin ja väyliin liittyvät palautteet ovat hieman yleistyneet viimeisen parin vuoden aikana. Myös ekologisesta näkökulmasta kirjoitettujen palautteiden määrät näyttäisivät hieman kasvaneen, mutta näitä palautteita (aiheet Kasvillisuuden arvo ja Eläinten arvo) on edelleen hyvin vähän. Suurimman aiheen Yleisaiheen osuus kaikista aiheista on pysynyt suurin piirtein ennallaan koko tarkastelujakson. Tämä aihe on argumentaatiotyyliltään ja sisällöiltään muita aiheita moninaisempi, mutta liittyy usein puihin tai puistoihin. Metsäaiheisten palautteiden määrä näyttää myös noudattavan vuodenaikoja niin, että eniten kaupunkilaiset lähettävät aihepiiristä palautetta keväällä maalis–huhtikuussa.  

Mallinnuksen aiheet kertovat paitsi keskeisimmästä sisällöstä myös muusta sanoituksesta

Kaiken kaikkiaan aihemallinnuksen tulokset kertovat, että kaupunkilaiset haluavat kaupungin palautejärjestelmään lähettämissään metsäaiheisissa palautteissaan antaa kriittistä palautetta paikallisista asioista usein tietyssä tarkassa sijainnissa. Jokaisessa lopullisen mallin löytämässä aiheessa kymmenen yleisimmän sanan joukkoon lukeutuu sana ”alue”. Yleisiä sanoja eri aiheissa ovat myös ”pois”, ”saada” ja ”ihminen”.

Palautteissa on myös yleistä suunnata sanansa nimenomaan Helsingille kaupunkiorganisaationa yhtenäisenä kokonaisuutena. Usein palautteet antavat kaupungille suoria toimintaohjeita: siivoa, hoida, pidä huolta turvallisuudesta. Pieni osa palautteista kuitenkin kehottaa kaupunkia vähentämään metsän tai niittyjen hoitoa.

Palautteissa tulee usein myös määritellyksi, mikä kuuluu ja mikä ei kuulu kaupunkiluontoon ja millaisia Helsingin ja sen metsien tulisi olla. Perustelut ovat yleisesti ihmislähtöisiä: luonto on tärkeää palautteenantajalle itselleen omalla asuinalueellaan tai virkistäytymistä ja kauneutta tarvitseville asukkaille ylipäänsä. Palautteissa kuvataan, kuinka metsässä koetaan olevan liikaa erilaisia asioita: roskaa, väärällä tavalla toimivia ihmisiä ja taloja. Palautteiden perusteella näyttää siltä, että hyvä kaupunki ei ole täynnä, tai jos onkin, ainakin metsät pysyvät tyhjinä ihmisen rakentamista ja valmistamista elementeistä. Toisaalta monet kokevat, että kaatuneet tai kaatumassa olevat puutkaan eivät kuulu luontoon usein turvallisuussyistä. Vähemmistössä ovat palautteet, joissa kaatuneiden puiden poistamista ihmetellään niiden ekologisen arvon vuoksi.

Aihemallinnus näyttäisi olevan hieman epätarkka luokittelemaan yksittäisiä palautteita niihin aiheisiin, joihin ihminen palautteen luokittelisi. Tämä liittyy menetelmän periaatteeseen, jossa kaikkia palautteessa esiintyviä sanoja käsitellään samanarvoisina. Tällöin aiheet voivatkin klusteroitua muunkin kuin ihmisen havaitseman temaattisen aiheen perusteella. Aihemallinnuksessa löydettyjä aiheklustereita näyttääkin yhdistävän paitsi asiat, kuten roskat, puut ja autot, myös muu sanoitus tai puhetyyli.

Palautemäärältään selvästi suurin aihe näyttäisi olevan jonkinlainen yleisaihe, jonka alle sijoittuu palautetta monenlaisista sisällöistä. Vaikka esimerkiksi roskakoreihin ja kaatuneisiin puihin liittyvät palautteet muodostivat omat aiheensa, myös yleisaiheen sisälle on luokittunut palautetta näistä teemoista. Yleisaiheeseen luokitellut palautteet ovat keskimäärin pidempiä ja niiden sanoitus näyttäisi olevan muita palautteita moninaisempaa ja perustelevampaa, jolloin parhaan kokonaiskuvan antava aihemalli ei välttämättä ole paras kuvaamaan juuri näiden palautteiden sisältöjä. Toinen aihemalli tunnistikin yleisaiheen sisältä vielä kaksi pienehköä aihetta, jotka liittyvät asuinrakentamiseen ja asukkaan tarpeeseen nähdä luontoa ympärillään (Taulukko 2). Rakentamiseen liittyvä aihe sisältää muun muassa sellaista täydennysrakentamista arvostelevaa palautetta, jossa kaupunkiorganisaatiota arvostellaan luonnon tuhoamisesta. Yleisaiheen sisältä löytyy myös luonnon itseisarvoa korostavaa palautetta. 

Lopuksi

Tässä artikkelissa tarkasteltiin Helsingin kaupunkiympäristön toimialan saamia metsäaiheisia palautteita aikavälillä tammikuu 2015–toukokuu 2023. Helsinkiläisten palautejärjestelmään lähettämissä metsäaiheisissa palautteissa korostuvat pyynnöt poistaa luontoalueilta roskia sekä muita sellaisia asioita, jotka häiritsevät asukkaita heidän ympäristössään.  Kaupunkilaisten tarve lisätä lähiympäristönsä siisteyttä ja vehreyttä on tämän aineiston lisäksi näkynyt Helsingissä myös muun muassa osallistuvassa budjetoinnissa, jossa helsinkiläiset tekevät ehdotuksia ja äänestävät kaupungin varojen käytöstä (Erjansola 2024, Nuorten budjetti 2023). Tämän tutkimuksen mukaan palautteet roskista metsissä ovat olleet aivan viime vuosina vähenemään päin koronapandemian aikaisen voimakkaan nousun jälkeen. Silti huoli lähiympäristön puolesta näyttäisi lisääntyneen vuodesta 2015 palautetta antavien helsinkiläisten keskuudessa.  

Palauteaineiston sisällöt tarjoavat yhden näkökulman asukkaiden kaupunkiluontoon liittyviin kokemuksiin ja toiveisiin. Viestintäkanavana palautejärjestelmä on omanlaisensa: sitä näkyy käytettävän asukkaan ja kaupungin kahdenväliseen keskusteluun, vaikkakin palautteenantaja voi myös antaa luvan julkaista palautteensa kaupungin internetsivuilla. Palautejärjestelmässä oleviin sisältöihin vaikuttanee myös se, minkä luonteiseksi kaupunkilaiset itse palautteen mieltävät. Helsingin kartoituksen perusteella asukkaat näkevät palautteen ensisijaisesti negatiivisina huomautuksina ja yksinkertaisina korjauspyyntöinä kaupungin tuottamiin palveluihin liittyen (Helsingin kaupunki 2019).

Voidaan olettaa, että joihinkin muihin vaikuttamisen tapoihin verrattuna palautteen jättäminen Helsingin kaupungin verkkosivuille koetaan helpoksi. Näin palautteita saadaan myös sellaisilta helsinkiläisiltä, jotka eivät välttämättä muutoin osallistu aktiivisesti kaupungin kehittämiseen. Tämän artikkelin palauteaineiston perusteella voidaan sanoa, että kanava tavoittaa hyvin ihmisiä ympäri Helsinkiä. Metsäaiheisissa palautteissa myös puhuttavat samankaltaiset asiat eri puolilla kaupunkia, eli voimakasta alueellista eriytymistä ei tässä aineistossa nähdä. Tämä on yllättävää, sillä useat muut tutkimukset kertovat kaupungin eriytymisestä eri ilmiöalueilla (esim. Ahtiainen 2023, Keskinen et al. 2023, Mäki 2023, Salorinne 2023). Jatkotutkimuksena olisi mahdollista selvittää, osuvatko palautteisiin merkityt sijainnit samoihin paikkoihin kuin mihin kaupunkilaiset ovat merkinneet itselleen tärkeitä paikkoja yleisten alueiden suunnitelmiin liittyvissä kyselyissä. Myös kaupunkilaisia puhututtavien paikkojen ekologista arvoa voitaisiin kartoittaa muissa tutkimuksissa.  

Tässä tutkimuksessa sovellettiin ohjaamattoman koneoppimisen menetelmää aihemallinnusta, jonka avulla suuresta tekstiaineistosta saatiin kokonaiskuva. Helsinki vastaanottaa kaupunkilaisten palautteita valtavia määriä eri kanavia pitkin, joten vastaavanlaiseen tekstianalyysiin olisi hyvä panostaa, kun alati kehittyvät menetelmät pystyvät käsittelemään myös suomenkielistä tekstiä. Tässä on tärkeää muistaa, että erilaisille aineistoille soveltuvat erilaiset analyysimenetelmät. Myös palautteiden lähiluenta on edelleen tärkeää ja sitä tulee yhdistää menetelmänä tekstien karkeampaan etäluentaan.  

Helsingin saamissa metsäaiheisissa palautteissa näkyvät helsinkiläisten toiveet kaupunkiluonnon puhtaudesta, rauhallisuudesta ja läheisyydestä. Myös sellaiset viheralueet voivat olla ihmisille paikallisesti tärkeitä, joiden ekologiset arvot ovat keskimääräistä vähäisempiä. Jotta Helsinki voi huomioida kaupunkilaisten mielipiteet asuinympäristön kehittämisessä, kaupunkilaisten moninaisista mielipiteistä pitää ensin saada käsitys. Suurten palautemäärien sisällöistä voidaan saada aiempaa kattavampi kuva esimerkiksi tässä tutkimuksessa testatulla menetelmällä aihemallinnuksella.

Jenni Erjansola toimii tutkijana Helsingin kaupunginkanslian kaupunkitietopalvelut-yksikössä ja Mikko Niemi datatieteilijänä kaupunginkanslian digitalisaatioyksikössä

Lähteet:

Abdelmotaleb, H.; Wojtyś, M. & McNeile, C. (2023). A Comparison of a Novel Optimized GSDMM Model with K-Means Clustering For Topic Modelling Of Free Text. Journal of Machine Intelligence and Data Science (JMIDS), 4, 52–62.

Ahtiainen, H. (2023). Myönteisiä muutoksia ja kyydistä jääneitä – Helsingin alueiden kehitys väestön koulutusrakenteen valossa. Helsingin kaupunkitietopalveluiden verkkolehti Kvartti. Helsinki: Helsingin kaupunginkanslia.

Arnstein, S. (1969). A Ladder Of Citizen Participation. Journal of the American Institute of Planners, 35:4, 216–224.

Engemann, K; Pedersen, CB; Arge, L; Tsirogiannis, C; Mortensen, PB & Svenning, JC (2019). Residential green space in childhood is associated with lower risk of psychiatric disorders from adolescence into adulthood. Biological Sciences, 116(11), 5188–5193.

Erjansola, J. (2024). Helsingin kaupungin osallistuvan budjetoinnin äänestys 2024. Tilastoja 2024:5. Helsinki: Helsingin kaupunginkanslia.

Faehnle, M., Bäcklund, P., Tyrväinen, L., Niemelä, J., & Yli-Pelkonen, V. (2014). How can residents’ experiences inform planning of urban green infrastructure? Case Finland. Landscape and Urban Planning, 130, 171‒183.  

Helsingin kaupunki (2019). Helsingin kaupungin uuden palautepalvelun konsepti. Julkaisematon asiakirja.

Helsingin kaupunki (2021). Kasvun paikka – Helsingin kaupunkistrategia 2021–2025. Helsinki: Helsingin kaupunginkanslia.

Hirvonen, J. (2023). Ympäristöasenteet pääkaupunkiseudulla 2022. Tutkimuksia 2023:3. Helsinki: Helsingin kaupunginkanslia.

Isoaho, K., Gritsenko, D. & Mäkelä, E. (2021). Topic modeling and text analysis for qualitative policy research. Policy Studies Journal 49:1, 300‒324.

Järvelä, S. (2024). Ilmasto ja luonnon hupeneminen helsinkiläisten suurimpia huolenaiheita – päättäjille palautetta myös täydennysrakentamisesta ja keskusta-alueesta. Helsingin kaupunkitietopalveluiden verkkolehti Kvartti. Helsinki: Helsingin kaupunginkanslia.  

Kajosaari, A., Hasanzadeh, K., Fagerholm, N., Nummi, P., Kuusisto-Hjort, P. & Kyttä, M., (2024). Predicting context-sensitive urban green space quality to support urban green infrastructure planning. Landscape and Urban Planning, 242:12.    

Keskinen, V., Hirvonen, J., Erjansola, E., Kainulainen-D'Ambrosio, K. & Paasonen, K. (2023). ”Korona-aikaan en juuri ole liikkunut kaupungilla” – Helsingin turvallisuustutkimus 2021. Tutkimuksia 2023:1. Helsinki: Helsingin kaupunginkanslia.  

Kimm D.-S., Lee B.-C., Park K.-H. (2021). Determination of Motivating Factors of Urban Forest Visitors through Latent Dirichlet Allocation Topic Modeling. International Journal of Environmental Research and Public Health, 18(18):9649.  

Kowalski, R., Esteve, M., & Jankin Mikhaylov, S. (2020). Improving public services by mining citizen feedback: An application of natural language processing. Public administration, 98:4, 1011‒1026.

Lybeck, R., Rönnqvist, S., & Ruoppila, S. (2018). Sentiment in Citizen Feedback: Exploration by Supervised Learning. In S. Virkar, P. Parycek, N. Edelmann, O. Glassey, M. Janssen, H. Jochen Scholl, & E. Tambouris (Eds.), Proceedings of the International Conference EGOV-CeDEM-ePart 2018, 133–142. Edition Donau-Universität Krems.

Maas, J; Verheij, RA; de Groenewegen, PP; Vries, S & Spreeuwenberg, P (2006). Green space, urbanity, and health: how strong is the relation? Journal of Epidemiology and Community Health, 60, 587–592.

Mohr, J.W. & Bogdanov, P. (2013). Introduction-Topic models: What they are and why they matter. Poetics 41(6), 545–569.

Minelli, A., & Ruffini, R. (2018). Citizen feedback as a tool for continuous improvement in local bodies. International Journal of Public Sector Management, 31:1, 46‒64.

Mäki, N. (2023). Sairastavuus- ja kansantauti-indeksit koko Helsingissä ja peruspiireittäin 2021. Helsingin kaupunkitietopalveluiden verkkolehti Kvartti. Helsinki: Helsingin kaupunginkanslia.

Nelimarkka, M (2019). Aihemallinnus sekä muut ohjaamattomat koneoppimismenetelmät yhteiskuntatieteellisessä tutkimuksessa: kriittisiä havaintoja. Politiikka: Valtiotieteellisen yhdistyksen julkaisu, 61:1, 6–33.

Nuorten budjetti (2023). Kokemustietoa Helsingin nuorilta. Nuorten budjetti 2023. https://nuortenbudjetti.hel.fi/pages/kysely(Link leads to external service). Luettu 2.8.2024.

Salorinne, M. (2023). Työttömyyden alueittaiset muutokset Helsingissä vuosina 2019–2022. Helsingin kaupunkitietopalveluiden verkkolehti Kvartti. Helsinki: Helsingin kaupunginkanslia.

Wang, Y., Kotze, D.J., Vierikko, K. & Niemelä, J. (2019). What makes urban greenspace unique - Relationships between citizens' perceptions on unique urban nature, biodiversity and environmental factors. Urban Forestry & Urban Greening, 42, 1‒9.

Ylä-Anttila, T.; Eranti, V. & Kukkonen, A. (2022). Topic modeling for frame analysis: A study of media debates on climate change in India and USA. Global Media and Communication, 18:1, 91–112.      

Alaviitteet:

1. Kokeillut aihemallit olivat Gibbs Sampling Dirichlet Mixture Model (GSDMM), Gamma-Poisson mixture  (GPM) ja biterm topic model (BTM). Kaksi ensimmäiseksi mainittua algoritmia sijoittavat yhden palautteen aina vain yhteen aiheeseen. BTM käsittelee samoissa teksteissä esiintyviä sanapareja jakaen jokaisen sanaparin yhteen aiheeseen. Palautteet voidaan jakaa BTM:n antamiin aiheisiin niiden sisältämien sanaparien perusteella. Muista valinnoista esimerkiksi aiheiden määrän valinta vaikuttaa tuloksiin ja siitä tehtäviin tulkintoihin. Metsäpalautteiden analyysissa aihemallin hyperparametrit optimoitiin kokeilemalla erilaisia arvoja alfan, beetan ja aiheiden määrän ylärajoihin ja katsomalla, miten valinnat vaikuttivat aiheiden mielekkyyteen sekä niiden jakaumien tasaisuuteen. 

2. GSDMM-algoritmin tuottama aihemalli tuotti 17 aihetta, mutta näistä 10 oli käytännössä tyhjiä, mikä on mallinnuksessa yleistä. Valitun aihemallin aiheet myös GPM ja BTM pitkälti tunnisti. Yleisaiheen sisältä tunnistettiin edelleen kaksi ala-aihetta BTM-algoritmin avulla.