Uutistulvassa on entistä vaikeampaa tehdä houkuttelevia uutisia. Lisääkö tekoälybotilla muokattu selkokielinen teksti uutisten mielenkiintoa? Tätä pohti monitieteellinen Tekoälyavusteinen uutissisältöjen kohdentaminen -projekti.
Tekoälyavusteinen uutissisältöjen kohdentaminen -hankekortti
Journalismissa on aiempaa keskeisempää miettiä, miten tavoittaa uusia yleisöjä uutisten pariin. Ihmisten mediankulutus on siirtynyt sanomalehtien ja tv-uutisten parista nettiin ja sosiaaliseen mediaan, jossa jokainen voi helposti valita itseään kiinnostavimmat sisällöt. Mediatalojen on entistä vaikeampaa sitouttaa eri kuluttajaryhmiä uutisten pariin.
Erityisesti tämä näkyy nuorten kohdalla, joita on jo pitkään kutsuttu journalismin “kadotetuksi yleisöksi”. Varsinkin perinteinen tekstimuotoinen uutissisältö saa yhä vähemmän huomiota kuva- ja videomuotoiseen somesisältöön tottuneilta nuorilta (Berthelsen & Hameleers 2021). Myös kasvava ja osin rajallisen kielitaidon omaava maahanmuuttajataustainen väestö jää toistuvasti suomenkielisten julkaisujen tavoittamattomiin (Selkokeskus 2025).
Tekoälyavusteinen uutissisältöjen kohdentaminen -tutkimushankkeessa pyrimme löytämään keinoja näiden yleisöjen eli nuorten ja maahanmuuttajien tavoittamiseen generatiivisen tekoälyn avulla. Projektin keskiössä on erityisesti tekoälyavusteinen selkokielinen uutistuotanto, ja siinä on sovellettu vahvasti poikkitieteellistä osaamista tietojenkäsittelytieteen, journalistiikan ja käyttäytymistieteiden aloilta.
Hanke toteutettiin Haaga-Helia ammattikorkeakoulun, Laurea-ammattikorkeakoulun ja Jyväskylän yliopiston yhteistyönä 1.9.2024-31.8.2025. Yrityskumppanina oli Vantaan Sanomat ja sen alaisuudessa toimiva Selkomedia-julkaisu. Hanketta rahoitti C.V. Åkerlundin Mediasäätiö. Hankkeen ensimmäisiä tuloksia esiteltiin NordMedia-konferenssissa Tanskan Odensessa 13.–15. elokuuta 2025.
Selkokielisillä versioilla uutisten pariin
Olisiko uutinen houkuttelevampi, jos se olisi kirjoitettu selkokielellä? Entä millainen on toimiva selkokielinen uutinen? Saadaksemme vastauksen edellä mainittuihin kysymyksiin kehitimme yhteistyössä Vantaan Sanomien kanssa oman tekoälybotin, joka tuottaa selkokielisiä versioita toimittajan kirjoittamista uutisista. Selkokielellä tarkoitetaan suomen kielen muotoa, joka on suunnattu ihmisille, joilla on vaikeuksia yleiskielen lukemisessa tai ymmärtämisessä. Selkokielessä kielen sisältöä, sanastoa ja rakennetta on muutettu luettavammaksi ja ymmärrettävämmäksi. Suomessa asuvista arviolta 11–14 prosenttia hyötyisi selkokielen käytöstä (Selkokeskus 2025).
Botin kehityksessä hyödynsimme kaupallisia laajoja kielimalleja OpenAI:lta, Googlelta ja Anthropiciltä. Selkokielisen version saavuttamiseksi tekoälylle syötettiin 24 “promptia” eli kehotetta, joiden pohjalta se muokkasi alkuperäisestä uutistekstistä yksinkertaisemman version. Kehotteet perustuivat yleisesti hyväksi havaittuihin käytänteisiin muun muassa selkokielisessä uutistuotannossa.
Kehitystyötä varten teimme taustahaastatteluja selkokielen ja tekoälyn asiantuntijoiden kanssa. Versioinnissa hyödynnetyt toimittajan kirjoittamat uutistekstit on julkaistu alun perin Vantaan Sanomissa.
Tekoäly uutisten räätälöijänä
Hankkeessa pyysimme suuria kielimalleja muokkaamaan jo julkaistun uutisen luettavammaksi ja tarvittaessa lukijalle sopivammaksi. Tekoäly ei kirjoittanut uutisia alusta asti itse, ainoastaan muokkasi suurelle yleisölle jo julkaistuja uutisia eri tavoilla. Mallien promptit olivat tiiviitä, perustuen yleisiin selkokielistämisen periaatteisiin. Teksteistä merkittiin erikseen otsikko, ingressi, väliotsikot ja sitaatit, joita käsiteltiin eri tavalla kuin muuta tekstiä. Malleja painotettiin olemaan keksimättä uutta asiasisältöä.
Käytössämme oli 55 uutista, joista tuotimme tekoälyn avulla suuren määrän vaihtoehtoisia selkoversioita – yhteensä yli 15 000 tekstiä. Toista, “tuomarina” toiminutta kielimallia käytettiin sokkovertaisarvioon: se vertasi ehdokkaita ammattilaisten kirjoittamiin selkoteksteihin ja pisteytti paremmuuden. Varhainen kierros osoitti, että GPT-4o selvisi tehtävästä parhaiten; kun mallit päivittyivät, GPT-4.1 nousi voittajaksi ja sitä käytettiin tutkimuksessa.
Selkokielen lisäksi testasimme myös tarkempaa personointia, jossa sama uutinen muokattiin lukijan taustatietojen (esim. uutistenlukutottumukset ja kielitaito) perusteella hieman eri tavalla painottuviksi versioiksi. Laajassa eri mediakuluttajaryhmille suunnatussa kyselyssä vertailimme näin ollen neljää vaihtoehtoa rinnakkain: A) alkuperäinen uutinen, B) toimittajan mukauttama selkouutinen, C) AI:n mukauttama selkouutinen ja D) AI:n muokkaama personoitu teksti.
Prosessi oli vaiheittainen: ensin haimme parhaan toimintatavan (mikä malli ja millainen ohjeistus), sitten tuotimme selkotekstit ja personoidut versiot, ja lopuksi testasimme niitä käyttäjillä. Tavoitteena oli kehittää toimituksille käytännöllinen tekoälytyöpari – työkalu, joka nopeuttaa selkokielisten ja kohdennettujen uutisversioiden tekoa, mutta kunnioittaa alkuperäistä journalismia ja pysyy faktoissa.
Testiryhmänä ammattikoululaiset
Tekoälyn tuottaman selkokielisen uutistekstin toimivuutta testattiin kahden kyselytutkimuksen avulla. Ensimmäisen kyselyn kohderyhmänä olivat ammatillisessa koulutuksessa olevat nuoret, joiden lukutaidosta ja muista oppimisvalmiuksista on käyty viime vuosina varsin paljon julkista keskustelua (Pietilä 2025, Martikainen 2025). Opiskelijat vastasivat kyselyyn osana Haaga-Helian journalismin opiskelijoiden mediatyöpajaa, jotka järjestettin Stadin ammattiopistoissa keväällä 2025.
Kyselyssä ammattikoululaiset arvioivat heille annettua uutistekstiä. Kyselyssä oli mukana kolme erilaista versiota samasta uutisesta: 1) toimittajan kirjoittama tavallinen uutisteksti, 2) toimittajan kirjoittama selkokielinen uutisteksti ja 3) tekoälyn luoma selkokielinen uutisteksti. Kukin vastaaja sai luettavakseen yhden tekstin, ja arvioi sitä Likert-asteikolla muun muassa luettavuuden, sanavalintojen ja kiinnostavuuden osalta.
Toisen kyselytutkimuksen vastaajiin kuului sekä aikuisia että nuoria. Lisäksi kysely kohdistettiin henkilöille, joihin kuului erityisesti Suomessa asuvia ulkomaalaistaustaisia ihmisiä, joiden kielitaito ei vastaa keskimääräistä suomen kielen tasoa. Koehenkilöiden rekrytointiin käytettiin gallup-yritystä, korkeakoulujen opiskelijoita ja omia yhteistyöverkostoja. Vastauksia saatiin yli 600.
Kyselyssä vastaajat arvioivat kukin kolme satunnaista tekstiä artikkelin sisällön (Berger & Milkman 2012) ja lukijakokemuksen (Cappella & muut 2015) perusteella. Tekstien tuotantotapa oli samanlainen kuin ensimmäisessä kyselyssä.
Molempien kyselyiden tekstit pohjautuivat alkuperäiseen Vantaan Sanomissa julkaistuun uutiseen.
Tekoälyn luoma versio on helppo ja ymmärrettävä
Alustavien tulosten perusteella tekoälyllä teetetyn version lukijoista valtaosa piti sitä helppona ja ymmärrettävänä. Myös versiossa käytettyjä sanavalintoja pidettiin lähtökohtaisesti selkeinä. Vastaavasti toimittajan kirjoittamaa “tavallista” uutistekstiä osa vastaajista piti paikoin jopa hankalasti luettavana.
Tekoälyn muokkaamat tekstit olivat useimmilla mittareilla samalla tasolla toimittajien kirjoittamien selkotekstien kanssa. Sekä toimittajan että tekoälyn kirjoittamat selkokieliset tekstit olivat vastaajille selkeämpiä ja luettavampia kuin alkuperäiset uutistekstit. Toisaalta toimittajien mukauttamat selkotekstit koettiin hieman enemmän tunteisiin vetoavammiksi ja kiinnostavammiksi kuin tekoälyn kirjoittamat.
Kyselytutkimuksien tulokset ovat vielä alustavia, eikä niistä voi siksi tehdä syvempiä johtopäätöksiä. Vaikuttaa kuitenkin siltä, että selkokielisille uutisille voisi olla kysyntää. Kun teksti on tarpeeksi selkeä, se kannustaa lukemaan loppuun saakka. Tekoälyn avulla selkokielisiä versioita olisi puolestaan selkeästi nopeampaa tehdä. Hankkeen tavoitteena onkin saada aikaan tekoälytyökalu, joka voitaisiin ottaa käyttöön suomalaisissa uutismedioissa. Sen avulla voisi lisätä selkokielisen uutistuotannon määrää Suomessa ja samalla sitouttaa uusia yleisöjä journalismin pariin.
Hankkeen loppuseminaari järjestetään tiistaina 7. lokakuuta 2025 klo 10.30–12.30 Haaga-Helian tiloissa Pasilassa (myös verkon kautta osallistuminen on mahdollista). Lisäksi hankkeen tuloksia on tarkoitus julkaista kansainvälisissä vertaisarvioiduissa journaaleissa.
Lähteet
- Berger, J., & Milkman, K. L. 2012. What Makes Online Content Viral? Journal of Marketing Research, 49(2), 192–205.
- Berthelsen, R., & Hameleers, M. 2021. Meet Today’s Young News Users: An Exploration of How Young News Users Assess Which News Providers Are Worth Their While in Today’s High-Choice News Landscape. Digital Journalism, 9(5), 619–635.
- Cappella, J. N., Kim, H. S., & Albarracín, D. 2015. Selection and Transmission Processes for Information in the Emerging Media Environment: Psychological Motives and Message Characteristics. Media Psychology, 18(3), Article 3.
- Martikainen, A. 2025. Ylen haastattelemat opettajat eri linjoilla amiksen äikänopetuksen tasosta – arvioi itse, ovatko tehtävät liian helppoja. Yle 27.5.2025.
- Pietilä, P. 2025. Äidinkielen luokka ja sukupuoli: etnografinen tutkimus äidinkielen/suomen opinnoista tekniikan alan osaamisperusteisessa ammatillisessa perustutkintokoulutuksessa. Väitöstutkimus. Helsingin yliopisto.
- Selkokeskus 2025. Selkokielen määritelmä.
- Selkokeskus 2025. Selkokielen tarvearvio 2025.