Voiko tekoäly auttaa toimituksia löytämään juttuideoita omista arkistoistaan? Tässä innovaatiokokeilussa kehitimme arkisto- ja ideointityökalun, joka analysoi juttuaineistoa ja tunnistaa siitä toistuvia aiheita ja ehdottaa niihin ja niiden ympärille uusia näkökulmia. Kokeilu osoitti, että tekoäly pystyy hahmottamaan aineistosta keskeisiä teemoja ja ideoimaan puuttuvia näkökulmia.
ryhmä
Jenina Salminen, Jere Lindberg ja Tatu Helle
Tavoitteemme oli mahdollistaa arkistojen koluaminen tekoälyn avulla siten, että tekoäly voisi tunnistaa paitsi sen, millaisia juttuja on tehty, myös sen, mitä näkökulmia puuttuu ja mitkä aiheet toistuvat liikaa. Ajatuksenamme oli, että tekoälyn voisi opettaa paikallistamaan arkistosta löytyviä aiheita ja auttamaan pidempiaikaisten prosessien, kuten hankkeiden, seuraamisessa.
Lisäksi ajattelimme, että työkalu voisi yhdistellä erilaisia toisistaan poikkeavia teemoja kehitellen niistä uusia juttuideoita. Erityisen hyödyllinen tämä voisi olla suurille konserneille, joilla on laajat arkistot.
Käytimme kokeilussamme ChatGPT:n 5.2 -versiota. Aloitimme kokeilut Ylen verkkosivujen sisällöillä, sillä ne ovat vapaasti löydettävissä internetistä. Valitsimme aihesanoiksi "käyttöhuone" ja "ilmastonmuutos", joita käsitteleviä juttuja linkkasimme aineistoksemme chattiin noin kymmenen juttua per aihe. Halusimme kokeilla, miten tekoäly tunnistaa annettujen linkkien sisällön, niiden teemat ja mahdollisia puuttuvia näkökulmia.
Aluksi tarkistimme, että ChatGPT pääsi lukemaan linkit, jonka jälkeen siirryimme testaamaan aineistotyökalua promptien avulla.
Kysyimme muun muassa: "Tämän aineiston pohjalta, tutki millaisia juttuja on tehty. Voitko luoda näkökulmia, joita jutuissa ei ole käsitelty?", "Voitko ideoida miten aiheen voisi kohdentaa lapsiperheille?" ja "Mitkä näkökulmat toistuvat liikaa, ehdota uusia?"
Ensimmäisissä kokeiluissa tekoäly kyllä pystyi vastaamaan kaikkiin kysymyksiin, mutta esiin ei noussut kovin mullistavia näkökulmia, vaan suurimman osan ideoista olisi voinut toimittajakin keksiä. Tekoäly kuitenkin tunnisti aineistosta toistuvia ja toisaalta puuttuvia näkökulmia, mikä mielestämme voisi palvella toimituksia. Tämä pienimuotoinen kokeilumme yllätti positiivisesti ja siirryimme kokeilemaan työkalua isommalla aineistolla.
Tämä pienimuotoinen kokeilumme yllätti positiivisesti ja siirryimme kokeilemaan työkalua isommalla aineistolla.
Saimme käyttöömme aineiston, jossa oli tuhansia Savon Sanomien juttuja vuosilta 2020–2021. Kysyimme aineistosta useita tarkkoja kysymyksiä (esimerkiksi "Mitä on rivillä 183?") saadaksemme selville, pääseekö tekoäly lukemaan aineistoa oikein.
Tämän jälkeen lähdimme tutkimaan koko aineistoa kysymällä, mitä aiheita on käsitelty eniten ja kuinka monta kertaa jokin asiasana mainitaan, mikä antoi meille hyvän yleiskatsauksen aineistosta.
Tästä etenimme kohti tarkentavia kysymyksiä, kuten "Mitä juttuja tietystä aiheesta on tehty (asiasanana muun muassa 'etäopetus')?" ja "Mitä näkökulmia aiheessa ei ole huomioitu?".
Kiinnostavia ehdotuksia alkoi tulla, kun kysyimme, miten annetun aiheen voisi yhdistää yllättävään teemaan, kuten etäopetuksen rikollisuuteen. Lisäksi kysyimme tekoälyltä, miten aihetta voisi kohdentaa tietylle yleisölle (esimerkiksi etäopetus-juttu vanhuksille).
Tästä pidemmälle emme lähteneet kehittämään arkistotyökalua, sillä seuraavaksi olisimme tarvinneet entistä isomman aineiston, jotta olisimme voineet jatkaa kokeiluja. Lisäksi työkalu tulisi integroida osaksi toimintajärjestelmää, jotta toimitukset pystyisivät sitä järkevästi ja nopeasti hyödyntämään. Parhaimmillaan arkistotyökalu olisi silloin, kun tekoäly tietäisi, millaisesta mediasta on kyse, mitä lukija lupauksia medialla on, ja tekoälyllä olisi lisäksi pääsy isoon määrään dataa.
Pohdimme, onko sillä väliä, ettemme tiedä, mitä juttuja aineistossa oikeasti esiintyy vaan luotamme tekoälyn antamiin tietoihin. Päädyimme siihen, ettei se välttämättä haittaa, sillä tällä hetkellä toimituksissa nojataan usein ihmismuistiin, kun arvioidaan sitä, mitä aiheita ja asioita on käsitelty ja kuinka paljon – ja sitten kenties vilkaistaan vähän arkistoa. Tekoäly voisi tuoda tähän luotettavamman ja parempimuistisen työkalun.
Ja vaikkei tekoäly osaisikaan antaa täysin oikeita vastauksia aineistosta, voisi sitä silti hyödyntää ideoinnin tukena ja uusien, puuttuvien näkökulmien etsinnässä. Ei haittaa, vaikka osa ideoista on hölmöjä, sillä niitä ei ole pakko käyttää. On itse asiassa parempi, että tekoäly tarjoilee ideoita matalalla kynnyksellä, jolloin mikään kivi ei niin sanotusti jää kääntämättä. Lopulta toimittaja kuitenkin arvioi ja valitsee itse näkökulmat, joita lähtee toteuttamaan. Näin jutun toteutus, haastateltavan etsintä ja muut journalistisesti tärkeät vaiheet jäävät edelleen toimittajan vastuulle.
Toki se on jonkinlainen ongelma, jos käytettävä työkalu vääristää arkistojutuissa käsiteltyjen aiheiden määriä. Rehellisyyden nimissä mekään emme voi olla täysin varmoja siitä, olivatko kaikki tekoälyn antamat ideat oikeasti puuttuvia näkökulmia, koska aineisto oli niin suuri. Testauksen avulla tulisi varmistua, että arkistointi- ja ideointityökalu on riittävän luotettava siihen, että toimitus voi luottaa tekoälyn esiin nostamien näkökulmien todella jääneen huomioimatta.
Lisäksi arkiston käyttämisessä voi nousta esiin haasteeksi se, että aineisto kuvastaa omaa aikaansa, jolloin myös ideat ja ehdotukset heijastavat vanhoja ajatusmalleja, kulttuuria tai stereotypioita.
Kokeilumme joka tapauksessa osoitti, että laaja-alainen ideointi kuuluu selvästi tekoälyn vahvuuksiin. Arkiston pohjalta ideoiva tekoälytyökalu voisi eteenpäin kehitettynä olla toimiva osa toimituksen työprosesseja.