Tekoäly luo uudenlaisia mahdollisuuksia ja parhaimmillaan sujuvoittaa työtämme. Kirjoittaja voi laittaa tekoälyn keräämään taustatietoa, hahmottelemaan tekstille runkoja tai vaikkapa oikolukemaan valmiin tekstin. Tekoäly ei lamaannu tyhjän sivun äärellä eikä ahdistu aikapaineen alla. Se tuottaa monipuolista raakamateriaalia sekunneissa aiheesta kuin aiheesta ja auttaa hankalaltakin tuntuvan prosessin käyntiin. Tekoälyn laajamittaiseen käyttöön tietotekstejä (tieteellisiä tai ammatillisia) laadittaessa liittyy kuitenkin huomattavia riskejä. Kun ymmärrämme näitä riskejä, pystymme hyödyntämään tekoälyn tuomia mahdollisuuksia vastuullisesti.
Tekoäly on oiva apulainen
Kuvassa 1 näkyy ChatGTP:n tiivistämä näkemys (15.8.2024) siitä, mitä riskejä tekoälyn käyttöön kirjoitusprosessin apurina liittyy. Tässä esittämäni listaus on kehittynyt versio siitä, minkä sain samalta botilta noin kuukautta aiemmin. Esittämieni lisäkysymysten avulla raakaversio kehittyi osittain haluamaani suuntaan. Kuvaan nostamassani versiossa on paljon hyvää (nostot vastuusta, tekijänoikeuksista ja väärän ja vinoutuneen tiedon levittämisestä), mutta se unohtaa yhä tärkeitä näkökulmia (esimerkiksi lukijakokemuksen). Kuva 1 on suora näytönkaappaus tekoälyn tuotoksesta. Muuten käytin tekoälyä kirjoitusprosessin taustalla idea-apurina, mutta lopullinen teksti, kaikkine virheineen ja epätäydellisyyksineen, on omaani.
Tekijänoikeudet – kaksisuuntainen tie
Tekoälysovellusten tuottama teksti pohjautuu aina jonkun muun tuottamaan, usein tekijänoikeuksin suojattuun, materiaaliin. Tyypillisesti käyttäjä ei (ainakaan pyytämättä) saa lähdeviitteitä tai muuta tietoa siitä, mistä tieto on haettu. Plagiointi, eli esimerkiksi toisen tekstin luvaton lainaaminen ilman asianmukaista lähteiden merkitsemistä, on yksi tiedevilpin muoto. Myös tekoälyn tuottaman tekstin esittäminen omana tuotoksena on plagiointia. Tekijänoikeusloukkaukset tulee aina selvittää ja oikoa (Tutkimuseettinen neuvottelukunta 2023) ja pahimmillaan ne voivat johtaa jopa oikeustoimiin (Tekijänoikeuden tiedotus- ja valvontakeskus ry 2024 ja Tekijänoikeuslaki 404/1961 1961). Tekoälyä hyödyntävät nykyaikaiset plagiaatintunnistusohjelmat tunnistavat luvattomien lainausten lisäksi koko ajan parantuvalla tarkkuudella tekoälyn tuottamaa tekstiä (Turnitin 2024).
Euroopan tasolla (Euroopan komisiso 2024) on linjattu, että tekoäly ei ole oikeushenkilö. Tekoälylle ei siis voi sälyttää vastuuta esimerkiksi artikkelin kirjoittajana. Kaikki merkittävät tiedejulkaisijat noudattavat tätä periaatetta. Esimerkiksi Elsevier (2024) pyytää kaikkia kirjoittajia avoimesti ilmoittamaan, jos työssä on hyödynnetty tekoälypohjaisia työkaluja. Springer Nature (2024) jatkaa ohjeistamalla vertaisarvioitsijoitaan pidättäytymään tekoälytyökalujen käytöstä. Nämä samat suuntaviivat soveltuvat myös ammatilliseen kirjoittamiseen.
Siinä missä tekoäly jakaa meille viittauksitta muitten töitä, se ei myöskään tunne eettistä painetta suojata meidän tuotoksiamme. Tämä kannattaa huomioida erityisesti silloin, kun oma teksti sisältää henkilötietoa, kaupallisesti hyödynnettävissä olevaa materiaalia, immateriaalioikeuksin suojattavaa materiaalia tai muuten itselle, ammatillisesti tai henkilökohtaisesti, tärkeää ajattelua ja ideoita.
Lähdekritiikki
Tekoäly tuottaa teknisesti sulavaa, mutta sisällöltään paikoin kyseenalaista ja kritiikitöntä tekstiä. Misinformaatio, disinformaatio, hybridivaikuttaminen, salaliittoteoriat… Verkosta löytyy timantteja, mutta myös mätiä tomaatteja ja jopa vahingoittamistarkoituksessa luotua sisältöä. Tekoälyllä on vain rajalliset mahdollisuudet suodattaa todellisuus keksitystä. Käyttäjälle jää siis vastuu varmistua siitä, että omiin teksteihimme päätyy ainoastaan tarkasti harkittua, ja hyväksi arvioitua sisältöä. Lähdekritiikki ja asiantuntijuus nousevat tekoälyn aikakaudella yhä tärkeämpään rooliin tiede- ja tietotekstien kivijalkana.
Tuotetun tekstin laatu
Tieteellisten julkaisujen määrä on kasvanut kiihtyvällä tahdilla (National Science Foundation 2024) viime vuosikymmenen aikana. Cheng (2024) tiimeineen näyttää preprint-vaiheen artikkelissaan, miten tekoäly on edelleen kiihdyttänyt tätä kehitystä. Vaikutus on erityisen selvä luonnontieteissä ja tekniikassa, mutta sama kuvio toistuu muillakin tieteenaloilla. Tieteellistä tekstiä siis tuotetaan yhä enemmän, mutta yksittäisessä tekstissä on yhä vähemmän sisältöä. Sama pätee myös muihin tekstilajeihin – tekstiä on helppoa tuottaa, vaikka kirjoittajalla ei olisi edes alkeellista ymmärrystä tekstin sisällöstä. Monin paikoin määrä on korvannut laadun.
Kielellistä tasa-arvoa vai epätasa-arvoa?
Viime vuosina tekoäly on kehittynyt yhä taitavammaksi kielenkäyttäjäksi ja tarkistajaksi. Tarjolla on lukuisia sovelluksia niin kielen tarkistukseen kuin kielten oppimiseen. Itse olen työssäni käyttänyt Grammarly-kielentarkastusohjelmaa. Sen maksutonkin versio huomauttelee varsin sujuvasti perustason kielivirheistä ja punaisin alleviivauksin kannustaa siivoamaan alamittaista ilmaisua. Uudet kieliteknologiat auttavat meitä, jotka emme puhu englantia äidinkielenämme, toimimaan entistä tasavertaisempina toimijoina englannin kielen dominoimassa tiede- ja asiantuntijamaailmassa (Amano 2023).
Mutta toisaalta, tekoälysovellukset (ainakin toistaiseksi) keskittyvät suurten massojen kieliin. Pienemmät kielet, mukana esimerkiksi suomi ja pienet suomensukuiset sukulaiskielemme, uhkaavat jäädä entistä vahvemmin paitsioon. Tulevaisuus näyttää, miten tilanne kehittyy. Optimismia luo se, että esimerkiksi Kuvassa 1 näkyvän ChatGPT:n suomenkielisen tuotoksen suurimmat haasteet ovat sisällöllisiä ja rakenteellisia eivätkä siis liity kieleen. Samoin suomenkieliset konekäännökset ovat tuntuvasti kehittyneet viime vuosina.
Lukijan näkökulma
Tekstillä on aina tarkoitus ja tekstin tarkoituksesta riippumatta se on käytännössä aina suunnattu toiselle ihmiselle. Tekstin tavoitteena voi olla esimerkiksi tiedon välittäminen tai lukijan vakuuttaminen jonkin asian tarpeellisuudesta. Tyylilaji tuleekin valita tarkoituksen mukaan. Tunnelmalliset maisemakuvaukset eivät kuulu porakoneen käyttöohjeisiin tai lakitekstiin ja tiedejulkaisuissakin käyttäisin niitä säästeliäästi. Kaunokirjallisuus taas elää tunteen palosta ja rikkaasta ilmaisusta. Tietoteksti sijoittuu näiden ääripäiden väliin. Kuivakkaastakin aiheesta luotu teksti pitää lukijan otteessaan loppuun asti, jos siinä on ajattelua tukevaa rytmiä, rakennetta ja ehkä jopa ripaus huumoria. Tekoälyltä kannattaa pyytää vinkkejä tyylipohdintoihin, mutta ihmiskirjoittaja kantaa aina vastuun lukijakokemuksesta.
Koneen voi antaa koota faktat, mutta ihminen valikoi, tulkitsee ja suodattaa. Ihminen, virheineen ja kaikkineen, tekee tekstistä hyvää eli aidosti vaikuttavaa ja kohtaavaa.
Lähteet
- Amano, T., Ramírez-Castañeda, V., Berdejo-Espinola, V., Borokini, I., Chowdhury, S., et al. 2023. The manifold costs of being a non-native English speaker in science. PLOS Biology 21(7): e3002184.
- Cheng, H., Sheng, B., Lee, A., Chaudary, V., Atanasov, A.G., Liu, N., Qiu, Y., Wong, T.Y., Tham, Y., & Zheng, Y. 2024. Have AI-Generated Texts from LLM Infiltrated the Realm of Scientific Writing? A Large-Scale Analysis of Preprint Platforms. bioRxiv. Viitattu 16.7.2024.
- Elsevier 2024. The use of AI and AI-assisted technologies in writing for Elsevier. Verkkosivu. Viitattu 16.7.2024.
- Euroopan Komissio 2024. AI Act | Shaping Europe’s digital future. Verkkosivu. Viitattu 16.7.2024
- Ro, C. 2024. Students switch to AI to learn languages. Verkkosivu. Viitattu 16.7.2024.
- Springer Nature 2024. Artificial Intelligence (AI). Verkkosivu. Viitattu 16.7.2024.
- Tekijänoikeuden tiedotus- ja valvontakeskus ry 2024. Loukkaukset. Verkkosivu. Viitattu 16.7.2024
- Tekijänoikeuslaki 1961. Tekijänoikeuslaki 404/1961 – FINLEX ®.
- Turnitin 2024. AI Detector. Verkkosivu. Viitattu 16.7.2024
- Tutkimuseettinen neuvottelukunta 2023. Tiedevilppi. Verkkosivu. Viitattu 16.7.2024
- National Science Foundation 2024. Publications Output: U.S. Trends and International Comparisons. Verkkosivu. Viitattu 16.7.2024.