Voiko tekoälytekstin tunnistaa?

Voiko tekoälytekstin tunnistaa?

Kirjoitatko blogia, esseetä, tarjouspyyntöä tai asiakasraporttia tekoälyn avustuksella? Sitten olet ehkä pohtinut: “Voiko joku huomata, ettei tämä ole täysin minun kirjoittama?” Tai pahempaa – “Jääkö tämä kiinni?” Ei huolta, et ole ainoa.

Nyt selvitetään, miten AI-sisältöjä yritetään tunnistaa, mikä toimii ja mikä ei, ja ennen kaikkea – mitä voit tehdä, jos haluat varmistaa, että tekstisi tuntuu ja näyttää aidosti ihmisen tekemältä.

Mitä nämä AI-tunnistimet oikein tekevät?

Lyhyesti: ne yrittävät löytää tekstistä robotin rytmin.

Tekoälymalleilla, kuten ChatGPT:llä, on tietynlainen tyyli – tietty tapa rakentaa lauseita ja jäsentää ajatuksia. Ne käyttävät kieliä vähän niin kuin tilastotiedettä: mikä sana sopii seuraavaksi todennäköisesti?

Tunnistimet kuten GPTZero, Originality.ai ja Turnitin pyrkivät bongaamaan nämä “tekoälyn sormenjäljet”. Ne saattavat mitata esimerkiksi:

  • Kuinka ennustettavaa teksti on (perplexity)
  • Kuinka paljon vaihtelua on lauserakenteissa (burstiness)
  • Kuinka usein toistuvat tietynlaiset ilmaukset

Jos teksti on liian tasapaksua, rytmi liian säännöllistä tai sanavalinnat liian “geneerisiä”, detektori voi nostaa varoituslipun.

Mutta tässä tulee käänne:
Mitä paremmaksi tekoäly kehittyy, sitä huonommaksi nämä detektorit muuttuvat.

Tarkkuus? No… sanotaan vaikka näin: vaihtelevaa

Esimerkki: OpenAI julkaisi vuoden 2023 alussa AI Classifierin, jonka piti auttaa opettajia erottamaan tekoälyllä tehdyt esseet. Kuulosti hyvältä idealta – kunnes sama firma lopetti työkalun käytön vain puoli vuotta myöhemmin, koska… se ei toiminut. Tarkkuus oli heikko. Liikaa vääriä hälytyksiä, liian vähän varmuutta.

Toinen keissi: Turnitin, tunnettu plagiointipalvelu, kehui löytäneensä miljoonia AI-epäilyksiä opiskelijatöistä. Mutta kun Washington Post testasi sen, yli puolet “paljastetuista” teksteistä oli ihan tavallisten opiskelijoiden omia tuotoksia. Ei koneen tekemää, ei vilppiä – vain väärä hälytys.

Ja tästä päästään tärkeään pointtiin: AI-detektorit eivät ole varmoja. Eivät edes melkein.

Ne voivat:

  • Liputtaa sinun kirjoittamasi tekstin tekoälyn tekemäksi
  • Päästää läpi täydellisen konekirjoituksen
  • Antaa epäselvän arvion, jonka perusteella joku tekee liian nopeita johtopäätöksiä

Eli jos kysyt: voiko tekoälytekstin tunnistaa varmasti? – vastaus on: ei.

Entä Google? Haistaako se robottikynän jäljen?

Yllättäen – ei haista. Eikä edes yritä haistaa.

Google ei ole kiinnostunut siitä, kirjoititko tekstisi käsin vai koneella. Se haluaa tietää, onko sisältö hyödyllistä. Onko se ainutlaatuista, asiantuntevaa ja tarkoituksenmukaista? Jos kyllä – ei väliä kuka sen teki.

Google ei käytä “AI-liputinta” rankingissa. Se ei rankaise, jos teksti on tekoälyavusteista. Mutta! Jos julkaiset sata artikkelia viikossa, jotka ovat kaikki liian samanlaisia ja onttoja… no, silloin se saattaa kyllä rangaista. Ei tekoälyn takia, vaan roskasivuston logiikalla.

Google tunnistaa enemmän massatuotantoa kuin AI:ta. Sen järjestelmät, kuten SpamBrain, huomioivat, jos:

  • Sivuilla on toistuvia rakenteita
  • Julkaisutahti on epäilyttävä
  • Sisältö ei palvele lukijaa

Mutta yksittäinen tekoälytekstin käyttö ei aiheuta mitään sanktiota – kunhan laatu on kunnossa.

Pitääkö siis olla huolissaan AI-tunnistuksesta?

No, se riippuu missä olet ja mitä teet.

Opiskelijana?

Silloin kyllä. Monet koulut käyttävät Turnitinia ja muita työkaluja tarkistaakseen, onko esseetä “autettu liikaa”. Tässä piilee ongelma: vaikka teksti olisi itse kirjoitettu, se voi silti saada lipun. Ja se voi käynnistää turhan selvityksen.

Jotkut opettajat käyttävätkin tunnistimia nyt päinvastoin: opetusvälineenä. He näyttävät, millaista tekstiä tekoäly tuottaa ja harjoittelevat opiskelijoiden kanssa, miten siitä tehdään parempaa.

Fiksua! Tällöin tunnistus ei ole rangaistuksen väline vaan oppimisen apuri.

Ammattilaisena tai sisällöntuottajana?

Todennäköisesti sinun ei tarvitse stressata. Asiakkaasi eivät luultavasti käytä GPTZeroa testatakseen jokaista blogia. Mutta poikkeuksia on – varsinkin jos työskentelet toimittajana, viestintäkonsulttina tai copywriterina. Jotkut asiakkaat (tai heidän asiakkaansa) voivat olla tarkkoja ja ajaa tekstin detektorin läpi.

Silloin kannattaa huolehtia siitä, että tekstissä on oma kädenjälki: ihmisen rytmi, sävy ja idea. Tai käyttää työkalua, joka auttaa tässä.

Miten vältät AI-leiman, vaikka käytät tekoälyä?

Tässä pari käytännön niksiä:

1. Tee parempaa sisältöä kuin AI tekee

Kuulostaa itsestään selvältä, mutta toimii. Tekoäly tekee “ihan hyvää” – tee sinä “oikeasti hyvää”. Lisää mukaan:

Tällaisia asioita tekoäly ei osaa vielä tuoda luonnostaan.

2. Käytä humanizer.fi -työkalua

Jos käytät ChatGPT:tä tai muuta mallia rungon tekemiseen, viimeistele teksti humanizerilla. Se osaa poistaa koneen maneerit:

  • Toistuvat lauserakenteet
  • Liiallinen ennustettavuus
  • “Täydellisyys”, joka kuulostaa epäaidolta

Työkalut, kuten Humanizer.fi voivat myös laskea AI-detektorin tulosta huomattavasti, kun teksti ei enää täytä konekirjoituksen tunnusmerkkejä.

Ihmismäinen vaihtelu tekee ihmeitä.

3. Tallenna työvaiheesi

Jos joku joskus kysyy: “Teitkö tämän itse?” – voit näyttää, miten teksti syntyi. Näytä luonnos, näytä versiot, selitä mitä muutit.

Tämä on erityisen hyödyllistä opiskelijoille, mutta toimii myös freelance- ja asiakastyössä. Se rakentaa luottamusta ja toimii myös itselle hyvänä dokumentointina.

Viimeinen ajatus

Lopulta – vaikka teknologia kehittyy, yksi asia ei muutu:

Hyvä teksti on hyvää tekstiä, riippumatta siitä, kenen näppäimistö sitä naputteli.

Jos teksti on kiinnostavaa, hyödyllistä ja tuntuu oikealta – kukaan ei kysy, kuka sen teki. Tai ainakaan se ei ole se tärkein kysymys.

Mutta jos haluat pelata varman päälle, muista nämä kolme asiaa:

  • Älä luota pelkkään tekoälyyn – tee viimeistely itse
  • Hyödynnä työkaluja, jotka tekevät tekstistä aidomman
  • Kirjoita lukijalle, älä koneelle

Silloin voit olla rauhallisin mielin, vaikka AI-detektori yrittäisikin tulla väliin kesken iltapäivänokosten. 😉


Tekoälytekstistä luonnollista – sekunneissa.