ChatGPT: n julkaisun jälkeen marraskuussa 2022 ilmiömäinen AI-chatbot on noussut yhdeksi Internetin luotettavimmista kirjoitustyökaluista. Se on helppokäyttöinen; kuvaile, mitä sinun on kirjoitettava, ja ChatGPT tulostaa sen näytölle sekunneissa.
Kuitenkin aikakaudella, jolloin tekoälyn luomaa tekstiä pidetään ihmisen kirjoittamana ja sitä käytetään epäreilun edun saamiseksi, tekoälysisällön tunnistaminen on erittäin tärkeää. Mutta ChatGPT ei pysty havaitsemaan tekoälysisältöä tarkasti, edes omaa työtänsä – mutta miksi?
Onko tekoälytekstin ja ihmisen kirjoittamisen välillä eroa?
ChatGPT: n oman kirjoituksensa tai minkä tahansa tekoälyn luoman tekstin havaitsemisen edellytyksenä on, että sen ja ihmisen kirjoittaman tekstin välillä on oltava ero. Onko siis mitään merkittävää eroa ihmisen kirjoittaman tekstin ja tekoälyn luoman sisällön välillä? Jos ChatGPT: n kaltainen työkalu on varmasti olemassa, sen pitäisi pystyä erottamaan se.
Kirjoitimme novellin ilman minkäänlaista tekoälytyökalua ja kysyimme sitten ChatGPT: ltä, oliko tarina tekoälyn kirjoittamaa sisältöä. ChatGPT merkitsi sen luottavaisesti tekoälyn luomaksi tekstiksi.
Pyysimme sitten ChatGPT: tä luomaan tarinan, ja samassa keskusteluketjussa kopioimme luodun tekstin ja kysyimme ChatGPT: ltä, oliko teksti tekoälyn luomaa. ChatGPT: n vastaus? Itsevarma "ei".
ChatGPT ei onnistunut tunnistamaan ihmisen kirjoittamaa tai tekoälyn luomaa tekstiä molemmissa tapauksissa. Joten miksi ChatGPT ei pysty tunnistamaan omaa tekstiään? Tarkoittaako tämä sitä, ettei tekoälyn ja ihmisen tekstin välillä ole eroa?
No, siellä on. Voisimme kirjoittaa kokonaisen kirjan näiden kahden eroista, mutta sillä ei ole paljon väliä. Joten jos on eroja, miksi ChatGPT tai mikään muu tekoälytyökalu ei pysty tunnistamaan näitä eroja ja osoittamaan tarkasti tekoälyn luomaa tekstiä ihmisen kirjoittamasta? Vastaus piilee miten ChatGPT toimii ja miten se luo tekstiä.
Kuinka ChatGPT luo tekstiä
Kun pyydät ChatGPT: tä luomaan tekstiä, se yrittää jäljitellä ihmisen kirjoitusprosessia. Ensinnäkin ChatGPT: n takana oleva malli – Generatiivinen esikoulutettu muuntaja (GPT) – on koulutettu suurelle ihmistekstikorpukselle. Kaikki sähköposteista, terveysartikkeleista, teknisistä artikkeleista, lukion esseistä ja melkein mistä tahansa verkosta löytyvästä tekstistä on syötetty mallille koulutuksen aikana. Joten ChatGPT ymmärtää, kuinka kukin tämäntyyppinen teksti tulee kirjoittaa.
Jos pyydät ChatGPT: tä kirjoittamaan sähköpostin pomollesi, se tietää, miltä tällaisen sähköpostin pitäisi näyttää, koska se on koulutettu vastaaviin sähköposteihin – luultavasti tuhansiin. Vastaavasti, jos pyydät sitä kirjoittamaan lukion esseen, se tietää myös, miltä lukion esseen pitäisi kuulostaa. ChatGPT yrittää kirjoittaa mitä haluat sen kirjoittavan ihmisen tavalla.
Mutta siinä on saalis. Toisin kuin ihmisten kirjoittaminen, ChatGPT ei todellakaan ymmärrä, mitä se kirjoittaa, tavalla kuin ihminen. Sen sijaan chatbot yrittää ennustaa, mikä olisi todennäköisin seuraava sana lauseessa, kunnes se saa kirjoituksen valmiiksi.
Kuinka ChatGPT kirjoittaa ennustamalla
Oletetaan, että pyydät ChatGPT: tä kirjoittamaan tarinan kuvitteellisesta kaupungista nimeltä Volkra. On suuri mahdollisuus, että chatbot aloittaa tarinan sanoilla "Once upon". Tämä johtuu siitä, että chatbot ei ajattele sitä itse, mutta yrittää ennustaa, mitä ihminen kirjoittaisi sen perusteella, mitä se on oppinut tuhansista tarinoista, joita sitä on ruokittu aikana koulutusta.
Joten jos uskot, että ihminen todennäköisesti aloittaisi tarinan sanoilla "Once Once", ChatGPT yrittäisi sitten ennustaa seuraavan loogisen sanan, joka on "a" ja sen jälkeen "aika". Joten sinulla olisi sitten "Olipa kerran...", jota seuraa seuraava looginen sana ja seuraava, kunnes tarina on valmis. ChatGPT kirjoittaa periaatteessa ennustamalla, mikä sana tulee luonnollisesti (tai jolla on ainakin suurin todennäköisyys) seuraavaksi lauseessa ja lisäämällä sen.
Joten kun tekoälytyökalu yrittää havaita, onko teksti tekoälyn luoma, yksi sen painottavista kriteereistä on tekstin ennustettavuus, koska tekoälytyökalut kirjoittavat ennustamalla. Tätä ennustettavuuden mittaa kutsutaan tekoälykielessä hämmentyneeksi. Nyt kun ChatGPT: n kaltainen AI-työkalu esitetään tekstin kanssa, se yrittää analysoida tekstiä mitatakseen, kuinka ennakoitavissa on tekstin sanojen tai lauseiden järjestys. Parempi ennustettavuus tai alhainen hämmennys tarkoittaa yleensä sitä, että teksti on todennäköisesti tekoälyn luomaa. Vähemmän ennustettavuutta tai suurempi hämmennys tarkoittaa yleensä sitä, että teksti on todennäköisesti ihmisten kirjoittama.
Nämä kriteerit ja muut tekijät, kuten tekstin luovuus, eivät valitettavasti riitä varmistamaan varmasti, onko teksti tekoälytyökalulla vai ei. Tämä johtuu siitä, että ihmiset voivat kirjoittaa suuremmalla vaihtelulla, kuten esimerkkitekstissä, jota käytimme esittelyyn tämän artikkelin alussa.
AI-chatbotit, kuten ChatGPT, on suunniteltu jäljittelemään luonnollista ihmisen kieltä mahdollisimman paljon. Joten vaikka tekoälytekstissä voi olla havaittavia kuvioita, ne eivät ole niin ilmeisiä edes tehokkaalle työkalulle, kuten ChatGPT. Tästä syystä ChatGPT ei voi havaita omaa kirjoitustaan miksi AI-tekstin ilmaisintyökalut eivät toimi.
Tunnistaako ChatGPT oman kirjoituksensa tulevaisuudessa?
Tällä hetkellä ChatGPT: n kaltaiset työkalut eivät pysty havaitsemaan, onko teksti kirjoitettu itse vai jollain muulla tekoälytyökalulla, koska tekoälyn luomassa sisällössä ei ole selkeää, havaittavissa olevaa kuviota. On kuitenkin hyvä mahdollisuus, että tämä muuttuu pian. Kun ChatGPT: n kaltaiset yritykset pyrkivät tuomaan digitaalisia vesileimoja ChatGPT: n luomaan sisältöön, chatbotin luomassa tekstissä on selkeämpi kuvio.