Yli 70 vuotta sitten, kun tekoäly keksittiin, Alan Turing julkaisi artikkelin, jossa kuvattiin, kuinka se voidaan tunnistaa. Se tunnettiin myöhemmin Turingin testinä, ja sitä on käytetty vuosikymmeniä erottamaan ihminen ja tekoäly.
Kehittyneiden AI-chatbottien, kuten ChatGPT: n ja Google Bardin, käyttöönoton myötä on kuitenkin entistä vaikeampaa tietää, puhutko tekoälyn kanssa. Se herättää kysymyksen; onko Turingin testi vanhentunut? Ja jos on, mitkä ovat vaihtoehdot?
Onko Turingin testi vanhentunut?
Jotta voit määrittää, onko Turingin testi vanhentunut, sinun on ensin ymmärtää miten se toimii. Jotta tekoäly läpäisi Turingin testin, sen on saatava ihmiskuulustelija vakuuttuneeksi siitä, että se on ihminen. Mutta siinä on saalis: tekoälyä arvioidaan ihmisen rinnalla, ja sen on reagoitava tekstin avulla.
Ajattele sitä näin; jos olet kuulustelija ja esität kysymyksiä kahdelle osallistujalle verkossa tekstin avulla, mutta yksi heistä on tekoälymalli – eroaisitko heidät toisistaan viiden minuutin kuluttua? Muista, että Turingin testin tavoitteena ei ole tunnistaa tekoälymallia oikeiden vastausten perusteella, vaan arvioida, pystyykö tekoäly ajattelemaan tai käyttäytymään kuin ihminen.
Ongelma Turingin testilähestymistavan kanssa, joka tunnistaa vain ihmisen kaltaiset vastaukset, on, että se ei ota huomioon muita tekijöitä. Esimerkiksi tekoälymallin älykkyys tai kuulustelijan tieto. Lisäksi Turing-testi rajoittuu vain tekstiin, ja on yhä vaikeampaa tunnistaa tekoälyä, joka tuottaa ihmisääntä tai Deepfake-videoita, jotka jäljittelevät ihmisen käyttäytymistä.
Nykyiset tekoälymallit, kuten ChatGPT-4 ja Google Bard, eivät kuitenkaan ole vielä edenneet niin pitkälle, että ne voisivat jatkuvasti läpäistä Turingin testin. Itse asiassa, jos olet perehtynyt tekoälyyn, voit paikalla tekoälyn luomaa tekstiä.
5 parasta Turingin testivaihtoehtoa
Se on mahdollista tulevat tekoälymallit, kuten ChatGPT-5 voi läpäistä Turingin testin. Jos näin tapahtuu, tarvitsemme erilaisia testejä yhdistettynä Turingin testiin selvittääksemme, puhummeko tekoälyn vai ihmisen kanssa. Tässä ovat parhaat Turingin testivaihtoehdot:
1. Marcuksen testi
Gary Marcus, tunnettu kognitiivinen tutkija ja tekoälytutkija, ehdotti vaihtoehtoa Turingin testille, joka julkaistiin New Yorkilainen tunnistaa tekoälyn kognitiiviset kyvyt. Testi on yksinkertainen: arvioit tekoälymallin sen perusteella, kuinka se pystyy katsomaan ja ymmärtämään YouTube-videoita ja TV-ohjelmia ilman tekstitystä tai tekstiä. Jotta tekoäly läpäisi Marcus-testin, sen tulee ymmärtää sarkasmia, huumoria, ironiaa ja tarinaa katsoessaan videoita ja selittää se ihmisen tavoin.
Tällä hetkellä, GPT-4 voi kuvata kuvia, mutta toistaiseksi ei ole olemassa tekoälymallia, joka pystyisi ymmärtämään videoita kuin ihminen. Itse ajavat ajoneuvot tulla lähelle, mutta ne eivät ole täysin itsenäisiä ja vaativat antureita, koska ne eivät pysty ymmärtämään kaikkea ympäröivässä ympäristössään.
2. Visuaalinen Turingin testi
Vuonna julkaistun tutkimuspaperin mukaan PNAS, visuaalista Turing-testiä voidaan käyttää kuvakyselyiden avulla tunnistamaan, puhutko ihmiselle vai tekoälylle. Se toimii kuten Turingin testi, mutta sen sijaan, että osallistujat vastaisivat kysymyksiin tekstin avulla, heille näytetään kuvia ja heidän odotetaan vastaavan yksinkertaisiin kysymyksiin samalla kun hän ajattelee kuin ihminen. Kuitenkin visuaalinen Turingin testi eroaa CAPTCHA: sta koska kaikki vastaukset ovat oikeita – mutta testin läpäisemiseksi tekoälyn on käsiteltävä kuvat samalla tavalla kuin ihmisen.
Tämän lisäksi, jos tekoälylle ja ihmiselle näytetään useita kuvia vierekkäin ja pyydetään tunnistamaan realistisia kuvia, ihmisellä olisi kognitiivinen kyky läpäistä testi. Tämä johtuu siitä, että tekoälymallien on vaikea erottaa kuvia, jotka eivät näytä siltä kuin ne olisi otettu todellisessa maailmassa. Itse asiassa se on syy, miksi voit tunnistaa tekoälyn luomat kuvat käyttämällä poikkeavuuksia, joissa ei ole järkeä.
3. Lovelace 2.0 -testi
Ada Lovelace käsitteli ensimmäisenä teorian, jonka mukaan tietokone ei voi luoda alkuperäisiä ideoita muuhun kuin se oli ohjelmoitu tekemään, ennen Turingin testiä. Alan Turing kuitenkin vastusti tätä teoriaa väittäen, että tekoäly voi silti yllättää ihmisiä. Vasta vuonna 2001 Lovelace-testin ohjeet kehitettiin erottamaan tekoäly ihmisestä – ja kuten kurzweillikirjasto Sääntöjä tarkistettiin myöhemmin vuonna 2014.
Jotta tekoäly läpäisi Lovelace-testin, sen on osoitettava, että se pystyy luomaan alkuperäisiä ideoita, jotka ylittävät sen koulutuksen. Nykyisillä tekoälymalleilla, kuten GPT-4:llä, ei ole kykyä keksiä uusia keksintöjä nykyisen tietämyksemme lisäksi. Kuitenkin, yleistä tekoälyä voi saavuttaa tämän kyvyn ja läpäistä Lovelace-testin.
4. Käänteinen Turingin testi
Entä Turingin testi, mutta tehty päinvastoin? Sen sijaan, että yrittäisit selvittää, puhutko ihmiselle, tavoite on käänteinen Turingin testi on huijata tekoäly uskomaan, että olet tekoäly. Tarvitset kuitenkin myös toisen tekoälymallin vastataksesi samoihin kysymyksiin tekstin avulla.
Jos esimerkiksi ChatGPT-4 on kuulustelija, voit rekisteröidä osallistujiksi Google Bardin ja toisen ihmisen. Jos tekoälymalli tunnistaa vastausten perusteella oikein osallistujan, se on läpäissyt testin.
Käänteisen Turing-testin haittapuoli on, että se on epäluotettava, varsinkin kun otetaan huomioon se joskus AI ei voi erottaa tekoälyn luomaa ja ihmisten kirjoittamaa sisältöä.
5. AI Classification Framework
Tekoälyn luokittelukehyksen mukaan, jonka on kehittänyt Chris Saad, Turingin testi on vain yksi arviointimenetelmä, jonka avulla voit tietää, puhutko tekoälylle. Lyhyesti sanottuna tekoälyn luokituskehys perustuu moniälyn teoriaan, joka edellyttää, että ihmisen älykkyys täyttää vähintään kahdeksan erilaista kriteeriä. sisältää: musiikillinen rytmi, loogis-matemaattinen älykkyys, visuaalinen tunnistus, tunneäly, itsereflektiivinen äly, eksistentiaalinen ajattelukyky ja keho liikettä.
Koska tekoälyä arvioidaan kahdeksalla eri parametrilla, se on epätodennäköistä, että se läpäisee ihmisen, vaikka se suoriutuisi keskimääräistä paremmin tietyissä vertailuarvoissa. Esimerkiksi, ChatGPT voi ratkaista matemaattisia tehtäviä, kuvaavat kuvia ja keskustelevat luonnollisella kielellä kuten ihminen, mutta se epäonnistuisi muissa tekoälyn luokituskehyksessä määritellyissä luokissa.
Turingin testi ei ole ratkaiseva
Turingin testin oli tarkoitus olla enemmän ajatuskoe kuin lopullinen testi ihmisten ja tekoälyn erottamiseksi toisistaan. Kun sitä alun perin ehdotettiin, se oli koneen älykkyyden mittaamisen keskeinen vertailukohta.
Äskettäin kehitettyjen AI-mallien, joissa on puhe-, visuaalinen- ja vuorovaikutteisia kuulokykyjä, ansiosta Turingin testi kuitenkin epäonnistuu, koska se rajoittuu tekstikeskusteluun. Tehokkain ratkaisu olisi ottaa käyttöön Turingin testivaihtoehtoja, jotka erottavat tekoälymallit entisestään ihmisistä.