Vaikka ChatGPT on yksi suosituimmista AI-chatboteista, se ei ehkä enää ole paras. Claude AI tarjoaa joitain GPT-lyöntejä. Mutta kumpi on parempi?

Marraskuussa 2022 julkaisustaan ​​lähtien ChatGPT on pysynyt hallitsevana voimana AI-chatbot-tilassa. Huolimatta useiden tekoälyyritysten kauaskantoisista ponnisteluista kukaan ei ole pystynyt rakentamaan chatbotia, joka todella haastaa ChatGPT: n yleisen vastauslaadun suhteen. Googlen Bard? Microsoftin Bing AI? Ei, ei oikeastaan.

Kuitenkin Claude AI, Anthropicin rakentama chatbot, osoittaa chatbotin ominaisuuksia, jotka voivat syöttää ChatGPT: n. Huomattava määrä käyttäjiä on jo sanonut, että Claude on parempi vaihtoehto. Mutta onko näin? Käydään molemmissa chatboteissa kierros.

ChatGPT vs. Claude AI: Maalaisjärkeä ja loogista päättelyä

Tekoälychatbottien kanssa työskentelyssä on kiehtova kontrasti. Toisaalta he voivat selviytyä monimutkaisista tehtävistä, joiden ratkaisemiseksi ihmiset voivat työskennellä päiviä. Toisaalta he painiskelevat joskus alkeellisten ongelmien kanssa, jotka vaativat vain vähän maalaisjärkeä tai loogista päättelyä. Testasimme siis sekä ChatGPT: tä että Claude AI: tä nähdäksemme, kumpi AI-chatbot oli parempi tervettä järkeä ja loogista päättelyä koskevissa tehtävissä.

instagram viewer

ChatGPT hajotti ongelman osiin ja ratkaisi sen ensimmäisellä yrityksellä. Myös Claude AI teki sen ja ratkaisi ongelman, mutta eri tavalla.

Ensimmäisessä tehtävässä molemmat chatbotit pystyivät murtamaan ongelman. Joten siirryimme toisenlaiseen ongelmaan. Annoimme molemmille chatboteille vastata temppukysymykseen.

ChatGPT havaitsi tempun välittömästi – eloonjääneitä ei voi haudata, koska he eivät ole kuolleita. Claude AI puolestaan ​​näytti ymmärtävän, että se oli temppukysymys, mutta hän ei havainnut yleisintä järkeä olevaa ongelmaa, että eloonjääneitä ei haudata.

Sen sijaan se ylianalysoi kysymystä ja päätyi siihen johtopäätökseen, ettei "eloonjääneitä haudata", koska törmäys Marsista Maahan olisi kohtalokas. Se ei ole vastaus, jota odotimme, mutta jos katsot asioita eri näkökulmasta, siinä on totuutta.

Tässä tehtävässä annamme sen ChatGPT: lle, mutta emme voi täysin sulkea pois Claude AI: n lähestymistapaa. Viimeisessä tehtävässämme tässä mittarissa kysyimme molemmilta chatbotilta, kuinka monta omenaa jää omenapuuhun sen jälkeen Viisi ja 10 päivää, jos aloitimme 10 omenalla, ja viisi niistä leikattiin vielä puussa. ChatGPT sanoi, että jäljellä on vielä 10 omenaa.

Claude AI toisaalta antoi järkevämmän vastauksen tunnustamalla, että viisi viipaloitua omenaa todennäköisesti mätänevät.

Claude AI selvästi sai tämän. Yritimme muutamaa hankalampaa ongelmaa, ja molemmilla chatbotilla oli melkoinen osa onnistumisia ja epäonnistumisia niiden käsittelyssä. Havaitsemamme tuloksen perusteella voisi olla reilua sanoa, että vaikka ChatGPT: llä on etu, molemmat chatbotit eivät ole kovin kaukana toisistaan ​​terveen järjen ja loogisen päättelykyvyn suhteen.

ChatGPT vs. Claude AI: Math Skills

Vaikka et koskaan aikoisikaan käyttää ChatGPT: tä tai Claude AI: tä Algebran kotitehtävien ratkaisemiseen, niiden matemaattisilla kyvyillä on kauaskantoisia vaikutuksia. Tekoäly-chatboteille matematiikka on avain todellisen maailman logiikan ymmärtämiseen, virheellisen ajattelun tunnistamiseen ja virheiden myöntämiseen.

Pohjimmiltaan matematiikan taito on tekoälyn ydinmittari. Joten kumpi chatbot on taitavampi matematiikassa ChatGPT: n ja Claude AI: n välillä? Annoimme molemmille chatboteille tehtäväksi ratkaista mutkainen matemaattinen tuottavuustehtävä. Aloitimme Claude AI: lla, ja chatbot ratkaisi ongelman.

Myös ChatGPT mursi ongelman.

Jatkossa pyysimme molempia chatbotteja ratkaisemaan 8/a-1 = 20/3a-1, melko suoraviivainen matemaattinen ongelma, jolla on yllättävän korkea epäonnistumisprosentti AI-chatbottien keskuudessa. ChatGPT pystyi ratkaisemaan sen antamalla oikean vastauksen -3 ensimmäisellä yrityksellä.

Claude AI epäonnistui ensimmäisellä yrityksellä, mutta kun kehotimme sitä ratkaisemaan ongelman askel askeleelta (mikä pakottaa sen ajattelemaan logiikkansa jokaista vaihetta), se onnistui murtamaan sen.

Yritimme vielä muutamia matemaattisia tehtäviä. Vaikka molemmat chatbotit onnistuivat joissakin tapauksissa oikein ensimmäisellä yrityksellä, Claude AI tarvitsi useissa tapauksissa toisen tai kolmannen yrityksen antaakseen oikean vastauksen. Matemaattisten taitojen osalta annamme kruunun ChatGPT: lle.

ChatGPT vs. Claude AI: Luovuus

Yksi Claude AI: n suurimmista hypeistä on sen luovat kyvyt. Mutta voiko se vastata ChatGPT: n luovuutta? Vai voisiko se ylittää ChatGPT: n? Testaaksemme molemmat chatbotit annoimme heille tehtäväksi kirjoittaa sanat räppilauluun, joka rimmaa.

Valitsimme riimivän rap-testin, koska monet kielimallit kamppailevat sen kanssa. Useimmat mallit eivät tyypillisesti ymmärrä riimitystä oikein, vaikka sanoituksessa itsessään ei ole järkeä. Asioiden kiinnostavuuden lisäämiseksi rap-kappale tulee käsittelemään kurkkujen kasvattamista.

Joten pyysimme sekä ChatGPT: tä että Claude AI: tä "kirjoittamaan riimivän rapin kurkkujen kasvattamisesta maanviljelijänä ja siitä tulee miljonääri." ChatGPT meni ensin, ja odotetusti se tuotti jännittävää sanoitukset.

Sitten syötimme saman kehotteen Claude AI: lle, ja se antoi sille myös reilun mahdollisuuden.

Molemmat sanoitukset ovat hyviä, mutta ChatGPT: llä näytti olevan etu tässä. Siinä oli parempi riimi, ja meillä oli ensimmäisessä kokeessa tarvittava tulos. Meidän täytyi yrittää kolme kertaa ennen kuin Claude AI pystyi tuottamaan sanoituksia, jotka riimivät. Annamme tämän ChatGPT: lle.

Kokeiltuaan muutamaa luovampaa tehtävää Claude AI näytti olevan erinomainen kirjoittamiseen liittyvissä tehtävissä ja pystyi kirjoittamaan luonnollisemman kuuloista sisältöä, kuten ihmiskirjoittaja tekisi. Siitä huolimatta ChatGPT selviytyi paremmin monimutkaisemmista luovista tehtävistä, se ei toisinaan voinut karistaa tuota tekoälyn chatbotin tunnetta luomassaan tekstissä. Meidän tuomiomme? Sekä ChatGPT että Claude AI ovat luovia itsessään.

ChatGPT vs. Claude AI: Koodaustaidot

Aivan kuten matemaattiset taidot, koodaustaidot ovat toinen erittäin tärkeä mittari tekoäly-chatbotin kykyjen arvioinnissa. Vaikka suurin osa käyttäjistä ei todennäköisesti koskaan käytä chatbotia koodaamiseen, chatbotin kyvylle kirjoittaa ja ymmärtää koodia taitavasti on taustalla merkittäviä vaikutuksia.

Vaikka chatbotit ovat tällä hetkellä kehittyneitä, ne ovat kaukana siitä, mitä niistä voisi todellisuudessa tulla, jos ja kun ne osaavat kirjoittaa koodia taitavasti. Jotta AI-chatbotit voisivat todella kehittyä tehokkaiksi tekoälyasistenteiksi, jotka voivat tehdä muutakin kuin luoda tekstiä, niiden on kyettävä kirjoittamaan koodia, joka ratkaisee ongelmia tarpeen mukaan. Olemme aiemmin keskustelleet siitä, kuinka tärkeitä koodaustaidot ovat AI-chatboteillemme ChatGPT-koodin tulkin selittäjä.

Laitoimme molemmat chatbotit kahteen koodaustehtävään. Pyysimme ChatGPT: tä ja Claude AI: tä kirjoittamaan toiminnallisen koodin tehtävälistasovellukselle. ChatGPT: stä alkaen AI-chatbot pystyi toimittamaan toimivan tehtävälistasovelluksen ensimmäisellä yrityksellä. Kopioimme, liitimme ja suoritimme sen selaimella, ja se toimi täydellisesti ilman virheitä. Tässä tuloste selaimessa.

Siirryn Claude AI: hen, chatbot kirjoitti selkeästi ymmärrettävän koodin. Rakenne ja logiikka näyttivät hyvältä. Valitettavasti toistuvista yrityksistä huolimatta Claude AI puuttui kriittisestä logiikasta, jotta koodi todella toimisi selaimessa. Tämä on epäonnistuminen.

Kun Claude AI epäonnistui viimeisessä testissä, kokeilimme toisenlaista koodaustehtävää, joka oli enemmän koodin analysointia ja vähemmän uuden koodin kirjoittamista. Latasimme viisi PHP-tiedostoa, jotka edustavat verkkosivuston koko taustaa, ja pyysimme sekä Claude AI: tä että ChatGPT: tä jossa meidän on muokattava kaikkia ladattuja tiedostoja varmistaaksemme, että saamme sähköpostin, kun uusi käyttäjä rekisteröityy sivusto.

Yllättäen ChatGPT epäonnistui tässä toistuvista yrityksistä huolimatta, vaikka sillä näytti olevan ylivoimaiset koodaustaidot. Claude AI puolestaan ​​pystyi analysoimaan koodin taitavasti ja tunnistamaan oikeat paikat, joita oli muokattava haluttujen tulosten saavuttamiseksi.

Tämä ei tietenkään ollut yksittäinen tapaus, toistimme sen useiden muiden kooditiedostojen kanssa, mutta ChatGPT kompastui ja pysähtyi useimmissa tapauksissa, kun Claude AI tuotti jatkuvasti vaikuttavia tuloksia. Koodaustaitojen suhteen voittaja ei ole täysin yksiselitteinen.

ChatGPT on selvästi parempi uuden koodin kirjoittamisessa ja pystyy hallitsemaan monimutkaista koodia vaikuttavalla taidolla. Claude AI on kuitenkin huomattavasti parempi analysoimaan suuria koodikantoja. Joten jos haluat kirjoittaa koodia jollekin uudelle ideallesi, ChatGPT on työkalu, johon voit kääntyä. Jos haluat analysoida tai tehdä järkeä koodipohjasta, jossa on tuhansia rivejä useissa tiedostoissa, suosittelemme ehdottomasti Claude AI: tä.

Claude AI on voimakas kilpailija

Claude AI edustaa voimakasta kilpailua ChatGPT: lle – joka voi kilpailla ChatGPT: n kanssa ja mahdollisesti ylittää sen jonain päivänä. Koska Claude on suhteellisen uusi tekoälymalli, on kadehdittavaa, että se voi ottaa ChatGPT: n vastaan ​​nykyisellä tavalla. Claude AI: n ilmestyminen ja sen tarjoama laatu ovat todiste kilpailun kuumenemisesta.