PaLM 2 tuo valtavia päivityksiä Googlen LLM: ään, mutta tarkoittaako se, että se voi nyt päästä varpaisiin OpenAI: n GPT-4:n kanssa?
Google esitteli Pathways Language Model (PaLM 2) -mallinsa seuraavan sukupolven 10. toukokuuta 2023 Google I/O 2023 -tapahtumassa. Sen uusi suuri kielimalli (LLM) tarjoaa paljon parannuksia edeltäjäänsä (PaLM) verrattuna ja saattaa vihdoin olla valmis ottamaan vastaan suurimman kilpailijansa, OpenAI: n GPT-4:n.
Mutta kuinka paljon Google on parantanut? Onko PaLM 2 se erontekijä, jonka Google toivoo olevan, ja mikä tärkeintä, niin monilla samankaltaisilla ominaisuuksilla PaLM 2 eroaa OpenAI: n GPT-4:stä?
PaLM 2 vs. GPT-4: Suorituskyvyn yleiskatsaus
PaLM 2 on täynnä uusia ja parannettuja ominaisuuksia edeltäjäänsä verrattuna. Yksi PaLM 2:n ainutlaatuisista eduista GPT-4:ään verrattuna on se, että sitä on saatavana pienempinä koossa tiettyihin sovelluksiin, joissa ei ole yhtä paljon sisäistä prosessointitehoa.
Kaikilla näillä eri kokoisilla on omat pienemmät mallinsa nimeltä Gecko, Otter, Bison ja Unicorn, joista Gecko on pienin, jota seuraa Otter, Bison ja lopuksi Unicorn, suurin malli.
Google väittää myös parantavan päättelykykyä GPT-4:ään verrattuna WinoGrandessa ja DROPissa, kun edellinen vetää kapean marginaalin ARC-C: ssä. PaLM: n ja SOTA: n osalta on kuitenkin tapahtunut merkittäviä parannuksia.
Googlen 91-sivun mukaan PaLM 2 on myös parempi matematiikassa PaLM 2 -tutkimuspaperi [PDF]. Kuitenkin tapa, jolla Google ja OpenAI ovat jäsentäneet testituloksensa, vaikeuttaa näiden kahden mallin suoraa vertailua. Google jätti myös pois joitain vertailuja, todennäköisesti koska PaLM 2 ei toiminut läheskään yhtä hyvin kuin GPT-4.
MMLU: ssa GPT-4 sai 86,4 ja PaLM 2 81,2. Sama pätee HellaSwagiin, jossa GPT-4 teki maalin 95.3, mutta PaLM 2 saattoi kerätä vain 86.8, ja ARC-E, jossa GPT-4 ja PaLM 2 saivat 96.3 ja 89.7, vastaavasti.
PaLM 2 -perheen suurin malli on PaLM 2-L. Vaikka emme tiedä sen tarkkaa kokoa, tiedämme, että se on huomattavasti pienempi kuin suurin PaLM-malli, mutta käyttää enemmän harjoituslaskentaa. Googlen mukaan, PaLM: lla on 540 miljardia parametria, joten "huomattavasti pienemmän" PaLM 2:n pitäisi sijoittaa 10-300 miljardiin parametriin. Muista, että nämä luvut ovat vain oletuksia, jotka perustuvat siihen, mitä Google on sanonut PaLM 2 -paperissa.
Jos tämä luku on lähellä 100 miljardia tai alle, PaLM 2 on todennäköisesti parametrien suhteen pienempi kuin GPT-3.5. Kun otetaan huomioon malli, jonka potentiaalisesti alle 100 miljardia voi mennä varpaisiin varpaisiin GPT-4:n kanssa ja jopa voittaa sen joissakin tehtävissä, on vaikuttava. GPT-3.5 puhalsi aluksi kaiken vedestä, mukaan lukien PaLM, mutta PaLM 2 on toipunut melkoisesti.
Erot GPT-4:n ja PaLM 2:n koulutustiedoissa
Vaikka Google ei ole julkistanut PaLM 2:n koulutustietojoukon kokoa, yritys raportoi tutkimuspaperissaan, että uuden LLM: n harjoitustietojoukko on huomattavasti suurempi. OpenAI käytti myös samaa lähestymistapaa julkistaessaan GPT-4:n, eikä esittänyt väitteitä harjoitustietojoukon koosta.
Google halusi kuitenkin keskittyä syvempään matematiikan, logiikan, päättelyn ja tieteen ymmärtämiseen, mikä tarkoittaa, että suuri osa PaLM 2:n harjoitustiedoista keskittyy edellä mainittuihin aiheisiin. Google sanoo julkaisussaan, että PaLM 2:n esikoulutuskorpus koostuu useista lähteistä, mukaan lukien verkkoasiakirjat, kirjoja, koodia, matematiikkaa ja keskusteludataa, mikä parantaa kaikkialla, ainakin verrattuna PaLM.
PaLM 2:n keskustelutaidon pitäisi olla myös toisella tasolla, koska mallia on koulutettu yli 100 kielellä, jotta se ymmärtää paremmin kontekstin ja käännetään paremmin kykyjä.
Sikäli kuin GPT-4:n harjoitustiedot on vahvistettu, OpenAI on kertonut meille, että se on kouluttanut mallia käyttämällä julkisesti saatavilla olevia tietoja ja lisensoimia tietoja. GPT-4:n tutkimussivu toteaa: "Data on verkkomittakaavainen tietokokoelma, joka sisältää oikeita ja vääriä ratkaisuja matemaattisiin ongelmiin, heikkoihin ja vahvaa päättelyä, ristiriitaisia ja johdonmukaisia lausuntoja ja edustaa suurta valikoimaa ideologioita ja ideoita."
Kun GPT-4:ltä kysytään, se voi tuottaa monenlaisia vastauksia, joista kaikki eivät välttämättä liity kyselyyn. Yhdenmukaistaakseen sen käyttäjän tarkoituksen kanssa OpenAI hienosääti mallin käyttäytymistä vahvistamalla oppimista ihmisen palautteen avulla.
Vaikka emme ehkä tiedä tarkkaa harjoitustietoa kumpaakaan mallia käyttäen, tiedämme, että koulutuksen tarkoitus oli hyvin erilainen. Meidän on odotettava ja katsottava, kuinka tämä ero koulutustarkoituksessa erottaa nämä kaksi mallia tosielämässä.
PaLM 2- ja GPT-4-chatbotit ja -palvelut
Ensimmäinen portaali molempien LLM: ien pääsyyn käyttää vastaavia chatbotteja, PaLM 2:n Bardia ja GPT-4:n ChatGPT: tä. GPT-4 on kuitenkin ChatGPT Plus -maksumuurin takana, ja ilmaiset käyttäjät pääsevät vain GPT-3.5:een. Bard puolestaan on ilmainen kaikille ja saatavilla 180 maassa.
Tämä ei tarkoita, että et myöskään voi käyttää GPT-4:ää ilmaiseksi. Microsoftin Bing AI Chat käyttää GPT-4:ää ja on täysin ilmainen, avoin kaikille ja saatavilla Bing Searchin, Googlen suurimman kilpailijan, vieressä.
Google I/O 2023 oli täynnä ilmoituksia siitä, kuinka PaLM 2 ja generatiivinen tekoälyintegraatio parantavat Google Workspacea kokemusta tekoälyominaisuuksista, jotka tulevat Google Docsiin, Sheetsiin, Slidesiin, Gmailiin ja lähes kaikkiin hakujättiläisten tarjoamiin palveluihin. Lisäksi Google on vahvistanut, että PaLM 2 on jo integroitu yli 25 Google-tuotteeseen, mukaan lukien Android ja YouTube.
Vertailun vuoksi Microsoft on jo tuonut tekoälyominaisuuksia Microsoft Office -ohjelmasarjaan ja moniin palveluihinsa. Tällä hetkellä voit kokea molemmat LLM: t omissa versioissaan samankaltaisista tarjouksista kahdelta kilpailevalta yritykseltä, jotka käyvät vastakkain AI-taistelussa.
Kuitenkin, koska GPT-4 ilmestyi aikaisin ja on ollut varovainen välttääkseen monia virheitä, joita Google teki alkuperäisen Bardin kanssa, se on ollut de facto LLM kolmannen osapuolen kehittäjille, startup-yrityksille ja melkein kaikille muille, jotka haluavat sisällyttää palvelukseensa toimivan tekoälymallin. kaukana. Meillä on luettelo GPT-4-sovelluksista, jos haluat tarkistaa ne.
Tämä ei tarkoita, etteivätkö kehittäjät vaihtaisi PaLM 2:een tai ainakin kokeilisi sitä, mutta Googlen on silti pelattava OpenAI: ta tällä rintamalla. Ja se tosiasia, että PaLM 2 on avoimen lähdekoodin, sen sijaan että se olisi lukittu maksullisen API: n taakse, tarkoittaa, että sillä on potentiaalia tulla laajemmin käyttöön kuin GPT-4.
Voiko PaLM 2 ottaa vastaan GPT-4:n?
PaLM 2 on vielä hyvin uusi, joten vastaus siihen, voiko se ottaa GPT-4:n vai ei, on vielä ratkaisematta. Kaikella, mitä Google lupaa, ja aggressiivisella tavalla, jota se on päättänyt käyttää sen levittämiseen, näyttää kuitenkin siltä, että PaLM 2 voi antaa GPT-4:lle rahansa.
GPT-4 on kuitenkin edelleen varsin pätevä malli ja, kuten aiemmin mainittiin, voittaa PaLM 2:n melko monessa vertailussa. PaLM 2:n useat pienemmät mallit antavat kuitenkin sille kiistattoman edun. Gecko itsessään on niin kevyt, että se toimii mobiililaitteilla myös offline-tilassa. Tämä tarkoittaa, että PaLM 2 voi tukea täysin erilaista tuote- ja laiteluokkaa, joilla saattaa olla vaikeuksia käyttää GPT-4:ää.
AI Race kuumenee
PaLM2:n julkaisun myötä kilpailu tekoälyn dominanssista on kiihtynyt, koska tämä saattaa olla ensimmäinen arvokas vastustaja, joka ottaa vastaan GPT-4:n. Kun uudempi multimodaalinen tekoälymalli nimeltä "Gemini" on myös harjoittelussa, Google ei näytä täällä hidastumisen merkkejä.