Olet luultavasti kuullut OpenAI: n GPT: stä, mutta he eivät ole ainoita LLM: itä alueella.
Key Takeaways
- OpenAI: n GPT-4 on edistynein ja laajimmin käytetty isokielimalli, jossa on 1,76 biljoonaa parametria ja multimodaalisia kykyjä.
- Anthropic's Claude 2 kilpailee GPT-4:n kanssa luovissa kirjoitustehtävissä ja pysyy pystyssä, vaikka sillä on vähemmän resursseja.
- Googlen PaLM 2, vaikka se ei olekaan GPT-4-tappaja, on tehokas kielimalli, jolla on vahvat monikieliset ja luovat kyvyt. Falcon-180B on avoimen lähdekoodin malli, joka kilpailee kaupallisten jättiläisten kanssa ja kestää varpaista varpaisiin GPT-3.5:n kanssa.
On tekoälykausi, ja teknologiayritykset tuovat esiin suuria kielimalleja, kuten leipää leipomosta. Uusia malleja julkaistaan nopeasti, ja niiden seuraaminen on tulossa liian vaikeaksi.
Mutta uusien julkaisujen myrskyn keskellä vain muutama malli on noussut huipulle ja osoittautunut todellisiksi kilpailijoiksi suuressa kielimallitilassa. Vuoden 2023 loppua lähestyessämme olemme koonneet kuusi vaikuttavinta suurta kielimallia, joita sinun kannattaa kokeilla.
1. OpenAI: n GPT-4
GPT-4 on tähän mennessä edistynein julkisesti saatavilla oleva suurikielinen malli. OpenAI: n kehittämä ja maaliskuussa 2023 julkaistu GPT-4 on uusin iteraatio Generative Pre-trained Transformer -sarjassa joka alkoi vuonna 2018. Valtavilla ominaisuuksillaan GPT-4:stä on tullut yksi laajimmin käytetyistä ja suosituimmista suurista kielimalleista maailmassa.
Vaikka sitä ei ole virallisesti vahvistettu, lähteet arvioivat, että GPT-4 voi sisältää huikeat 1,76 biljoonaa parametria, noin kymmenen kertaa enemmän kuin edeltäjänsä GPT-3.5 ja viisi kertaa suurempi kuin Googlen lippulaiva PaLM 2. Tämä massiivinen mittakaava mahdollistaa GPT-4:n multimodaaliset ominaisuudet, jolloin se voi käsitellä sekä tekstiä että kuvia syötteenä. Tämän seurauksena GPT-4 voi tulkita ja kuvata visuaalista tietoa, kuten kaavioita ja kuvakaappauksia tekstin lisäksi. Sen multimodaalinen luonne tarjoaa ihmismäisemmän ymmärryksen todellisesta datasta.
Tieteellisissä vertailuissa GPT-4 on huomattavasti parempi kuin muut nykyiset mallit erilaisissa testeissä. Vaikka vertailuarvot eivät yksinään täysin osoita mallin vahvuuksia, todelliset käyttötapaukset ovat osoittaneet, että GPT-4 on poikkeuksellisen taitava ratkaisemaan käytännön ongelmia intuitiivisesti. GPT-4 laskutetaan tällä hetkellä 20 dollaria kuukaudessa ja saatavilla ChatGPT: n Plus -sopimuksen kautta.
2. Anthropic's Claude 2
Vaikka Anthropic AI: n kehittämä Claude 2 ei ole yhtä suosittu kuin GPT-4, se voi vastata GPT -4:n teknisiä vertailuarvoja ja todellista suorituskykyä useilla alueilla. Joissakin standardoiduissa testeissä, mukaan lukien tietyt kokeet, Claude 2 on parempi kuin GPT-4. Tekoälymallissa on myös huomattavasti parempi kontekstiikkuna noin 100 000 tunnuksella verrattuna GPT -4:n 8k- ja 32k-merkkimalleihin. Vaikka suurempi kontekstin pituus ei aina tarkoita parempaa suorituskykyä, Claude 2:n laajennettu kapasiteetti tarjoaa selkeitä etuja, kuten kokonaisten 75 000 sanan kirjojen sulattamisen analysointia varten.
Yleisessä suorituskyvyssä GPT-4 on edelleen parempi, mutta sisäiset testimme osoittavat, että Claude 2 ylittää sen useissa luovissa kirjoitustehtävissä. Claude 2 jäljittää myös GPT-4:n ohjelmointi- ja matemaattisissa taidoissa arvioidemme perusteella, mutta se on erinomainen tarjoamaan ihmismäisiä, luovia vastauksia. Kun kehotimme kaikkia tämän luettelon malleja kirjoittamaan tai kirjoittamaan uudelleen luovan teoksen, kuusi kertaa kymmenestä, valitsimme Claude 2:n tuloksen sen luonnolliselta kuulostavan ihmisen kaltaisten tulosten vuoksi. Tällä hetkellä, Claude 2 on saatavilla ilmaiseksi Claude AI -chatbotin kautta. Saatavilla on myös 20 dollarin maksettu paketti lisäominaisuuksien käyttöön.
Huolimatta pienemmästä taloudellisesta tuesta kuin jättiläisillä, kuten OpenAI ja Microsoft, Anthropicin Claude 2 AI -malli pitää puolensa suosittuja GPT-malleja ja Googlen PaLM-sarjaa vastaan. Claude 2 on vaikuttavan kilpailukykyinen tekoälylle, jolla on vähemmän resursseja. Jos joutuu lyömään vetoa siitä, millä nykyisellä mallilla on parhaat mahdollisuudet kilpailla GPT: n kanssa lähitulevaisuudessa, Claude 2 näyttää turvallisimmalta vedolta. Vaikka Claude 2:n edistyneet ominaisuudet ovatkin ylivoimaisia rahoituksessa, se voi mennä varpaisiin jopa hyvin rahoitetut behemotit (vaikka on syytä huomata, että Google on antanut useita suuria panoksia Antrooppinen). Malli ylittää painoluokkansa ja näyttää lupaavalta nousevana haastajana.
3. OpenAI: n GPT-3.5
Vaikka GPT-4:n julkaisu varjostaa, GPT-3.5:tä ja sen 175 miljardia parametria ei pidä aliarvioida. Iteratiivisen hienosäädön ja suorituskykyyn, tarkkuuteen ja turvallisuuteen keskittyvien päivitysten ansiosta GPT-3.5 on edennyt pitkälle alkuperäisestä GPT-3-mallista. Vaikka siitä puuttuu GPT -4:n multimodaaliset ominaisuudet ja se on jäljessä kontekstin pituudessa ja parametrien määrässä, GPT-3.5 on edelleen erittäin suorituskykyinen, ja GPT-4 on ainoa malli, joka pystyy ylittämään sen kaiken kaikkiaan päättäväisesti.
Huolimatta siitä, että GPT-3.5 on GPT-perheen toisen tason malli, se voi pitää paikkansa ja jopa ylittää Googlen ja Metan lippulaivamallit useissa vertailuissa. Matemaattisten ja ohjelmointitaitojen rinnakkaisissa testeissä Googlen PaLM 2:ta vastaan erot eivät olleet jyrkkiä, ja GPT-3.5:llä oli joissakin tapauksissa jopa pieni etu. Luovemmat tehtävät, kuten huumori ja kerronnallinen kirjoittaminen, saivat GPT-3.5:n edistymään ratkaisevasti.
Joten vaikka GPT-4 merkitsee uutta virstanpylvästä tekoälyssä, GPT-3.5 on edelleen vaikuttavan tehokas malli, joka pystyy kilpailemaan ja joskus ylittämään jopa edistyneimmät vaihtoehdot. Sen jatkuva hienostuneisuus varmistaa, että se pysyy merkityksellisenä jopa räikeämpien seuraavan sukupolven mallien rinnalla.
4. Googlen PaLM 2
Tekoälymallin kykyjä arvioitaessa todistettu kaava on lukea tekninen raportti ja Tarkista benchmark-pisteet, mutta ota kaikki oppimasi suolalla ja testaa mallia sinä itse. Vaikka se saattaa tuntuakin ristiriitaiselta, benchmark-tulokset eivät aina vastaa todellista suorituskykyä joidenkin tekoälymallien osalta. Paperilla Googlen PaLM 2:n piti olla GPT-4:n tappaja, ja viralliset testitulokset viittaavat siihen, että se vastaa GPT-4:ää joissakin vertailuissa. Päivittäisessä käytössä syntyy kuitenkin erilainen kuva.
Loogisessa päättelyssä, matematiikassa ja luovuudessa PaLM 2 jää alle GPT-4:n. Se on myös jäljessä Anthropic's Claudesta useissa luovissa kirjoitustehtävissä. Vaikka se ei kuitenkaan täytä laskutustaan GPT-4-murhaajana, Googlen PaLM 2 on edelleen tehokas kielimalli itsessään, valtavilla kyvyillä. Suuri osa sitä ympäröivästä negatiivisesta tunteesta johtuu vertailuista GPT-4:n kaltaisiin malleihin eikä suoranaisesti huonoon suorituskykyyn.
340 miljardilla parametrilla PaLM 2 on yksi maailman suurimmista malleista. Se on erityisen hyvä monikielisissä tehtävissä ja hänellä on vahvat matemaattiset ja ohjelmointitaidot. Vaikka PaLM 2 ei ole paras siinä, se on myös melko tehokas luovissa tehtävissä, kuten kirjoittamisessa. Vaikka vertailuarvot maalasivat optimistisen kuvan, joka ei täysin toteutunut, PaLM 2 osoittaa silti vaikuttavia tekoälytaitoja, vaikka se ei ylittäisikään kaikkia kilpailijoita.
5. TII: n Falcon-180B
Ellet ole pysynyt AI-kielimallien nopean julkaisun tahdissa, et todennäköisesti ole koskaan tavannut Falcon-180B: tä. Arabiemiirikuntien Technology Innovation Instituten kehittämä 180 miljardin parametri Falcon-180 on yksi tehokkaimmista. avoimen lähdekoodin kielimalleja, vaikka siitä puuttuisikin GPT-mallien nimentunnistus tai Metan laaja käyttö Laama 2. Mutta älä erehdy – Falcon-180B kestää varpaisiin varpaisiin luokkansa parhaiden kanssa.
Vertailutulokset paljastavat, että Falcon-180B ylittää useimmat avoimen lähdekoodin mallit ja kilpailee kaupallisten juggernauttien, kuten PaLM 2 ja GPT-3.5. Matematiikan, koodauksen, päättelyn ja luovien kirjoitustehtävien testaamisessa se päihitti jopa GPT-3.5:n ja PaLM 2:n. ajat. Jos luokittelemme GPT-4:n, GPT-3.5:n ja Falcon-180B: n, asetamme Falcon-180B: n tasaisesti GPT-4:n ja GPT-3.5:n väliin sen vahvuuksien vuoksi useissa käyttötapauksissa.
Vaikka emme voi varmuudella sanoa, että se on parempi kuin GPT-3.5 kokonaissuorituskyvyltään, se tekee itsestään selvän. Vaikka tämä malli on epäselvä, se ansaitsee huomion, koska se vastaa tai ylittää paremmin tunnettujen vaihtoehtojen ominaisuudet. Voit kokeilla Falcon-180B mallia Halaavat kasvot (avoimen lähdekoodin LLM-alusta).
Llama 2, Meta AI: n 70 miljardin parametrin suuri kielimalli, perustuu edeltäjäänsä Llama 1:een. Vaikka Llama 2 on pienempi kuin johtavat mallit, se ylittää merkittävästi useimmat julkisesti saatavilla olevat avoimen lähdekoodin LLM: t vertailuissa ja todellisessa käytössä. Poikkeuksena olisi Falcon-180B.
Testasimme Llama 2:ta vastaan GPT-4, GPT-3.5, Claude 2 ja PaLM 2 arvioidaksemme sen ominaisuuksia. Ei ole yllättävää, että GPT-4 ohitti Llama 2:n lähes kaikissa parametreissa. Llama 2 piti kuitenkin paikkansa GPT-3.5:tä ja PaLM 2:ta vastaan useissa arvioinneissa. Vaikka olisi epätarkkoja väittää, että Llama 2 on parempi kuin PaLM 2, Llama 2 ratkaisi monia ongelmia, jotka järkyttivät PaLM 2:ta, mukaan lukien koodaustehtävät. Claude 2 ja GPT-3.5 syrjäyttivät Llama 2:n joillakin alueilla, mutta olivat ratkaisevasti parempia vain rajoitetussa määrässä tehtäviä.
Joten vaikka se ei ylitä suurimpien patentoitujen mallien ominaisuuksia, avoimen lähdekoodin Llama 2 lyö yli painoluokkansa. Avoimessa mallissa se osoittaa vaikuttavaa suorituskykyä ja kilpailee AI-jättiläisten, kuten PaLM 2:n, kanssa valituissa arvioinneissa. Llama 2 tarjoaa välähdyksen avoimen lähdekoodin kielimallien tulevaisuuden mahdollisuuksiin.
Tekoälymallien välinen suorituskykyero on kaventunut
Vaikka tekoälymaailma kehittyykin vauhdikkaasti, OpenAI: n GPT-4 on edelleen paketin johtaja. Vaikka GPT-4 on kuitenkin mittakaavaltaan ja suorituskyvyltään vertaansa vailla, Claude 2:n kaltaiset mallit osoittavat, että riittävällä taidolla pienemmät mallit voivat kilpailla valituilla alueilla. Vaikka Googlen PaLM 2 ei yltänyt joidenkin ylevien odotusten tasolle, siinä on edelleen syvällisiä ominaisuuksia. Ja Falcon-180B todistaa, että avoimen lähdekoodin aloitteet voivat kestää rinta rinnan alan titaanien kanssa, jos niillä on riittävät resurssit.