Suuret kielimallit (LLM) ovat taustalla oleva tekniikka, joka on johtanut generatiivisten AI-chatbottien nousuun. Työkalut, kuten ChatGPT, Google Bard ja Bing Chat, luottavat LLM: ihin, jotka luovat ihmismäisiä vastauksia kehotteisiin ja kysymyksiisi.
Mutta mitä LLM: t ovat ja miten ne toimivat? Tässä pyrimme poistamaan LLM: t.
Mikä on suuri kielimalli?
Yksinkertaisimmillaan LLM on valtava tekstidatan tietokanta, johon voidaan viitata luodakseen ihmismäisiä vastauksia kehotteihisi. Teksti tulee useista lähteistä ja voi olla miljardeja sanoja.
Yleisimpiä käytettyjä tekstidatan lähteitä ovat:
- Kirjallisuus: LLM: t sisältävät usein valtavia määriä nykyaikaista ja klassista kirjallisuutta. Tämä voi sisältää kirjoja, runoutta ja näytelmiä.
- Verkkosisältöä: LLM sisältää useimmiten suuren arkiston verkkosisältöä, mukaan lukien blogit, verkkosisältö, keskustelupalstan kysymyksiä ja vastauksia sekä muuta verkkotekstiä.
- Uutisia ja ajankohtaisia asioita: Jotkut, mutta eivät kaikki, LLM: t voivat käyttää ajankohtaisia uutisaiheita. Tietyt LLM: t, kuten GPT-3.5, ovat tässä mielessä rajoitettuja.
- Sosiaalinen media: Sosiaalinen media edustaa valtavaa luonnollisen kielen resurssia. LLM: t käyttävät tekstiä suurilta alustoilta, kuten Facebook, Twitter ja Instagram.
Tietysti valtava tietokanta tekstiä on yksi asia, mutta LLM: t on koulutettava ymmärtämään se tuottaakseen ihmisen kaltaisia vastauksia. Käsittelemme seuraavaksi kuinka se tekee tämän.
Miten LLM: t toimivat?
Kuinka LLM: t käyttävät näitä tietovarastoja vastaustensa luomiseen? Ensimmäinen askel on analysoida data käyttämällä syväoppimisprosessia.
Syväoppimista käytetään tunnistamaan ihmiskielen malleja ja vivahteita. Tähän sisältyy kieliopin ja syntaksin ymmärtäminen. Mutta mikä tärkeintä, se sisältää myös kontekstin. Kontekstin ymmärtäminen on elintärkeä osa LLM: ää.
Katsotaanpa esimerkkiä siitä, kuinka LLM: t voivat käyttää kontekstia.
Seuraavan kuvan kehote mainitsee lepakon näkemisen yöllä. Tästä ChatGPT ymmärsi, että puhumme eläimestä eikä esimerkiksi pesäpallomailasta. Tietenkin muut chatbotit pitävät Bing Chat tai Google Bard voi vastata tähän täysin eri tavalla.
Se ei kuitenkaan ole erehtymätön, ja kuten tämä esimerkki osoittaa, joskus sinun on annettava lisätietoja saadaksesi halutun vastauksen.
Tässä tapauksessa heitimme tarkoituksella hieman kaarevaa palloa osoittaaksemme, kuinka helposti konteksti katoaa. Mutta ihmiset voivat myös ymmärtää väärin kysymysten kontekstin, ja vastauksen korjaaminen vaatii vain ylimääräisen kehotteen.
Näiden vastausten luomiseksi LLM: t käyttävät tekniikkaa, jota kutsutaan luonnollisen kielen luomiseksi (NLG). Tämä sisältää syötteen tutkimisen ja sen tietovarastosta opittujen mallien käyttämisen kontekstuaalisesti oikean ja asiaankuuluvan vastauksen luomiseksi.
Mutta LLM: t menevät tätä syvemmälle. He voivat myös räätälöidä vastaukset syötteen tunnesävyn mukaan. Yhdistettynä kontekstuaaliseen ymmärtämiseen nämä kaksi puolta ovat tärkeimmät tekijät, joiden avulla LLM: t voivat luoda ihmisen kaltaisia vastauksia.
Yhteenvetona voidaan todeta, että LLM: t käyttävät valtavaa tekstitietokantaa syväoppimisen ja NLG-tekniikoiden yhdistelmällä luodakseen ihmismäisiä vastauksia kehotteihisi. Mutta sillä, mitä tällä voidaan saavuttaa, on rajoituksia.
Mitkä ovat LLM: ien rajoitukset?
LLM: t edustavat vaikuttavaa teknologista saavutusta. Mutta tekniikka on kaukana täydellisestä, ja niiden saavuttamiselle on edelleen paljon rajoituksia. Jotkut niistä merkittävimmistä on lueteltu alla:
- Asiayhteyden ymmärtäminen: Mainitsimme tämän asiana, jonka LLM: t sisällyttävät vastauksiinsa. He eivät kuitenkaan aina ymmärrä sitä oikein eivätkä usein ymmärrä kontekstia, mikä johtaa sopimattomiin tai yksinkertaisesti vääriin vastauksiin.
- Puolueellisuus: Kaikki koulutustiedoissa esiintyvät poikkeamat voivat usein esiintyä vastauksissa. Tämä sisältää ennakkoluuloja sukupuoleen, rotuun, maantieteeseen ja kulttuuriin.
- Maalaisjärki: Maalaisjärkeä on vaikea mitata, mutta ihmiset oppivat tämän jo pienestä pitäen yksinkertaisesti tarkkailemalla ympärillään olevaa maailmaa. LLM: illä ei ole tätä luontaista kokemusta, johon turvautua. He ymmärtävät vain sen, mitä heille on toimitettu harjoitustietojen kautta, eikä tämä anna heille todellista käsitystä maailmasta, jossa he ovat.
- LLM on vain niin hyvä kuin sen koulutustiedot: Tarkkuutta ei voi koskaan taata. Vanha tietokonesanonta "Garbage In, Garbage Out" tiivistää tämän rajoituksen täydellisesti. LLM: t ovat vain niin hyviä kuin heidän koulutustietojensa laatu ja määrä sallivat.
On myös väitetty, että eettisiä huolenaiheita voidaan pitää LLM: n rajoituksena, mutta tämä aihe ei kuulu tämän artikkelin soveltamisalaan.
3 Esimerkkejä suosituista LLM: istä
Tekoälyn jatkuvaa kehitystä tukevat nyt suurelta osin LLM: t. Joten vaikka ne eivät ole aivan uutta tekniikkaa, ne ovat varmasti saavuttaneet kriittisen vauhdin pisteen, ja nyt on monia malleja.
Tässä on joitain yleisimmin käytetyistä LLM: istä.
1. GPT
Generative Pre-trained Transformer (GPT) on ehkä tunnetuin LLM. GPT-3.5 tukee tämän artikkelin esimerkeissä käytettyä ChatGPT-alustaa, kun taas uusin versio, GPT-4, on saatavilla ChatGPT Plus -tilauksen kautta. Microsoft käyttää myös uusinta versiota Bing Chat -alustallaan.
2. LaMDA
Tämä on ensimmäinen LLM, jota Google Bard, Googlen AI-chatbot, käyttää. Bardin versio, joka alun perin otettiin käyttöön, kuvattiin LLM: n "kevytetyksi" versioksi. LLM: n tehokkaampi PaLM-iteraatio syrjäytti tämän.
3. BERT
BERT on lyhenne sanoista Bi-directional Encoder Representation from Transformers. Mallin kaksisuuntaiset ominaisuudet eroavat toisistaan BERT muilta LLM: iltä, kuten GPT: ltä.
Paljon enemmän LLM: itä on kehitetty, ja jälkeläiset ovat yleisiä suurista LLM: istä. Niiden kehittyessä niiden monimutkaisuus, tarkkuus ja merkityksellisyys kasvavat edelleen. Mutta mitä tulevaisuus tuo tullessaan LLM: ille?
LLM: ien tulevaisuus
Nämä epäilemättä muokkaavat tapaamme olla vuorovaikutuksessa teknologian kanssa tulevaisuudessa. ChatGPT: n ja Bing Chatin kaltaisten mallien nopea käyttöönotto on osoitus tästä tosiasiasta. Lyhyellä aikavälillä, Tekoäly ei todennäköisesti korvaa sinua työssä. Mutta edelleen on epävarmuutta siitä, kuinka suuri osa heillä on elämässämme tulevaisuudessa.
Eettiset argumentit voivat vielä vaikuttaa siihen, kuinka integroimme nämä työkalut yhteiskuntaan. Kuitenkin, kun tämä jätetään sivuun, joitain odotettuja LLM-kehityksiä ovat:
- Parempi tehokkuus:Satoja miljoonia parametreja sisältävien LLM: ien ansiosta ne kuluttavat uskomattoman resursseja. Laitteiston ja algoritmien parannusten myötä niistä tulee todennäköisesti energiatehokkaampia. Tämä myös nopeuttaa vasteaikoja.
- Parempi kontekstuaalinen tietoisuus:LLM: t harjoittelevat itseään; mitä enemmän käyttöä ja palautetta he saavat, sitä paremmiksi niistä tulee. Tärkeää on, että tämä on ilman suurempaa suunnittelua. Tekniikan kehittyessä kielitaito ja kontekstuaalinen tietoisuus paranevat.
- Koulutettu erityistehtäviin:Yleiset työkalut, jotka ovat LLM-yritysten julkisia kasvoja, ovat alttiita virheille. Mutta kun LLM: t kehittävät ja käyttäjät kouluttavat heitä erityistarpeisiin, niillä voi olla suuri rooli aloilla, kuten lääketiede, laki, rahoitus ja koulutus.
- Suurempi integraatio: LLM: istä voisi tulla henkilökohtaisia digitaalisia avustajia. Ajattele Siriä steroideilla, niin saat idean. LLM: istä voisi tulla virtuaalisia avustajia, jotka auttavat sinua kaikessa aterioiden ehdottamisesta kirjeenvaihdon käsittelyyn.
Nämä ovat vain muutamia alueita, joilla LLM: istä tulee todennäköisesti suurempi osa elämäämme.
LLM: t muuttavat ja kouluttavat
LLM: t avaavat jännittävän mahdollisuuksien maailman. Chatbottien, kuten ChatGPT: n, Bing Chatin ja Google Bardin, nopea nousu on todiste resurssien käytöstä.
Tällainen resurssien lisääntyminen voi vain saada näistä työkaluista entistä tehokkaampia, monipuolisempia ja tarkempia. Tällaisten työkalujen potentiaaliset sovellukset ovat valtavat, ja tällä hetkellä olemme vain raapumassa uskomattoman uuden resurssin pintaa.