OpenAI antaa ChatGPT: lle äänen vastata kehotteisiin ja komentoihin

OpenAI on antanut ChatGPT: lle mahdollisuuden puhua syntetisoidulla äänellä, ja se tulee pian älypuhelimeesi.

ChatGPT: stä tulee interaktiivinen luova tekoälykokemus. OpenAI paljasti, että maailman johtava AI-chatbot pystyy puhumaan ja vastaamaan käyttäjien kyselyihin käyttämällä syntetisoitua, oletettavasti tekoälyn luomaa ääntä.

Uuden äänensä ohella ChatGPT pystyy myös vastaamaan ja keskustelemaan tiettyihin kuviin, jotka on ladattu siihen tai napsautettu käytettäessä ChatGPT Android- tai iOS-sovellusta. Kuvantunnistusominaisuus kuulostaa samanlaiselta kuin Google Lensissä ja muissa sovelluksissa, jotka käyttävät hermoverkkoja tietojen tunnistamiseen tarkasti.

OpenAI antaa ChatGPT: lle äänen

25. syyskuuta 2023, ChatGPT-kehittäjä OpenAI paljastettiin se antaisi maailman johtavalle generatiiviselle AI-chatbotilleen äänen. ChatGPT-käyttäjät voivat puhua suoraan chatbotille ja pyytää sitä puhumaan takaisin, jolloin ChatGPT voi keskustella suoraan äänellä ensimmäistä kertaa.

OpenAI: n esimerkkileike sisältää naisen, joka pyytää ChatGPT: tä luomaan ainutlaatuisen iltasatun, johon ChatGPT vastaa asianmukaisesti naissyntetisoidulla äänellä.

instagram viewer

Mukaan Langallinen, uusi tekstistä puheeksi -malli kehitettiin talon sisällä. Se voi luoda "ihmisen kaltaista" ääntä tekstistä ja muutaman sekunnin näytepuheesta (käyttämällä OpenAI Whisper -mallia) ja puhua eri sävyillä ja tyyleillä. Löydät valikoiman ääninäytteitä osoitteesta OpenAI: n blogi.

Jotkut yritykset ovat jo ottaneet käyttöön OpenAI: n uuden äänimallin. Esimerkiksi Spotify käyttää OpenAI: n tekstistä puheeksi -mallia podcastien kääntämiseen eri kielille yhdistäen ChatGPT: n kielikäännöstaidon sen uuteen puhekykyyn.

ChatGPT: n uusi tekstistä puheeksi -malli on saatavilla vain Plus- ja Enterprise-tilaajille, jotka käyttävät virallista Android- ja iOS-sovellukset, ja sen odotetaan julkaistavan seuraavan kahden viikon kuluessa (alkaen 25. syyskuuta, 2023). Lisäksi uusi ääniominaisuus on rajoitettu aluksi englanniksi, vaikka odotamme tämän muuttuvan nopeasti.

ChatGPT voi tunnistaa ja analysoida kuvia ja valokuvia

OpenAI: n ChatGPT-päivityksen toinen osa on kyky analysoida ja puhua työkaluun ladattuja kuvia. Visuaalisen kuvan analysointivaihtoehto esiteltiin GPT-4-päivitysvideoissa, mutta siitä ei ole keskusteltu paljon sen jälkeen (ChatGPT-koodin tulkki sivuun).

Nyt ChatGPT saa Google Lensin kaltaisia toimintoja. Voit ladata kuvan ChatGPT: hen tai ottaa valokuvan älypuhelimesi kameralla ChatGPT-sovelluksessa, ja se tarkentaa kuvaa ja lisää tarvittaessa kontekstia.

Sen kutsuminen "samankaltaiseksi kuin Google Lens" tekee sen todellakin epäoikeudenmukaiseksi. Mahdollisuus keskustella kuvasta edestakaisin saadakseen lisää tietoa ja kontekstia tekee siitä erittäin hyödyllisen monenlaisissa asetuksissa. On kuitenkin tärkeää huomata pieni teksti, sillä OpenAI tekee selväksi, että se on rajoittanut ChatGPT: n "kykyä analysoida ja antaa suoria lausuntoja ihmisistä" yksityisyyden ja tarkkuuden vuoksi. Voisiko OpenAI-käyttöinen "Who Is This" -työkalu kuitenkin olla työn alla tulevaisuudessa? (Toivottavasti ei!)

Kuten uusi tekstistä puheeksi -malli, OpenAI ottaa kuvantunnistuksen käyttöön seuraavien kahden viikon aikana, vaikka se on saatavilla kaikille alustoille, ei vain ChatGPT-sovellukselle.

Yksityisyys, turvallisuus ja muut ongelmat

Puhekäyttöisen ChatGPT: n vaikutukset ovat jyrkät. Toki jännittävää. Mahdollisuus luoda yksilöllisesti syntetisoitu ääni käyttämällä vain lyhyttä katkelmaa esimerkkinä sisältää kuitenkin huomattavia tietosuoja- ja turvallisuusongelmia. Haitallisten toimijoiden mahdollisuudet hyödyntää näitä työkaluja ovat valtavat, ja kuten minkä tahansa generatiivisen tekoälytyökalun kanssa, kun henki on poistunut pullosta, se ei todellakaan palaa sisään. Mikään hallitusten tai ajatusjohtajien AI-sääntely ei voi kääntää virtaa takaisin.

Jopa OpenAI: n varoitus aiheesta näyttää kiertävän itsestäänselvyyksiä, vaikka ongelmat mainitaan:

Näihin ominaisuuksiin liittyy kuitenkin myös uusia riskejä, kuten haitallisten toimijoiden mahdollisuus esiintyä julkisuuden henkilöinä tai tehdä petoksia. Tästä syystä käytämme tätä tekniikkaa tietyssä käyttötapauksessa – äänikeskustelussa.

Koska tämä on jäävuoren huippu, odota vastaiskua ChatGPT: n uutta ääntä vastaan, varsinkin kerran epämiellyttävät otsikot, joissa väitetään, että ChatGPT: tä käytetään petokseen ja niin edelleen, ovat ennustettavasti lisääntyneet. päällä.

OpenAI tekee ChatGPT: stä AI-sovelluksen

Mitä enemmän OpenAI lisää käyttäjäystävällisiä ominaisuuksia ChatGPT: hen, sitä enemmän siitä tulee luova tekoälysovellus. ChatGPT on ensimmäinen, joka saavutti laajan maineen alkuperäisen generatiivisen AI-buumin aikana. vain sovellus, jota käytetään Google Bardin (ja mahdollisesti Google Geminin) ja Anthropicin kaltaisten kilpailijoiden kanssa. Claude.

Niin kauan kuin OpenAI voi jatkaa ChatGPT: n käytön helpottavien ominaisuuksien lisäämistä, se pitää ihmiset koukussa ja ajaa yhä lähemmäs tavoitettaan, todella multimodaalista tekoälytyökalua.

About Technology - denizatm.com

OpenAI antaa ChatGPT: lle äänen vastata kehotteisiin ja komentoihin

OpenAI antaa ChatGPT: lle äänen

ChatGPT voi tunnistaa ja analysoida kuvia ja valokuvia

Yksityisyys, turvallisuus ja muut ongelmat

OpenAI tekee ChatGPT: stä AI-sovelluksen

Luokat

Recent Post

Mikä on sisällöntuottajien burnout? Kuinka voittaa se

Parhaat älypuhelintarvikkeet, joita näimme IFA 2023:ssa

4 tapaa tuoda tietoja verkkosivustolta Google Sheetsiin