ChatGPT: n tekijöillä on toinen työkalu, jonka tarkoituksena on ottaa kuormitus pois sormistasi.

Samat ihmiset ChatGPT: n takana ovat luoneet toisen tekoälypohjaisen työkalun, jota voit käyttää tänään tuottavuuden parantamiseen. Viittaan Whisperiin, puhetekstiksi -ratkaisuun, joka peitti kaikki sitä edeltäneet vastaavat ratkaisut.

Voit käyttää Whisperiä ohjelmissasi tai komentorivillä. Ja silti se päihittää sen tarkoituksen: kirjoittamisen ilman näppäimistöä. Jos sinun on kirjoitettava käyttääksesi sitä, miksi käyttää sitä välttääksesi kirjoittamista? Onneksi voit nyt käyttää Whisperiä työpöydän graafisen käyttöliittymän kautta. Vielä parempi, se voi myös litteroida äänesi lähes reaaliajassa. Katsotaanpa, kuinka voit kirjoittaa äänelläsi Whisper Desktopilla.

Mikä on OpenAI: n Whisper?

OpenAI: n Whisper on automaattinen puheentunnistusjärjestelmä (lyhyesti ASR) tai yksinkertaisesti sanottuna ratkaisu puhutun kielen muuntamiseen tekstiksi.

Toisin kuin vanhemmat sanelu- ja transkriptiojärjestelmät, Whisper on tekoälyratkaisu, joka on koulutettu yli 680 000 puhetuntiin eri kielillä. Whisper tarjoaa vertaansa vailla olevan tarkkuuden, ja varsin vaikuttavasti se ei ole vain monikielinen, vaan se voi myös kääntää kielten välillä.

instagram viewer

Vielä tärkeämpää on, että se on ilmainen ja saatavana avoimena lähdekoodina. Tämän ansiosta monet kehittäjät ovat yhdistäneet sen koodin omiin projekteihinsa tai luoneet siihen perustuvia sovelluksia, kuten Whisper Desktopin.

Jos haluat Whisperin "vanilja"-version ja päätteen monipuolisuuden kömpeleiden graafisten käyttöliittymien sijaan, tutustu artikkeliimme miten muutat äänesi tekstiksi OpenAI: n Whisper for Windows -sovelluksella.

Ovatko Whisper ja Whisper Desktop samat?

Viralliselta kuulostavasta nimestään huolimatta Whisper Desktop on kolmannen osapuolen Whisperin käyttöliittymä, joka on tehty kaikille, jotka haluavat mieluummin napsauttaa painikkeita komentojen kirjoittamisen sijaan.

Whisper Desktop on erillinen ratkaisu, joka ei ole riippuvainen olemassa olevasta Whisper-asennuksesta. Bonuksena se käyttää vaihtoehtoista, optimoitua Whisper-versiota, joten sen pitäisi toimia paremmin kuin erillisversio.

Olet spektrin toisessa päässä, ja sen sijaan, että etsisit päätelaitetta helpompaa tapaa käyttää Whisperiä, etsit tapoja toteuttaa se omissa ratkaisuissasi? Iloitse, sillä OpenAI on avannut pääsyn ChatGPT- ja Whisper-sovellusliittymiin.

Lataa ja asenna Whisper Desktop

Vaikka Whisper Desktopia on helpompi käyttää kuin erillinen Whisper, sen asennus on mutkikkaampaa kuin ohjatun toiminnon toistuva napsauttaminen Seuraava.

  1. Vierailla Whisper Desktopin virallinen Github-sivu. Katso oikealta ja napsauta alta viimeisintä versiota Julkaisut.
  2. Alla Omaisuus, klikkaus WhisperDesktop.zip ja lataa se tietokoneellesi.
  3. Pura ladattu arkisto kansioon ja vieraile siinä tiedostonhallinnan avulla. Sisältä löydät Whisper Desktop -sovelluksen. Suorita se kaksoisnapsauttamalla sitä.
  4. Tarvitset myös Whisper-kielimallin GCML binäärimuoto. Whisper Desktop tarjoaa kaksi linkkiä yhden hankkimista varten. Ohita toinen linkki oman mallin luomiseksi, koska se on monimutkaisempi prosessi. Klikkaa Halaavat kasvot avataksesi sivun oletusselaimessasi, josta voit ladata käyttövalmiin tiedoston.
  5. Whisper Desktopin versio, jota käytimme tätä artikkelia kirjoittaessamme, tarjosi linkin Hugging Facen vanhentuneeseen arkistoon. Jos kohtaat saman ongelman, huomaa linkin a uusi sijainti. Napsauta sitä päästäksesi uuteen arkistoon.
  6. Napsauta linkkiä, joka vie sinut saatavilla olevaan mallit.
  7. Napsauta luettelosta jompaakumpaa ggml-medium.bin tai ggml-medium.en.bin, riippuen siitä, haluatko Whisperin monikielisen vai vain englanninkielisen tuen.
  8. Lopulta sinun olisi pitänyt saavuttaa määränpääsi. Huomaa rivi, joka kertoo, että tämä tiedosto on tallennettu Git LFS: ään ja että se on liian suuri näytettäväksi, mutta voit silti ladata sen. Klikkaa ladata tehdä juuri niin.
  9. Kun tiedosto on ladattu, siirrä ladattu kielimallitiedosto samaan kansioon Whisper Desktopin kanssa suosikkitiedostonhallinnan avulla (File Explorer tekee sen).

Litterointi Whisper Desktopilla

Litterointi Whisper Desktopilla on helppoa, mutta saatat silti tarvita yhden tai kaksi napsautusta käyttääksesi sovellusta.

Suorita Whisper Desktop uudelleen. Puuttuuko (vielä) oikea polku ladattavaan kielimalliisi? Klikkaa painiketta kolmella pisteellä kentän oikealla puolella ja valitse manuaalisesti Hugging Facesta lataamasi tiedosto.

Tästä paikasta voit myös käyttää vieressä olevaa avattavaa valikkoa Mallin toteutus valitaksesi, haluatko käyttää Whisperiä GPU: ssa (GPU), sekä CPU: ssa että GPU: ssa (Hybridi) tai vain suorittimessa (Viite).

The Pitkälle kehittynyt -painike johtaa lisävaihtoehtoihin, jotka vaikuttavat Whisperin toimintaan laitteistossasi. Koska painike kuitenkin ilmoittaa selvästi, että ne ovat edistyneitä, suosittelemme, että säädät niitä vain, jos olet vianetsintää tai tiedät mitä olet tekemässä. Väärien asetusarvojen asettaminen tähän voi aiheuttaa suoritusrangaistuksen tai tehdä sovelluksesta käyttökelvottoman.

Napsauta OK siirtyäksesi sovelluksen pääkäyttöliittymään.

Jos sinulla on jo äänitallenne, jonka haluat muuttaa kirjoitetuksi tekstiksi, napsauta Literoi tiedosto ja valitse se. Käytämme kuitenkin Whisper Desktopia tämän artikkelin reaaliaikaiseen transkriptioon.

Tarjotut vaihtoehdot ovat yksinkertaisia. Voit valita Kieli Kuiskaus käyttää, valitse, jos haluat Kääntää kielten välillä ja ota sovellus käyttöön Debug-konsoli.

Useimmat englanninkieliset käyttäjät voivat turvallisesti ohittaa nämä vaihtoehdot ja varmistaa vain, että oikea äänitulo valitaan alasvetovalikosta Sieppauslaite.

Varmista Tallenna tekstitiedostoon ja Liitä tiedostoon Whisper Desktop tallentaa tulostensa tiedostoon ilman, että sen sisältöä korvataan. Käytä painiketta kolmella pisteellä tiedoston polkukentän oikealla puolella määrittääksesi mainitun tekstitiedoston.

Klikkaa Kaapata aloittaaksesi puheesi litteroinnin tekstiksi.

Whisper Desktop näyttää kolme ilmaisinta, jotka osoittavat, milloin se havaitsee puhetoiminnan, milloin se kopioi aktiivisesti ja milloin prosessi on pysähtynyt.

Voit jatkaa puhumista niin kauan kuin haluat, ja sinun pitäisi toisinaan nähdä kaksi ensimmäistä merkkivaloa vilkkuvan, kun sovellus muuttaa äänesi tekstiksi. Klikkaus Lopettaa kun valmis.

Valitsemasi tekstitiedoston pitäisi avautua oletustekstieditorissasi, ja se sisältää kirjallisessa muodossa kaiken, mitä sanoit, kunnes napsautit Lopettaa.

Huomaa, että voit myös tehdä päinvastoin kuin näimme täällä: muuntaa minkä tahansa tekstin puheeksi. Tällä tavalla voit kuunnella mitä tahansa podcastina sen sijaan, että väsyisit ruutuja siristellessäsi. Lisätietoja aiheesta saat artikkelistamme joitakin parhaista ilmaisista online-työkaluista tekstistä puheeksi lataamiseen MP3-äänenä.

Whisper Desktop -äänikirjoitusvinkkejä

Vaikka Whisper Desktop voi olla hengenpelastaja, jonka avulla voit kirjoittaa äänelläsi paljon nopeammin kuin kirjoittaisit, se on kaukana täydellisestä.

Testauksen aikana havaitsimme, että se saattaa ajoittain änkyttää, ohittaa joitain sanoja tai epäonnistua litteroinnissa ennen kuin pysäytä ja käynnistä prosessi manuaalisesti tai juutu silmukaan ja jatka saman lauseen uudelleenkirjoittamista toistuvasti.

Uskomme, että nämä ovat väliaikaisia ​​​​häiriöitä, jotka korjataan, koska erillisessä Whisperissa ei ole samoja ongelmia.

Pieniä virheitä lukuun ottamatta äänen muuttamisen tekstiksi pitäisi olla vaivatonta Whisper Desktopilla. Testimme aikana kuitenkin huomasimme, että se voi toimia vieläkin paremmin, jos...

  1. Sen sijaan, että lausuisi vain kaksi tai kolme sanaa ja sitten pysähtyisi, Whisper voi ymmärtää sinua paremmin, jos jatkat pidempään. Yritä kirjoittaa sille ainakin koko lause kerrallaan.
  2. Samasta syystä vältä transkriptioprosessin toistuvaa käynnistämistä ja pysäyttämistä.
  3. Aina kun huomaat tehneesi virheen, jätä se huomiotta ja jatka eteenpäin. Kielimallin lataaminen ja purkaminen näyttää olevan prosessin aikaa vievin osa Whisperin nykytilan ja käytettävissä olevan laitteistomme kanssa. Joten on nopeampaa jatkaa puhumista ja korjata virheitäsi myöhemmin.
  4. Kuten Whisperin erillisversiossa, on parasta käyttää käytettävissä olevan laitteiston optimaalista kielimallia. Voit käyttää enintään keskikokoinen mallia, jos grafiikkasuorittimessasi on 8 Gt VRAM-muistia. Jos haluat vähemmän VRAM-muistia, valitse pienempiä malleja. Valitse vain hieman tarkempi, mutta myös paljon vaativampi suuri mallia, jos käytät GPU: ta, jossa on vähintään 16 Gt VRAM-muistia.
  5. Muista, että mitä suurempi kielimalli, sitä hitaampi transkriptioprosessi. Älä valitse tarvittavaa suurempaa mallia. Luultavasti huomaat, että Whisper Desktop "ymmärtää sinua" suurimman osan ajasta keskikokoisissa tai pienemmissä malleissa, vain yksi tai kaksi virhettä kappaletta kohden.

Kirjoitatko vielä? Käytä ääntäsi kuiskauksen kanssa

Huolimatta siitä, että käyttöönotto vaatii jonkin aikaa, kuten huomaat kokeilemalla, Whisper Desktop toimii paljon paremmin kuin useimmat vaihtoehdot, paljon suuremmalla tarkkuudella ja paremmalla nopeudella.

Kun alat käyttää sitä kirjoittamiseen äänelläsi, näppäimistösi saattaa näyttää muinaisjäännökseltä kauan menneiltä ajoilta.