Olet todennäköisesti nähnyt sovelluksia, jotka väittävät kääntävän kissasi sanan. Mutta voivatko he todella kääntää kissasi miau englanniksi? Lyhyt vastaus on kyllä, tavallaan. Se on vaikeaa, koska kunkin kissan "kieli" on ainutlaatuinen, mutta nykyaikaisella tekniikalla he pääsevät melko lähelle.
Kissan kääntösovellukset, kuten MeowTalk, käyttävät puheentunnistuksen muotoa, joka korostaa koneoppimista. Katsotaanpa tarkemmin.
Puheentunnistus ja koneoppiminen
Puheentunnistus toimii nauhoittamalla puhetta ja muuttamalla äänen digitaaliseksi tiedostoksi. Se koodaa tietoja, kuten sävelkorkeuden ja äänenvoimakkuuden, datapisteinä, joita sovellus voi analysoida ja sovittaa merkityksiin. DPA-mikrofonit selittää, että nämä datapisteet voivat näyttää hyvin erilaisilta taustan äänistä ja siitä, miten sana puhutaan.
Joskus pidämme äänentunnistusta itsestäänselvyytenä, mutta se on uskomaton tekniikan ominaisuus. Varsinkin kun otetaan huomioon, kuinka monimutkainen ihmisen puhe on. Kuten
Tiedemies selittää, jokaiseen sanaan liittyy laaja valikoima ääniä tai "foneemeja" sekoitettuna toisiinsa. Tietokoneen saaminen puheen ymmärtämiseksi on erittäin vaikeaa. Kissaäänten uusi raja on vielä vaikeampaa.Puheentunnistusta käyttäville sovelluksille on ohjelmoitu sanasto "sanasto", jota kutsutaan tietojoukoksi. Sitten sovellus sovittaa puheesi lähimpään vaihtoehtoon sen sanastossa.
Kun se tekee virheen, korjaat sen ja se tallentaa nämä tiedot seuraavaa kertaa varten. Tämä on osa koneoppimista. Näin ohjelma oppii tunnistamaan puheen myös silloin, kun se ei ole identtinen aloitusaineiston kanssa.
Liittyvät: Mitä ovat koneoppimisalgoritmit? Näin he työskentelevät
Äänentunnistuksessa on edelleen ongelmia, erityisesti puheesteiden ja aksenttien kanssa. Jotkut yritykset ovat koneoppimisen parantaminen näiden ongelmien ratkaisemiseksi, vaikka. Ajan myötä koneoppiminen voi muuttaa puheentunnistuksen tehokkaaksi työkaluksi.
Näin puheentunnistus toimii ihmisille. Mutta toimiiko se kissoilla?
Puheentunnistus vs. Miau tunnustaminen
Ensinnäkin meidän on ymmärrettävä, miksi tietynlaisen meowin kääntäminen "olen nälkäinen" eroaa ihmisen puheen analysoinnista. Ongelmana on enimmäkseen se, että kissan viestintä nojaa voimakkaammin sanattomiin vihjeisiin, kuten ryhti. Toinen ongelma on universaalin "kissakielen" puuttuminen.
Mukaan ASPCA, aikuiset villikissat eivät koskaan leuka toisiaan, vain ihmisiä. Muu tutkimus Humane Society lisää, että nuo äänet "eivät esiinny tyhjiössä". Meidän on tulkittava ne kehon kielen ja muiden asiayhteyksien rinnalla. Monissa tapauksissa nämä hiljaiset signaalit ovat ainoa ero meow, joka tarkoittaa "olen nälkäinen", ja sen välillä, joka tarkoittaa "haluan pelata".
Lisäten tähän ongelmaan, kahdella kissalla ei ole samaa kieltä. Kissat kehittävät omistajilleen räätälöityjä "kieliä". Nämä perustuvat osittain omistajan äänen jäljittelyyn ja osittain kissan persoonallisuuteen. Kaksi kissaa ei kuulosta samalla tavalla, vaikka välitettäisiin sama halu tai tarve. Joten miten yhden sovelluksen puhesanasto voidaan kääntää kaikille?
Joustava koneoppiminen kissoille
Vaikka muutama virtuaalinen avustaja haluaa Oto yrittää ymmärtää sävyä ja tunteita, puheentunnistus on edelleen kauhea sanattomissa signaaleissa. Mutta se ei tarkoita sitä, että niitä on mahdotonta tulkita.
MeowTalk käyttää joustavampaa koneoppimista näiden ongelmien ratkaisemiseksi.
Ladata: MeowTalk varten Android | iOS (Vapaa)
Meowtalkin loi Javier Sanchez, joka työskenteli myös Alexa-tiimissä. Hän kuvitteli sovelluksen askeleeksi kohti älykkäitä kauluksia. Nämä kaulukset kääntäisivät kissan äänet ihmisen puheeksi hyödyntäen monimutkaisia koneoppimisstrategioita auttaakseen ihmisiä ymmärtämään paremmin kissojaan ja hoitamaan niitä.
MeowTalk-tiimi kompensoi ainutlaatuisuusongelmat luomalla tarkempia profiileja kullekin kissalle. Sovelluksessa rekisteröit jokaisen kissan erikseen. Tiede Norja raportoi, että pennut leikkaavat eri tavalla kuin aikuiset kissat, joten sovellus pyytää myös kissan syntymäpäivää. Jokainen profiili luo kissalle ainutlaatuisen tietoverkon, joka sisällyttää vähän syvällistä oppimista koneoppimiseen.
Liittyvät: Syvä oppiminen vs. Koneoppiminen vs. AI: Kuinka he menevät yhdessä?
Sanaston osalta MeowTalk alkaa 10 ääniprofiililla tietojoukossaan. Jokaisella on erilainen merkitys, kuten "onnellinen" tai "metsästys". Kun sovellus kuulee äänen ja saa sen väärin, voit joko korjata sen tai luoda uuden tulkinnan.
Korjaus kehottaa sovellusta korvaamaan perussanaston uudella äänellä.
Voit esimerkiksi kertoa sovelluksen vastaamaan "Metsästys" lyhyisiin sirpoihin pitkän yowlin sijaan. Tällainen korjaus on hyödyllisempi kuin lisätä useita ääniä vastaamaan yhtä tarkoitusta puheentunnistuksen tapaan, mikä olisi kuin kertoa sovellukselle, että pitkä yowl ja lyhyt sirinä molemmat tarkoittaa "Äiti kutsu".
Koneoppiminen puheentunnistussovelluksissa vastustaa yleensä tämän tyyppistä korvaamista. Olisi kuin yrität opettaa Sirille, että kun sanot "teknologiablogi", tarkoitat todella "päärynä". Mutta MeowTalkin käyttämä koneoppimisen joustavampi muoto voi käsitellä tätä korjausta enemmän helposti.
Uuden tulkinnan luominen lisää merkityksen, jota ei aiemmin ole koodattu. Esimerkiksi, jos kissallasi on erityinen puhelu, kun hän haluaa lempileluaan, voit lisätä vaihtoehdon "Haluan hiireni". Se on samanlainen kuin sanan lisääminen automaattisen korjauksen sanakirjaan.
Liittyvät: Kuinka määritellä omat automaattisen korjauksen sanat Androidissa
Ajan myötä voit kehittää erittäin henkilökohtaisen puheprofiilin kissallesi. Loppujen lopuksi se voi olla jopa riittävän hienostunut, jotta siitä olisi hyötyä lemmikkieläinten hoitajille tai käyttäytymiskysymysten ratkaisemiseksi. Ellei mitään muuta, se auttaa kissan omistajia tulemaan tarkkaavaisemmiksi lemmikkeihinsä.
Tuomio: toimivatko kissan kääntösovellukset?
Loppujen lopuksi "kissan käännös" luottaa edelleen paljon siihen, että käyttäjä opettaa sovellukselle, miten heidän kissansa puhuu. Näin on todennäköisesti aina, koska kunkin kissan viestintä on ainutlaatuista.
Mutta se, että koneoppiminen on tullut niin pitkälle, että kehittäjät voivat jopa osittain onnistua tässä, on uskomatonta. Koneoppiminen ja tekoäly etenevät hämmästyttävällä nopeudella, emmekä voi odottaa, mihin he menevät seuraavaksi.
- Teknologia selitetty
- Kielten oppiminen
- Koneoppiminen

Natalie Stewart on MakeUseOfin kirjoittaja. Ensin hän kiinnostui tekniikasta yliopistossa ja kehitti intohimonsa median kirjoittamiseen yliopistossa. Natalie keskittyy tekniikkaan, joka on helposti saatavilla ja helppokäyttöinen, ja hän rakastaa sovelluksia ja laitteita, jotka tekevät jokapäiväisten ihmisten elämästä yksinkertaisempaa.
Tilaa uutiskirjeemme
Liity uutiskirjeeseemme, jossa on teknisiä vinkkejä, arvosteluja, ilmaisia e-kirjoja ja erikoistarjouksia!
Vielä yksi askel !!!
Vahvista sähköpostiosoitteesi juuri lähettämässäsi sähköpostiviestissä.