Kun ihminen katsoo kohtausta tai kuvaa, hän ymmärtää sen - mitä esineitä siinä on ja mitä tapahtuu, jos toimintaa tapahtuu. Tietokone puolestaan käsittelee vain digitaalista dataa, joka kuvaa kunkin pikselin väri-arvon. Ihmiselle pizzan tunnistaminen sekavalla pöydällä on vaivatonta. Mutta viime aikoihin asti tietokoneet eivät pystyisi suorittamaan samaa tehtävää.
Tietokonenäön tai CV: n avulla tietokone pystyy valitsemaan tärkeät tiedot visuaalisista syötteistä ja tekemään tarkkoja ennusteita ja suosituksia näiden tietojen perusteella.
Kuinka tietokonenäkö toimii?
Ennen tietokonenäköä henkilön on tehtävä tunteja manuaalista jalkatyötä tietyn kuvan tunnistavan ohjelman luomiseksi. Ensinnäkin vastaavien kuvien tietokanta olisi koottava.
Sitten nämä kuvat olisi analysoitava, mitattava ja merkittävä asiaankuuluvilla tiedoilla että tutkijan mielestä pystytään tunnistamaan kyseinen esine (kuten väri, mitat ja muoto). Vasta sitten ohjelmistoa voitiin käyttää ennusteiden tekemiseen.
Toisaalta tietokonenäkö automatisoi koko prosessin käyttämällä koneoppimisen lähestymistapaa, joka tunnetaan syvänä oppimisena.
Syvä oppiminen käyttää monikerroksista hermoverkkoa satojen mahdollisten kerrosten kanssa. Kuvien tapauksessa tämä on yleensä konvoluutiohermoverkko (CNN).Selittäminen yksityiskohtaisesti kuinka syvällinen oppiminen ja hermoverkot toimivat kaukana tämän artikkelin piiristä. Pohjimmiltaan suuria määriä tietoa syötetään hermoverkkoon. Neuroverkko analysoi dataa toistuvasti, kunnes se voi muodostaa tarkat ennusteet siitä.
Tietokonenäkötehtävässä käytetyn CNN: n tapauksessa hermoverkko vie tiedot useiden vaiheiden läpi. Ensinnäkin se tiivistää kuvan useiksi paloiksi (yksittäisiksi pikseleiksi tai pikseliryhmiksi, jotka on merkitty etukäteen).
Sitten se ennustaa, mikä on kuvan eri osissa (kuten kovat reunat tai tietyt esineet). Se tarkistaa näiden ennusteiden tarkkuuden toistuvasti ja muuttaa hieman algoritmin osia joka kerta, kunnes siitä tulee erittäin tarkka.
Tietokoneet ovat nyt niin tehokkaita, että ne voivat analysoida kuvaa paljon nopeammin kuin ihmisen aivot, varsinkin kun he ovat oppineet tunnistamaan tietyt mallit. Tällä tavalla on helppo nähdä, kuinka syvä oppimisalgoritmi voisi ylittää ihmisen kyvyt.
Mitkä ovat tietokonenäön tyypit?
Tietokonenäköyn kuuluu kuvien analysointi ja ymmärtäminen sekä kuvia koskevien ennusteiden tai päätösten tuottaminen. On monia tehtäviä, joita tietokonenäkö käyttää näiden tavoitteiden saavuttamiseen. Jotkut näistä ovat:
- Kuvaluokitus: Kuvan tyyppi tunnistetaan. Esimerkiksi, onko kyseessä henkilön kasvot, maisema tai esine. Tällaista tehtävää voidaan käyttää kuvien tunnistamiseen ja luokittelemiseen nopeasti. Yksi käyttö tähän on sopimattoman sisällön automaattinen tunnistaminen ja estäminen sosiaalisessa mediassa.
- Kohteen tunnistus: Kuvan luokittelun tavoin kohteen tunnistaminen voi tunnistaa tietyn kohteen kohtauksessa - kuten pizzan sekaisin pöydällä.
- Reunan tunnistus: Tietokonenäön yleinen käyttö ja yleensä ensimmäinen askel kohteen havaitsemisessa on kuvan kovien reunojen tunnistaminen.
- Kohteen tunnistaminen: Tämä on kohteen tai kuvan yksittäisten esimerkkien tunnistaminen, kuten tietyn henkilön, sormenjälkien tai ajoneuvon tunnistaminen.
- Kohteen tunnistus: Detektio on kuvan tietyn piirteen tunnistaminen, kuten murtunut luu röntgenkuvassa.
- Kohteen segmentointi: Tämä on tunniste siitä, mitkä kuvan pikselit kuuluvat kyseiseen kohteeseen.
- Kohteen seuranta: Kun video on tunnistettu, se voidaan helposti seurata koko videossa.
- Kuvan palauttaminen: Hämärtyminen, kohina ja muut kuvan artefaktit voidaan poistaa tunnistamalla tarkasti, missä kuvassa objekti tai tausta on.
Esimerkkejä tietokonenäköstä
Tekoäly on käytetään jo useilla teollisuudenaloilla jolla on huikea vaikutus, mikä pätee tietokoneen näkemiseen. Tässä on muutama esimerkki jo käytössä olevasta ansioluettelosta.
Kasvojen tunnistus
Kasvojentunnistus on yksi tärkeimmistä tavoista käyttää tietokonenäköä nykyään. Verrattuna tunnettujen kasvojen tietokantoihin tietokonenäön algoritmit voivat tunnistaa yksittäiset ihmiset hyvin tarkasti.
- Sosiaalinen media analysoi kuvat ja merkitsee käyttäjät automaattisesti, että sillä on hyvä valikoima kuvia.
- Kannettavat tietokoneet, puhelimet ja turvalaitteet voivat tunnistaa ihmiset pääsyn sallimiseksi.
- Lainvalvontaviranomaiset käyttävät kasvojentunnistusta CCTV-järjestelmissä epäiltyjen tunnistamiseksi.
Lääke
Tietokonenäköä käytetään tällä hetkellä terveydenhuollossa, jotta diagnoosit saadaan nopeammin ja tarkemmin kuin asiantuntijat pystyvät tekemään. Monissa sovelluksissa analysoidaan röntgen-, CT- tai MRI-kuvia tietyissä olosuhteissa, mukaan lukien neurologiset sairaudet, kasvaimet ja murtuneet tai murtuneet luut.
Itse ajavat autot
Autonomisten ajoneuvojen on ymmärrettävä ympäristöönsä ajaa turvallisesti. Tämä tarkoittaa teiden, kaistojen, liikennemerkkien, muiden ajoneuvojen, jalankulkijoiden ja muun tunnistamista. Kaikissa näissä tehtävissä käytetään tietokonenäköjärjestelmiä reaaliajassa, jotta vältetään törmäykset ja ajetaan turvallisesti.
Tietokonenäkö on haastava
Tietokonenäön nykyiset sovellukset ovat jo alkaneet muuttaa toimintatapojamme eri toimialoilla. Tietokonenäkö kykenee parantamaan järjestelmiä ja pelastamaan ihmishenkiä - vikojen tai rikkoutuneiden laitteiden tunnistamisesta syövän diagnosointiin.
Mutta se ei ole ilman haasteita. Tietokonenäkö on edelleen kaukana ihmisen näkemyksestä. Meillä on tuhansia vuosia evoluutio, jonka avulla voimme tunnistaa ja ymmärtää melkein kaiken ympärillämme tapahtuvan reaaliajassa. Mutta meillä ei ole aavistustakaan siitä, miten ihmisen aivot suorittavat nämä tehtävät.
Syvä oppiminen on valtava askel oikeaan suuntaan, mutta se vaatii silti hämmästyttävän paljon työtä luoda järjestelmä, joka voi suorittaa tehtävän, jonka ihmiset voivat tehdä hyvin helposti, kuten tunnistaa auto tie. Tämä johtuu siitä, että tietokoneet suorittavat rajoitettuja tehtäviä erittäin tehokkaasti. Tietokoneen kehittäminen, joka ymmärtää visuaalisen maailman monimutkaisuuden, on täysin erilainen pallopeli.
Kun yhä enemmän tutkimuksia tehdään sekä tekoälysovelluksista että ihmisen biologiasta, havaitsemme todennäköisesti räjähdyksen tietokonenäön mahdollisista käyttötarkoituksista lähitulevaisuudessa.
Koneoppimisalgoritmit on suunniteltu helpottamaan elämää ja parantamaan järjestelmiä, mutta ne voivat mennä pieleen ja aiheuttaa huonoja seurauksia.
Lue seuraava
- Teknologia selitetty
- Ohjelmointi
- Tekoäly
- Neuroverkot
Jake Harfield on freelance-kirjailija, joka työskentelee Perthissä Australiassa. Kun hän ei kirjoita, hän on yleensä pensaassa ja kuvaa paikallisia villieläimiä. Voit käydä hänen luonaan osoitteessa www.jakeharfield.com
Tilaa uutiskirjeemme
Liity uutiskirjeeseemme, jossa on teknisiä vinkkejä, arvosteluja, ilmaisia e-kirjoja ja erikoistarjouksia!
Vielä yksi askel !!!
Vahvista sähköpostiosoitteesi juuri lähettämässäsi sähköpostiviestissä.