YOLO-NAS on YOLO-sarjan esineentunnistusmallien huippu. Mutta miksi sitä pidetään parhaana?
YOLOv8:n jälkeen on vielä uusi ja parempi huippuluokan objektintunnistusmalli, YOLO-NAS. Se on Deci AI: n kehittämä objektintunnistusalgoritmi, joka korjaa aiempien YOLO-mallien (You Only Look Once) rajoitukset.
Malli on rakennettu AutoNAC: sta, Neural Architecture Search Enginestä. Se ylittää SOTA-mallien nopeuden ja suorituskyvyn, mikä on suuri harppaus kohteen havaitsemisessa parantamalla tarkkuus-latenssia ja kvantisointituen kompromisseja.
Tässä artikkelissa käsitellään YOLO-NAS: n vahvuuksia ja ominaisuuksia ja tutkitaan, miksi se on YOLO-sarjan paras objektintunnistusmalli.
YOLO-NASin toiminnan ymmärtäminen
Decin AutoNAC (Automated Neural Architecture Construction) luo YOLO-NASin arkkitehtuurin. AutoNAC on saumaton prosessi, joka parantaa olemassa olevien syvien hermoverkkojen suorituskykyä.
AutoNAC-liukuhihna käyttää käyttäjän kouluttamaa syvähermoverkkoa syötteenä, tietojoukona ja pääsynä päättelyjärjestelmään. Käyttäjän kouluttama syvä neuroverkko suunnitellaan sitten uudelleen putkilinjan avulla. Tällöin saavutetaan optimoitu arkkitehtuuri pienemmällä viiveellä tarkkuudesta tinkimättä.
YOLO-NAS käyttää RepVGG: tä. RepVGG mahdollistaa sen harjoituksen jälkeisen optimoinnin uudelleenparametrisoinnilla tai harjoituksen jälkeisellä kvantisoinnilla. Se on eräänlainen hermoverkkoarkkitehtuuri, joka perustuu VGG: hen. Se käyttää regularisointitekniikoita, jotka on suunniteltu parantamaan syväoppimismallien yleistyskykyä.
Arkkitehtuurin suunnittelu on tehokkaampi nopeuden ja muistin suhteen. RepVGG käy koulutusta käyttämällä monihaaraista arkkitehtuuria nopeamman päättelyn saavuttamiseksi. Se muunnetaan sitten yhdeksi haaraksi uudelleenparametrisoinnin avulla.
Tämä ominaisuus tekee YOLO-NASista erittäin hyödyllisen tuotantokäyttöön. Tämä johtuu siitä, että mallia on mahdollista harjoitella ja optimoida täysin tarkasti päättelynopeuden ja muistin käytön kannalta.
YOLO-NAS: n tärkeimmät ominaisuudet
YOLO-NASin tärkeimmät ominaisuudet ovat seuraavat:
- Kvantisointitietoinen koulutus: Malli käyttää QSP: tä ja QCI: tä (kvantisoinnin huomioivia moduuleja) tarkkuushäviön vähentämiseen harjoituksen jälkeisen kvantisoinnin aikana yhdistämällä 8-bittisen kvantisoinnin uudelleenparametrisoinnin.
- Automaattinen arkkitehtuurisuunnittelu: AutoNAC, Decin oma NAS-tekniikka etsii optimaalista malliarkkitehtuuria, joka yhdistää YOLO-mallien perusarkkitehtuurit optimoidun mallin aikaansaamiseksi.
- Hybridikvantisointitekniikka: Vakiokvantisointimenetelmä vaikuttaa koko malliin. Sitä vastoin hybridikvantisointitekniikka kvantisoi osan mallista tasapainottaakseen mallin latenssia ja tarkkuutta.
- Käytä ainutlaatuisia lähestymistapoja mallin valmistelemiseksi harjoittelua varten käyttämällä automaattisesti merkittyjä tietoja. Malli sitten oppii ennusteistaan ja käyttää suuria tietomääriä.
Vertaileva analyysi: YOLO-NAS vs. muut YOLO-mallit
Alla on vertailu eri YOLO-sarjan mallien välillä.
YOLO-NAS on parempi kuin olemassa olevat objektintunnistusmallit, mutta siinä on haittoja. Tässä on luettelo YOLO-NAS: n eduista ja haitoista:
Plussat
- Se on avoimen lähdekoodin.
- Se on 10-20 % nopeampi kuin aiemmat YOLO-mallit.
- Se on tarkempi verrattuna olemassa oleviin YOLO-malleihin.
- Se käyttää parempaa arkkitehtuuria, AutoNAC. Tämä asettaa uuden ennätyksen objektien havaitsemisessa, mikä tarjoaa parhaan tarkkuuden ja viiveen kompromissitehokkuuden.
- Saumaton tuki päättelymoottoreille, kuten NVIDIA. Tämä ominaisuus tekee siitä tuotantovalmis mallin.
- Sillä on parempi muistitehokkuus ja suuremmat päättelynopeudet.
Haittoja
- Se ei ole vielä vakaa, koska tekniikka on vielä uutta eikä sitä ole käytetty villisti tuotannossa.
YOLO-NAS: n käyttöönotto
Tulet käyttämään Google Colab kirjoittaa ja ajaa koodeja tässä toteutuksessa. Vaihtoehto Google Colabille olisi luoda virtuaalinen ympäristö ja käytä IDE: tä paikallisella koneellasi.
Malli on erittäin resurssiintensiivinen. Varmista, että sinulla on vähintään 8 Gt RAM-muistia, ennen kuin käytät sitä koneellasi. Mitä suurempi videon koko, sitä enemmän muistia se käyttää.
Riippuvuuksien asentaminen
Asenna YOLO-NAS-riippuvuus, supergradientteja käyttämällä alla olevaa komentoa:
pip install super-gradients==3.1.2
Onnistuneen asennuksen jälkeen voit nyt kouluttaa YOLO-NAS-mallia.
Mallin koulutus
Kouluttaa mallia suorittamalla alla oleva koodilohko:
alkaen super_gradients.training tuonti mallit
yolo_nas_l = mallit.get("yolo_nas_l", pretraained_weights="kookos")
Olet tuomassa harjoitusmallia asennetusta SuperGradients-kirjastosta tässä koodissa. Käytät sitten esiopetettuja mallipainoja COCO-tietojoukosta.
Mallin päättely
Mallipäätelmillä on potentiaalisia sovelluksia kuvan havaitsemiseen, luokitteluun ja segmentointitehtäviin.
Tässä tapauksessa keskityt siihen kohteen tunnistustehtävä videoille ja kuville. Voit havaita kuvassa olevan kohteen suorittamalla alla olevan koodilohkon:
url = "img_path"
yolo_nas_l.predict (url, conf=0.25).näytä()
Varmista, että käytät kuvaasi oikeaa polkua. Lataa tässä tapauksessa kuva Google Colab -ympäristöön ja kopioi kuvan polku.
Odotettu tulos:
Tunnista videossa olevat esineet suorittamalla alla oleva koodilohko:
tuonti taskulamppu
input_video_path = "polku_videoon"
output_video_path = "detected.mp4"
laite = 'cuda'jos torch.cuda.is_available() muu"prosessori"
yolo_nas_l.to (device).predict (tulovideon_polku).tallenna (output_video_path)
Kuten kuvatiedot, lataa video, jonka objektit tunnistetaan, Google Colab -ympäristöön ja kopioi polku videomuuttujaan. Ennustettu video on käytettävissä Google Colab -ympäristössä nimellä havaittu.mp4. Lataa video paikalliselle koneellesi ennen istunnon lopettamista.
Odotettu tulos:
YOLO-NAS tukee myös mallien hienosäätöä ja mukautetun datan harjoittelua. Dokumentaatio on saatavilla osoitteessa Decin hienosäädettävä aloitusmuistikirja.
YOLO-NASin reaalimaailman sovellukset
YOLO-NASin lähdekoodi on saatavilla Apache License 2.0 -lisenssillä, joka on käytettävissä ei-kaupalliseen käyttöön. Kaupallista käyttöä varten mallille on tehtävä uudelleenkoulutus alusta alkaen mukautettujen painojen saamiseksi.
Se on monipuolinen malli, jonka käyttö on mahdollista useilla aloilla, kuten:
Autonomiset ajoneuvot ja robotit
YOLO-NAS voi parantaa autonomisten ajoneuvojen havaintokykyä, jolloin ne voivat havaita ja seurata kohteita nopeammin ja tarkemmin reaaliajassa. Tämä kyky auttaa varmistamaan liikenneturvallisuuden ja sujuvan ajokokemuksen.
Valvonta- ja turvajärjestelmät
Malli voi tarjota nopean, tarkan ja reaaliaikaisen kohteiden havaitsemisen valvontaa ja turvallisuutta varten järjestelmät, jotka auttavat tunnistamaan mahdolliset uhat tai epäilyttävät toimet, mikä parantaa turvallisuutta järjestelmät
Vähittäiskaupan ja varastonhallinta
Malli voi tarjota nopeat ja tarkat objektien tunnistusominaisuudet, jotka mahdollistavat tehokkaan ja reaaliaikaisen automaattisen varastohallinnan, varaston seurannan ja hyllyn optimoinnin. Tämä malli auttaa vähentämään käyttökustannuksia ja lisäämään voittoja.
Terveydenhuolto ja lääketieteellinen kuvantaminen
Terveydenhuollossa YOLO-NAS pystyy auttamaan sairauden poikkeavuuksien tai erityisten kiinnostavien alueiden tehokkaassa havaitsemisessa ja analysoinnissa. Malli voi auttaa lääkäreitä diagnosoimaan sairauksia tarkasti ja seuraamaan potilaita, mikä parantaa terveydenhuoltosektoria.
YOLO-NAS Takeaway
YOLO-NAS on uusi objektintunnistusmalli, joka on uraauurtava uudella tavalla kohteen havaitsemisessa. Se on parempi kuin SOTA-mallit. Sen suorituskyky esineiden havaitsemisessa on suuri harppaus tietokonenäköprojekteille.