Masinnägemine ja selle rakendamine kaasaegses maailmas

From ICO wiki

Masinnägemine - on teaduslik suund tehisintellekti, eelkõige robootika ja sellega seotud tehnoloogiate valdkonnas reaalse maailma objektide kujutiste saamiseks, nende töötlemiseks ja saadud andmete kasutamiseks mitmesuguste rakenduslike probleemide lahendamiseks. [1]

Masinnägemine. [2]


Sissejuhatus

Masinnägemine on arvutinägemise rakendamine tööstuses ja tootmises. Kui arvutinägemine on levinud tehnikate kogum, mis võimaldab arvutitel näha, siis masinnägemise jaoks huvipakkuvaks valdkonnaks on digitaalsed sisend-/väljundseadmed ja arvutivõrgud, mis on loodud tootmisseadmete, näiteks robotmanipulaatorite või otsimismasinate juhtimiseks. Masinnägemine on inseneriteaduse alajaotus, mis on seotud andmetöötluse, optika, masinaehituse ja tööstusautomaatikaga. Üks levinumaid masinnägemisrakendusi on tööstustoodete, nagu pooljuhtkiibid, autod, toit ja ravimid, kontrollimine. Varem koosteliinidel töötasid inimesed, kes uurisid toodete osi, tehes järeldusi töötluse kvaliteedi kohta. Nüüd aga masinnägemissüsteemid saavad seda teha, ning kasutavad selleks digitaalseid ja nutikaameraid koos tarkvaraga.

Masinnägemise arengu ajalugu ja see, mis meil praegu on

1950. aastatel oli teadusmaailmas palju vaidlusi tehisintellektiga masina tegemise võimalikkusest. Masina ülesanneteks sai ümbritseva maailma tajumine ja otsuste tegemine nähtud informatsiooni põhjal. Esimest sammu tegi Massachusettsi Tehnoloogiainstituudi (MIT) professor Oliver Selfridge, kes 1955. aastal avaldas artikli "Mustrituvastus ja kaasaegsed arvutid". See esitas idee varustada arvutid video- ja helisüsteemidega, ning tõi kaasa masinnägemise suuna tekkimise. [3]


Uue suuna ülesanneks oli seletada masinatele kolmemõõtmelise maailma kahemõõtmelise projektsiooni abil. See tähendas, et objekti kohta täieliku teabe saamiseks on vaja mitte ainult kaamerast pilti, vaid ka lisaandmeid.

Esimene masinnägemise võimaldav kaamera.[4]

Lisaandmete saamiseks kasutati erinevaid meetodeid:

  • Kaamera liikumine;
  • Mitme kaameraid kasutavad süsteemid;
  • Kahe kaamera kasutamine (stereopaarid);
  • Erinevad algoritmid saadud pildi töötlemiseks.


1960 aastate alguseni olid kõik varem toodud arendused pigem teoreetilised, kuna varem ei olnud tehnikat, mis võimaldas masinnägemise algoritme täielikult katsetada ja selle abil otsusi teha. Esimesed pilditöötlussüsteemid ilmusid 1960. aastatel. Enamik neist süsteemidest olid loodud fotodelt segaduse eemaldamiseks. Ilmusid esimesed uuringud trükitähtede äratundmise alal.


70-ndatel MIT-i magistrant Lawrence Robberts pakkus välja, et masin võiks kahemõõtmelistest kujutistest ehitada objektidest kolmemõõtmelisi kujutisi. 1979. aastal ilmus lava dünaamilise analüüsi teooria. See võimaldas ära tunda liikuvaid objekte, ning põhines Hamburgi ülikooli professori Hans Hellmut Nageli masinnägemise valdkonna töödel. [5]


90-ndate algus on modulaarse paradigma tekkimise aeg. Neuroteadlane David Courtney Marr uuris inimese nägemist ja tuvastas neli andmetöötlusetappi:

  • Piltide teisendamine;
  • Segmenteerimine;
  • Geomeetrilise struktuuri valik;
  • Suhtelise struktuuri ja semantika määramine.


Ta määratles ka kolm andmetöötluse taset:

  • Madal tase. See filtreerib müra.
  • Keskmine tase. Sellel tasemel toimub segmenteerimine.
  • Kõrge tase. Sellel tasemel on konkreetsed objektid seotud maailmapildiga. [6]


Hetkel on masinnägemine täielikult väljakujunenud küberneetika haru. Selle valdkonna uurimisele ja arendamisele on pühendatud palju konverentse, ning sellel teemal kirjutatakse raamatuid ja artikle.

Kuidas masinnägemine töötab?

Selleks, et arvuti teatud objektid üles leiaks, tuleb seda talle õpetada. Selleks koostatakse tohutu koolitusnäidiseid. Näiteks fotod, millest osa sisaldab soovitud objekti ja teine ​​osa mitte. Järgmiseks tuleb masinõpe. Arvuti analüüsib saadud pilte ja seejärel teeb kindlaks, millised kujutiste kombinatsioonide tunnused näitavad soovitud objektide olemasolu, ja arvutab nende olulisuse. Kui see etapp on lõpetatud, saab masinnägemist kasutada.

Arvuti jaoks on pilt pikslite kogum, millest igaühel on oma heleduse või värvi väärtus. Selleks, et masin saaks pildi sisust aru, töödeldakse seda spetsiaalsete algoritmide abil. Esmalt tehakse kindlaks suured olulised kohad. Seda saab teha mitmel viisil. Näiteks liigutades mitu korda sarnast pilti Gaussi häguga, kasutades erinevaid hägususraadiusi. Seejärel võrreldakse tulemusi omavahel, et leida kõige kontrastsemad alad. Pärast oluliste kohtade leidmist kirjeldab arvuti neid numbritega. Pildi fragmendi numbrilisel kujul salvestamist nimetatakse deskriptoriks. Deskriptorite abil saab üsna täpselt võrrelda pildi fragmente, ilma fragmente kasutamata. Arvutuste kiirendamiseks jaotab arvuti deskriptorid rühmadesse, saades omamoodi klastri. Sarnased deskriptorid erinevatelt piltidelt kuuluvad samasse klastrisse. Pärast sellist klasterdamist muutub oluliseks ainult klastri number koos deskriptoritega. Mis on pakutavaga kõige sarnasem. Deskriptorist klastri numbrini jõudmist nimetatakse kvantiseerimiseks. Ja klastri numbrit ennast nimetatakse kvantdeskriptoriks. Kvantimine vähendab oluliselt andmete hulka, mida arvuti peab töötlema. Kvantdeskriptorite põhjal saab arvuti pilte võrrelda ja neil olevaid objekte ära tunda. Arvuti võrdleb erinevate piltide kvant deskriptorite komplekte ja teeb järelduse, kui palju neid või nende üksikud fragmendid on sarnased. Sellist võrdlust pildi järgi kasutavad ka otsingumootorid piltide leidmiseks.[7]

Masinnägemise rakendamine

Telefooni kaamera rakendamine masinnägemises (Photomath näitel)

Photomath. [8]

PhotoMath on tasuta rakendus, mis töötati välja kui tööriist matemaatiliste võrrandite lahendamiseks, mis põhineb mobiilseadme kaamera andmetuvastus tehnoloogial(OCR). Võrrandi arvutamiseks pole vaja teha mitte rohkem, kui suunata nutitelefoni kaamera ülesandele, vajadusel parandada võrrandit appi sees ja mõne hetke pärast telefoni ekraanil ilmub lahenduskäik koos vastusega. Rakendus suudab ülesandeid skaneerida nii paberilt kui ka ekraanilt. Sellel rakendusel on ka hariv osa, mis seisneb selles, et rakendus ei anna mitte ainult õiget vastust, vaid võimaldab vaadata ka kõiki matemaatilise võrrandi lahendamise etappe ja niimoodi õppida. [9]



Meelelahutus ja filmitööstus Meelelahutuse ja filmitööstuse sfääris kasutakse masiinnägemist VR/AR-sisu mahulise jäädvustamiseks, liitreaalsuse animatsiooni kasutavate külastajatega suhtlemiseks ja leidub veelgi rohkem kasutus võimalusi. Ilma masinnägemise kaamerateta VR lahendused ei suuda üksteisega sünkroonida.



Tark linn Tark linn on ka üks masinnägemise arendamise harudest, nimelt sellise idee ellu viimine on seotud vajadusega tagada lähitulevikus inimeste kaasaegne elukvaliteedi uuenduslike tehnoloogiate kasutamise kaudu. Sellise linna sees olevad süsteemid tagavad linnaelu süsteemide säästliku, keskkonnasõbraliku ja ohutu kasutamist.



Nutikas valgusfoor "Nutikas valgusfoor" on dünaamiline fooride haldussüsteem, tänu millele paraneb liiklusvoogude liiklusvõime. Tihti valgusfoorides määratakse punaste ja roheliste signaalide muutus kindlaks kehtestatud ajakava järgi. Nutikas valgusfoor kasutab signaalide muutmiseks kaameraid. Tavalistes linnades kohtame sageli olukorda, kus seisame punase tule taga, samal ajal kui külgsuunas kedagi pole. Kui nutikas valgusfoor näeb, et ühes suunas liigub palju vähem autosid kui teistes, siis liikumise optimeerimiseks lülitab rohelist värvi ülekoormatud suundadel pikemalt. Just see parandab liikumise vooge ja vähendab mõju autode heitgaasidest keskkonnale. [10][11]



Boston Dynamics Spot, robot koer. [12]

Robotite ehitus (Boston Dynamics robot koera näitel) 2020. aasta mai kuus tuli välja Boston Dynamics robot koer (Spot) Singapuri tänavatele, et jälgida sotsiaalset distantseerumist COVID-19 ajal. Spot suudab trepist üles ronida ja konarlikul maastikul liikuda, kuid on siiski piisavalt väike siseruumides kasutamiseks. Spot suudab saavutada kiirust kuni 5,76 km/h ja töötada autonoomselt kuni 90 minutit. Robot on varustatud stereo kaamerate süsteemiga, mis annavad sellele 360° vaate. Selline kaamerate süsteem põhineb masinnägemisel ja aitab roobotil ruumis navigeerida ja võimaldab otsusi tegema kasutades programmeeritud algoritme. [13]



Tööstus Tööstus on suur masinnägemise ülesannete generaator, ning sellel on suurim arv võimalikke rakendusi. Tänase maailma kogemus näitab tohutul hulgal lahendatud tootmis probleeme. Mõned kasutusvaldkonnad: Tootmisliinid - toidu või mineraalide sorteerimine, ning nende kvaliteedi kontroll; Infrastruktuuri objektide diagnostika ja sobivate meetmete rakendamine infrastruktuuri parendamisele; Keevitustööde kontroll ja keevitus protsessi automatiseerimine; Logistika - toodete oleku ja koguse kontroll Pildistamine ohtlikes või raskesti ligipääsetavates kohtades [14]



Sõjaväe droonid (Maven tehnoloogia näitel) 2017. aastal Google koostöös USA kaitseministeeriumiga on alustanud projekti Maven, mille raames on plaanis rakendada täiustatud arvutialgoritme objektide tuvastamiseks suurel hulgal liikuvatel või liikumatutel piltidel. Tegelikult on see sõjaväe droonide masinnägemissüsteem. Süsteemi kasutades droonidest saab tuvastada sõidukeid ja muid objekte, jälgida nende liikumist ja edastada tuvastamise tulemused kaitseministeeriumile. [15]



Autojuhti assistendid

Line Assistant

Line Assistant. [16]

See on tehnoloogia, mis kasutab WAG autodes sisseehitatud kaamerat, mis jälgib, et auto liigub oma sõidurajal. See kaamera asub sisemises tahavaatepeeglis, ning suudab juhtida auto liikumist, jälgides teemärgistust ja reguleerides auto asendit nende märgiste suhtes. Mis on hea selles süsteemis - juhul, kui juhi tähelepanu hajub ja auto teel olevatest rajamärgistest eemale viib, alustab Lane Assist parandusmeetmeid, mis lõppkokkuvõttes vähendab pikkadel sõitudel sõidurajalt välja triivimise tõenäosust. [17]

Front Light Assistant

Front Light Assist kasutatakse sõiduki kaugtulede automaatseks sisse- või väljalülitamiseks. Kui auto seisab, töötavad ainult lähituled, kuid kui auto sõidab pimedas üle 60 km/h, lülitab FLA-süsteem vastutuleva liikluse puudumisel automaatselt sisse kaugtuled. Tahavaatepeeglis olev kaamera jälgib liiklust. Tema abiga tunneb süsteem ära vastutulevad ja samas suunas sõiduki ees liikujad ning lülitub automaatselt tagasi lähituledele. [18]

Tesla Autopilot

Kõikidel uutel Tesla autodel on olemas riistvara, mida on vaja tulevikus täielikuks isejuhtimiseks peaaegu kõikides tingimustes. Süsteem on konstrueeritud nii, et see suudab sooritada lühikesi ja pikki sõite ilma, et juhiistmel istuja oleks midagi vaja teha. Tesla Motors hakkas loobuma radaaridest tema autodes. Selle asemel töötas ettevõte välja Tesla Visioni kaamerasüsteemil põhineva autopiloodi versiooni. [19]

Allikad

  1. Machine Vision : Theory, Algorithms, Practicalities - Morgan Kaufmann, 2004
  2. https://habr.com/ru/post/350918/
  3. Aleksei Šalaginov, Arvutinägemise ajalugu / Aleksei Šalaginov. - Tekst: elektrooniline // shalaginov.com: [sait]. - URL: https://shalaginov.com/2020/05/16/computer-vision-history/.
  4. https://www.timetoast.com/timelines/5798d398-efa1-481a-b0db-80c02f9231d2
  5. Pavel Bryzgalov, Masinnägemise arengu ajalugu / Bryzgalov Pavel. - Tekst: elektrooniline // robome.ru: [sait]. - URL: http://robome.ru/istorija_razvitija_tehnicheskogo_zrenija/ .
  6. Aleksei Šalaginov, Arvutinägemise ajalugu / Aleksei Šalaginov. - Tekst: elektrooniline // shalaginov.com: [sait]. - URL: https://shalaginov.com/2020/05/16/computer-vision-history/.
  7. Inishev, Kuidas arvutinägemine töötab? / Inišev. - Tekst: elektrooniline // habr.com: [sait]. - URL: https://habr.com/ru/company/droider/blog/538750/.
  8. https://www.google.com/url?sa=i&url=https%3A%2F%2Fmicroblink.com%2Fuse-cases%2Fcase-studies%2Fmath-education-powered-by-mobile-vision-photomath&psig=AOvVaw1qmveqCHSNgpCZFuLGr865&ust=1638719180924000&source=images&cd=vfe&ved=0CAsQjRxqFwoTCPjJ577ByvQCFQAAAAAdAAAAABAD
  9. Kasutaja: nokiaman, Arendaja lood: PhotoMath by MicroBlink / nokiaman :. - Tekst: elektrooniline // habr.com: [sait]. - URL: https://habr.com/ru/company/microsoftlumia/blog/248789/.
  10. drosselmayer Evolution of smart traffic lights / drosselmayer. — Tekst : elektrooniline // habr.com : [sait]. — URL: https://habr.com/ru/post/125282/
  11. Tott Smart Traffic Lights / Tott. — Tekst : elekrooniline // habr.com : [sait]. — URL: https://habr.com/ru/post/553162/ .
  12. https://www.google.com/url?sa=i&url=https%3A%2F%2Fwww.silicon.co.uk%2Fe-innovation%2Fresearch%2Frobot-spot-boston-dynamics-345787&psig=AOvVaw04BHft5kYiqPv-xms-4pwc&ust=1638719798447000&source=images&cd=vfe&ved=0CAsQjRxqFwoTCIDk5PjByvQCFQAAAAAdAAAAABAd
  13. BostonDynamics Robot-Dog / BostonDynamics. — Текст : электронный // www.bostondynamics.com : [сайт]. — URL: https://www.bostondynamics.com/ .
  14. https://nirmech.ru/ : [sait]. — URL: https://nirmech.ru/
  15. Alizar, Military drones / alizar. — Tekst : elektrooniline // habr.com : [sait]. — URL: https://habr.com/ru/post/411323/ .
  16. https://www.usedvwaudi.com/blog/2019/04/16/what-is-lane-assist--technology-and-how-does-it-work
  17. Volkswagen Lane Assist / Volkswagen. - Tekst: elektrooniline // vw.avto-city.ru: [sait]. - URL: https://vw.avto-city.ru/models/preimushchestva/obzor/elektronnyy-pomoshchnik-lane-assist/ .
  18. Mark Icons, Kõik Volkswageni autode elektrooniliste abiliste kohta / Icons Mark. - Tekst: elektrooniline // vagdrive.com: [sait]. - URL: https://vagdrive.com/threads/vse-ob-ehlektronnyx-pomoschnikax-avtomobilej-koncerna-volkswagen.1198/ .
  19. Tesla autopiloot / Tesla. - Tekst: elektrooniline // www.tesla.com: [sait]. - URL: https://www.tesla.com/autopilot .