Masinnägemine ja selle rakendamine kaasaegses maailmas

From ICO wiki
Jump to navigationJump to search

Masinnägemine - on teaduslik suund tehisintellekti, eelkõige robootika ja sellega seotud tehnoloogiate valdkonnas reaalse maailma objektide kujutiste saamiseks, nende töötlemiseks ja saadud andmete kasutamiseks mitmesuguste rakenduslike probleemide lahendamiseks.


Sissejuhatus

Сюда можно кратенько наляпать про быстрое развитие и то как машина заменила человека


Ajalugu

1950. aastatel oli teadusmaailmas palju vaidlusi tehisintellektiga masina tegemise võimalikkusest. Masina ülesanneteks sai ümbritseva maailma tajumine ja otsuste tegemine nähtud informatsiooni põhjal. Esimest sammu tegi Massachusettsi Tehnoloogiainstituudi (MIT) professor Oliver Selfridge, kes 1955. aastal avaldas artikli "Mustrituvastus ja kaasaegsed arvutid". See esitas idee varustada arvutid video- ja helisüsteemidega, ning tõi kaasa masinnägemise suuna tekkimise.

Uue suuna suureks ülesanneks oli seletada masinatele kolmemõõtmelise maailma kahemõõtmeline projektsioon abil. See tähendas, et objekti kohta täieliku teabe saamiseks on vaja mitte ainult kaamerast pilti, vaid ka lisaandmeid.

Lisateabe saamiseks kasutati erinevaid meetodeid:

  • Kaamera liikumine;
  • Mitmekambrilised süsteemid;
  • Kahe kaamera kasutamine (stereopaarid);
  • Erinevad algoritmid saadud pildi töötlemiseks;


1960 aastate alguseni olid kõik varem toodud arendused pigem teoreetilised, kuna varem ei olnud tehnikat, mis võimaldas masinnägemise algoritme täielikult katsetada ja selle abil otsusi teha. Esimesed pilditöötlussüsteemid ilmusid 1960. aastatel. Enamik neist süsteemidest olid loodud fotodelt segaduse eemaldamiseks. Ilmusid esimesed uuringud trükitähtede äratundmise alal.

70-ndatel MIT-i magistrant Lawrence Robberts. Ta pakkus välja, et masin võiks kahemõõtmelistest kujutistest ehitada objektidest kolmemõõtmelisi kujutisi. 1979. aastal ilmus stseeni dünaamilise analüüsi teooria. See võimaldas ära tunda liikuvaid objekte. See põhines Hamburgi ülikooli professori Hans Hellmut Nageli masinnägemise valdkonna töödel.

90-ndate algus on modulaarse paradigma tekkimise aeg. Neuroteadlane David Courtney Marr uuris inimese nägemist ja tuvastas neli andmetöötlusetappi:

  • Piltide teisendamine;
  • Segmenteerimine;
  • Geomeetrilise struktuuri valik;
  • Suhtelise struktuuri ja semantika määramine.


Ta määratles ka kolm andmetöötluse taset:

  • Madalaim tase. See filtreerib müra.
  • Keskmine tase. Sellel tasemel toimub segmenteerimine.
  • Kõrgeim tase. Sellel tasandil on konkreetsed objektid seotud maailmapildiga.


Hetkel on masinnägemine täielikult väljakujunenud küberneetika haru. Selle valdkonna uurimisele ja arendamisele on pühendatud palju konverentse, ning sellel teemal kirjutatakse raamatuid ja artikle.

Masinnägemise arengu ajalugu ja see, mis meil praegu on

Kuidas masinnägemine töötab

Selleks, et arvuti teatud objektid üles leiaks, tuleb seda talle õpetada. Selleks koostatakse tohutu koolitusnäidis. Näiteks fotodelt, millest osa sisaldab soovitud objekti ja teine ​​osa mitte.Järgmiseks tuleb masinõpe. Arvuti analüüsib proovist saadud pilti. Seejärel teeb arvuti kindlaks, millised kujutiste kombinatsioonide tunnused näitavad soovitud objektide olemasolu, ja arvutab nende olulisuse. Kui see on lõpetatud, saab masinnägemist kasutada.

Arvuti jaoks on pilt pikslite kogum, millest igaühel on oma heleduse või värvi väärtus. Selleks, et masin saaks pildi sisust aimu, töödeldakse seda spetsiaalsete algoritmide abil. Esmalt tehakse kindlaks suured olulised kohad. Seda saab teha mitmel viisil. Näiteks liigutage mitu korda sarnast pilti Gaussi häguga, kasutades erinevaid hägususraadiusi. Seejärel võrreldakse tulemusi omavahel, et paljastada kõige kontrastsemad alad, nagu heledad laigud ja katkendlikud jooned. Pärast oluliste kohtade leidmist kirjeldab arvuti neid numbritega. Pildi fragmendi numbrilisel kujul salvestamist nimetatakse deskriptoriks. Deskriptorite abil saate üsna täpselt võrrelda pildi fragmente, ilma fragmente endid kasutamata. Arvutuste kiirendamiseks jaotab arvuti deskriptorid rühmadesse, saades omamoodi klastri. Sarnased deskriptorid erinevatelt piltidelt kuuluvad samasse klastrisse. Pärast sellist klasterdamist muutub oluliseks ainult klastri number koos deskriptoritega . Mis on pakutavaga kõige sarnasem. Deskriptorist klastri numbrini jõudmist nimetatakse kvantiseerimiseks. Ja klastri numbrit ennast nimetatakse kvantdeskriptoriks. Kvantimine vähendab oluliselt andmete hulka, mida arvuti peab töötlema. Kvantdeskriptorite põhjal saab arvuti pilte võrrelda ja neil olevaid objekte ära tunda. Arvuti võrdleb erinevate piltide kvant deskriptorite komplekte ja teeb järelduse, kui palju need või nende üksikud fragmendid on sarnased. Sellist võrdlust kasutavad ka otsingumootorid piltide leidmiseks pildi järgi.


Masinnägemise rakendamine

Telefooni kaamera rakendamine masinnägemises (Photomath näitel)

Photomath. <ref>https://microblink.com/var/site/storage/images/use-cases/case-studies/math-education-powered-by-mobile-vision-photomath/15409-20-eng-GB/math-education-powered-by-mobile-vision-photomath_i1920.jpg <ref>

PhotoMath on tasuta rakendus, mis töötati välja kui tööriist matemaatiliste võrrandite lahendamiseks, mis põhineb mobiilseadme kaamera andmetuvastus tehnoloogial(OCR). Võrrandi arvutamiseks pole vaja teha mitte rohkem, kui suunata nutitelefoni kaamera ülesandele, vajadusel parandada võrrandit appi sees ja mõne hetke pärast telefoni ekraanil ilmub lahenduskäik koos vastusega. Rakendus suudab ülesandeid skaneerida nii paberilt kui ka ekraanilt. Sellel rakendusel on ka hariv osa, mis seisneb selles, et rakendus ei anna mitte ainult õiget vastust, vaid võimaldab vaadata ka kõiki matemaatilise võrrandi lahendamise etappe ja niimoodi õppida.



Meelelahutus ja filmitööstus Meelelahutuse ja filmitööstuse sfääris kasutakse masiinnägemist VR/AR-sisu mahulise jäädvustamiseks, liitreaalsuse animatsiooni kasutavate külastajatega suhtlemiseks ja leidub veelgi rohkem kasutus võimalusi. Ilma masinnägemise kaamerateta VR lahendused ei suuda üksteisega sünkroonida.



Tark linn Tark linn on ka üks masinnägemise arendamise harudest, nimelt sellise idee ellu viimine on seotud vajadusega tagada lähitulevikus inimeste kaasaegne elukvaliteet uuenduslike tehnoloogiate kasutamise kaudu. Sellise linna sees olevad süsteemid tagavad linnaelu süsteemide säästliku, keskkonnasõbraliku ja ohutu kasutamist.



Nutikas valgusfoor "Nutikas valgusfoor" on dünaamiline fooride haldussüsteem, tänu millele paraneb liiklusvoogude liiklusvõime. Tihti valgusfoorides määratakse punaste ja roheliste signaalide muutus kindlaks kehtestatud ajakava järgi. Nutikas valgusfoor kasutab signaalide muutmiseks kaameraid. Tavalistes linnades kohtame sageli olukorda, kus seisame punase tule taga, samal ajal kui külgsuunas kedagi pole. Kui nutikas valgusfoor näeb, et ühes suunas liigub palju vähem autosid kui teistes, siis liikumise optimeerimiseks lülitab rohelist värvi ülekoormatud suundadel pikemalt. Just see parandab liikumise vooge ja vähendab mõju autode heitgaasidest keskkonnale. Камеры замера скорости (Не только вумный город)



Robotite ehitus (Boston Dynamics robot koera näitel) 2020. aasta mai kuus tuli välja Boston Dynamics robot koer (Spot) Singapuri tänavatele, et jälgida sotsiaalset distantseerumist COVID-19 ajal. Spot suudab trepist üles ronida ja konarlikul maastikul liikuda, kuid on siiski piisavalt väike siseruumides kasutamiseks. Spot suudab saavutada kiirust kuni 5,76 km/h ja töötada autonoomselt kuni 90 minutit. Robot on varustatud stereo kaamerate süsteemiga, mis annavad sellele 360° vaate. Selline kaamerate süsteem põhineb masinnägemisel ja aitab roobotil ruumis navigeerida ja võimaldab otsusi tegema kasutades programmeeritud algoritme.



Tööstus Tööstus on suur masinnägemise ülesannete generaator, ning sellel on suurim arv võimalikke rakendusi. Tänase maailma kogemus näitab tohutul hulgal lahendatud tootmis probleeme. Mõned kasutusvaldkonnad: Tootmisliinid - toidu või mineraalide sorteerimine, ning nende kvaliteedi kontroll; Infrastruktuuri objektide diagnostika ja sobivate meetmete rakendamine infrastruktuuri parendamisele; Keevitustööde kontroll ja keevitus protsessi automatiseerimine; Logistika - toodete oleku ja koguse kontroll Pildistamine ohtlikes või raskesti ligipääsetavates kohtades



Sõjaväe droonid (Maven tehnoloogia näitel) 2017. aastal Google koostöös USA kaitseministeeriumiga on alustanud projekti Maven, mille raames on plaanis rakendada täiustatud arvutialgoritme objektide tuvastamiseks suurel hulgal liikuvatel või liikumatutel piltidel. Tegelikult on see sõjaväe droonide masinnägemissüsteem. Süsteemi kasutades droonidest saab tuvastada sõidukeid ja muid objekte, jälgida nende liikumist ja edastada tuvastamise tulemused kaitseministeeriumile.



Autojuhti assistendid

Line Assistant See on tehnoloogia, mis kasutab WAG autodes sisseehitatud kaamerat, mis jälgib, et auto liigub oma sõidurajal. Rooli juhtimiseks peab süsteemikaamera teostama sõiduraja tuvastamise. See kaamera asub sisemises tahavaatepeeglis, ning suudab juhtida auto liikumist, jälgides teemärgistust ja reguleerides auto asendit nende märgiste suhtes. Mis on hea selles süsteemis juhul, kui juhi tähelepanu hajub ja auto teel olevatest rajamärgistest eemale viib, alustab Lane Assist parandusmeetmeid, mis lõppkokkuvõttes vähendab pikkadel sõitudel sõidurajalt välja triivimise tõenäosust.

Front Light Assistant Front Light Assist kasutatakse sõiduki kaugtulede automaatseks sisse- või väljalülitamiseks. Kui auto seisab, töötavad ainult lähituled, kuid kui auto sõidab pimedas üle 60 km/h, lülitab FLA-süsteem vastutuleva liikluse puudumisel automaatselt sisse kaugtuled. Tahavaatepeeglis olev kaamera jälgib liiklust. Tema abiga tunneb süsteem ära vastutulevad ja samas suunas sõiduki ees liikujad ning lülitub automaatselt tagasi lähituledele.

Tesla Autopilot Kõikidel uutel Tesla autodel on olemas riistvara, mida on vaja tulevikus täielikuks isejuhtimiseks peaaegu kõikides tingimustes. Süsteem on konstrueeritud nii, et see suudab sooritada lühikesi ja pikki sõite ilma, et juhiistmel istuja oleks midagi vaja. Tesla Motors ei kasuta hakkas loobuma radaaridest tema autodes. Selle asemel töötas ettevõte välja Tesla Visioni kaamerasüsteemil põhineva autopiloodi versiooni.

Allikad

Aleksei Šalaginov, Arvutinägemise ajalugu / Aleksei Šalaginov. - Tekst: elektrooniline // shalaginov.com: [sait]. - URL: https://shalaginov.com/2020/05/16/computer-vision-history/.

Inishev, Kuidas arvutinägemine töötab? / Inišev. - Tekst: elektrooniline // habr.com: [sait]. - URL: https://habr.com/ru/company/droider/blog/538750/.

https://nirmech.ru/ : [sait]. — URL: https://nirmech.ru/

Machine Vision : Theory, Algorithms, Practicalities - Morgan Kaufmann, 2004 .

Kasutaja: nokiaman, Arendaja lood: PhotoMath by MicroBlink / nokiaman :. - Tekst: elektrooniline // habr.com: [sait]. - URL: https://habr.com/ru/company/microsoftlumia/blog/248789/.

Pavel Bryzgalov, Masinnägemise arengu ajalugu / Bryzgalov Pavel. - Tekst: elektrooniline // robome.ru: [sait]. - URL: http://robome.ru/istorija_razvitija_tehnicheskogo_zrenija/ .

Volkswagen Lane Assist / Volkswagen. - Tekst: elektrooniline // vw.avto-city.ru: [sait]. - URL: https://vw.avto-city.ru/models/preimushchestva/obzor/elektronnyy-pomoshchnik-lane-assist/ .

Mark Icons, Kõik Volkswageni autode elektrooniliste abiliste kohta / Icons Mark. - Tekst: elektrooniline // vagdrive.com: [sait]. - URL: https://vagdrive.com/threads/vse-ob-ehlektronnyx-pomoschnikax-avtomobilej-koncerna-volkswagen.1198/ .

Tesla autopiloot / Tesla. - Tekst: elektrooniline // www.tesla.com: [sait]. - URL: https://www.tesla.com/autopilot .

Aleksander Gureev, Arvutinägemine: kuidas tehisintellekt meid jälgib / Gureev Aleksander. - Tekst: elektrooniline // habr.com: [sait]. - URL: https://habr.com/ru/company/microsoft/blog/418251/ .