Vaizdų atpažinimo technologijos šiais laikais plačiai naudojamos daugelyje mus supančių sričių. Dar 70-jame dešimtmetyje ši technologija buvo skirta robotikos industrijai.
Tuo metu naudodamiesi vaizdų atpažinimu mokslininkai bandė pavaizduoti žmogaus regėjimą, kuris turėjo padėti robotams gaudytis erdvėje. Skirtos robotams, dabar šios technologijos supa mus ir kasdienybėje – padeda gamyboje, yra naudojamos atpažįstant ligas. Kas jos iš tiesų ir kur baigiasi šių technologijų pritaikymo ribos?
„70-jame dešimtmetyje pirmiesiems universitetams pradėjus dirbti su dirbtinio proto sumanymu, sukurti algoritmai sukūrė pamatus šių laikų vaizdų atpažinimo būdams.
Šiais laikais šie būdai naudojami įvairiose srityse – pradedant nuo automatizuotų gamybos ar siuntų skirstymo linijų, baigiant medicininiais tyrimais, skirtais atpažinti klastingas ligas, kurias anksčiau galėdavo pamatyti tik įgudusio ir didelę patirtį turinčio gydytojo akis,“ – apie vaizdų atpažinimo technologijas pasakoja Vilniaus Gedimino technikos universiteto (VILNIUS TECH) Kūrybiškumo ir naujovių centro „LinkMenų fabrikas“ virtualios tikrovės žinovas ir projektų vadovas Leonardas Žilinskas.
Pasak jo, dažniausiai šiais laikais vaizdų atpažinimo (angl. computer vision) technologija naudojama siekiant greitai ir tiksliai atpažinti gamybos broką, trūkstamą detalę gaminyje, reikalingą užrašą ant pakuotės, galiojimo datą ir kitus svarbius gamybos kokybei dalykus.
Ši technologija taip pat naudojama įvairiuose papildytos bei išplėstos tikrovės sprendimuose.
„Vienas iš plačiausiai žinomų vaizdų atpažinimo sprendimų – ant pakuočių esančio brūkšninio kodo skenavimas,“ – teigia L. Žilinskas.
Vaizdų atpažinimo technologija ir kompiuterinis matymas
„Vaizdų atpažinimo technologija – tik viena iš daugelio sudėtinių kompiuterinio matymo dalių. Pavyzdžiui, pažvelgus į dabar jau daugelio namuose esantį robotą-siurblį galime matyti, kaip jis važinėja po namus vengdamas kliūčių, kačių ir puikiai įsimena visą namų planą,“ – sako virtualios tikrovės žinovas ir projektų vadovas.
Anot jo, tokiuose įrenginiuose kaip robotas-siurblys naudojamos skirtingos kompiuterinio matymo technologijos: viena žvelgia į vaizdą pro mums įprastas vaizdo kameras, kita „apšaudo“ aplinką lazerio spinduliais. Tačiau abi jos vadinamos kompiuteriniu matymu.
Kalbėdamas apie virtualią tikrovę L. Žilinskas pabrėžia, kad kompiuterinis matymas virtualioje tikrovėje naudojamas spręsti daugeliui uždavinių, tokių kaip rankų judesių sekimas, kur naudotojas gali valdyti virtualią aplinką nenaudodamas jokių papildomų valdiklių, arba veido išraiškų atpažinimas, kad virtualus pašnekovas galėtų atsakyti į žmogaus šypseną ir taip pat nusišypsoti.
Kur galima pamatyti vaizdų atpažinimo technologiją?
Kaip gali būti pritaikoma vaizdų atpažinimo technologija, galima pamatyti ir Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje. Joje eksponuojamas Lietuvos gyvybės mokslų industrijos pasiekimų stendas, kurį Mokslo, inovacijų ir technologijų agentūros (MITA) užsakymu sukūrė VILNIUS TECH „LinkMenų fabrikas“ žinovai.
Lietuvos gyvybės mokslų industrijos pasiekimų stende rodomos ir pristatomos septynios Lietuvoje gimusios naujovės ir technologiniai sprendimai bei interaktyvus viktorinos stiliaus žaidimas.
„Stende pateiktos žinios leidžia interaktyviai susipažinti su Lietuvos gyvybės mokslų naujovėmis. Jame galima pamatyti kiekvienos naujovės trimatį modelį, peržiūrėti apie inovaciją pasakojantį vaizdo įrašą ir perskaityti trumpą aprašymą.
Šis skaitmeninis grafinis turinys pateikiamas projektuojant vaizdą apskrito stendo paviršiuje pasitelkiant papildytos tikrovės sprendimą ir naudojant projektorius.
Stende įrengtos kameros fiksuoja stendo detalių padėtis pasitelkiant vaizdų atpažinimo algoritmą,“ – pasakoja prie stendo kūrimo proceso prisidėjęs VILNIUS TECH „LinkMenų fabriko“ virtualios tikrovės žinovas ir projektų vadovas.
Pamatyti, kaip vaizdų atpažinimo technologija gali būti pritaikoma praktikoje, susipažinti su Lietuvos mokslininkų naujovėmis, galima apsilankius Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje (Gedimino pr. 51, Vilnius) iki birželio 3 d.
Vaizdų atpažinimo technologijų rinka Lietuvoje
Rinkos tyrimų įmonės „MarketsandMarkets“ duomenimis, vaizdų atpažinimo technologijų rinkos vertė 2020 m. siekė 26,2 mlrd. JAV dolerių. Žadama, kad iki 2025 m. šios rinkos vertė pakils iki 53,0 mlrd. JAV dolerių, su 15,1 proc. siekiančiu bendru metiniu augimo tempu.
Tokie skaičiai tik patvirtina šių technologijų galimybes ir svarbą netolimoje ateityje. Įdomu, kaip vaizdų atpažinimo rinka atrodo Lietuvoje.
„Lietuva taip pat nestovi vietoje, kuriasi nemažai labai perspektyvių startuolių. Vienas jų gyvuoja vos keletą metų, o jau gavo CE ženklo sertifikatą už krūtinės ląstos rentgeno analizės algoritmą, 94 proc. tikslumu atpažįstantį patologinius pakitimus,” – teigia virtualios tikrovės žinovas L. Žilinskas.
Pasak jo, jau dabar šios technologijos naudojamos gana plačiai, tik galbūt ne visi sprendimai taip gerai pastebimi. Pavyzdžiui, vaizdo atpažinimo technologijos padeda Vilniaus mieste prižiūrėti tvarką, keliose vietose vaizdo kameros stebi atliekų konteinerius, o dirbtinis protas tikrina ir sprendžia ar atliekos buvo išmestos į konteinerį ar padėtos šalia jo.
Tačiau kaip ir kiekviena technologija, vaizdų atpažinimas turi ir stipriąsias, ir silpnąsias puses. L. Žilinsko teigimu, apie 70 proc. naujų projektų, kuriuose buvo žadama panaudoti vaizdų atpažinimo ar kompiuterinio matymo technologijas, žlunga.
„Dažniausiai tai nutinka dėl to, kad geriau išanalizavus uždavinio reikalavimus ir tikslus kyla kliūčių. Jos pasitaiko įvairios – pradedant netinkamais atmosferiniais reiškiniais, baigiant tuo, kad paaiškėja, jog tam tikruose projektuose kompiuterinio matymo technologijos visiškai nėra būtinos, nes tą gali pakeisti patikimesnės ir paprastesnės priemonės,“ – įsitikinęs L. Žilinskas.
Visgi, anot virtualios tikrovės žinovo, Lietuva turi galimybių išplėsti vaizdų atpažinimo technologijų rinką.
Technologijos panaudojimo ribos – kokios jos?
Vaizdų atpažinimo technologijoms garsėjant pasaulyje, vis dažniau kalbama apie šios technologijos panaudojimo ribas. Juk, pavyzdžiui, naudojant kai kuriuos technologinius sprendimus yra skenuojamas žmogaus atvaizdas.
Kaupiant šiuos atvaizdus kyla klausimas – ar taip pažeidžiamas žmogaus privatumas? Ar Lietuvoje reikia diskutuoti apie vaizdų atpažinimo technologijų panaudojimo ribas? Ar šiai diskusijai dar yra per anksti?
„Pirmiausia ribas reikėtų vertinti protingumo būdais ir kaskart šie būdai gali būti kitokie, nelygu kokią problemą technologija sprendžia, kiek gyvybių ji gali išgelbėti.
Tokios technologijos dažniausia sprendžia tam tikrą užduotį – tam jos ir yra užprogramuotos. Visa vaizdinė medžiaga virsta į žinias, skirtas problemai spręsti, bet nėra kaupiamos, nes saugoti neapdorotą vaizdinę medžiagą būtų per brangu,“ – pasakoja L. Žilinskas.
Vilniaus Gedimino technikos universitetas (VILNIUS TECH) – naujoviška aukštoji mokykla, ugdanti kūrybiškus ir kvalifikuotus žinovus. VILNIUS TECH užtikrina šiuolaikines, į darbo rinką nukreiptas studijas ir atlieka daugybę įvairių mokslinių tyrimų ir bandomosios plėtros darbų – jie vykdomi 13 institutų, 3 mokslo centruose, 22 laboratorijose.
Universitete veikia naujoviškiausias Rytų Europoje Civilinės inžinerijos mokslo centras. Turėdamas daugiau kaip 500 partnerių tarp užsienio aukštųjų mokyklų, VILNIUS TECH suteikia plačias tarptautinių studijų bei praktikų galimybes.