Lietuviai pasitelkė dirbtinį protą, kad sukurtų elektroninę vertyklę, pranokstančią „Google“ vertėją. Vilniaus universiteto mokslininkai kartu su partneriais kuria sistemą, sugebančią automatiškai versti tekstus iš (į) 5 kalbų poras. Projektą, finansuojamą ES struktūrinių fondų ir Lietuvos Respublikos lėšomis, žadama užbaigti iki 2021 metų. Į jį bus įdėta 3,8 mln. eurų.
Neuroninių tinklų technologijas taikanti vertimo sistema bus apmokyta „sumaitinant“ jai dešimtis milijonų sakinių turinčių tekstų duomenis – iš grožinės, mokslinės literatūros, specializuotų tekstų ir žiniasklaidos šaltinių. Dirbtinis protas tokiu būdu išmoksta ne tik išversti pažodžiui, bet ir, įvertinus kontekstą, suteikti verčiamam žodžiui tikslesnę prasmę. Pasitelkus šią technologiją, bus gerokai patobulinta prieš ketverius metus Vilniaus universiteto mokslininkų sukurta automatinė vertyklė. Taip pat įvedamos naujos kalbų poros, iš viso bus verčiama iš (į) penkias kalbų poras: lietuvių–anglų, lietuvių–prancūzų, lietuvių–rusų, lietuvių–lenkų ir lietuvių–vokiečių.
VU mašininio vertimo grupėje dirba aštuonių žmonių komanda, kuriai vadovauja Vilniaus universiteto mokslininkas dr. Arūnas Samuilis.
„Gyvename dirbtinio proto revoliucijos amžiuje, todėl ši technologija yra tinkamiausia automatiniam vertimui. Pasitelkę geriausias vertimo praktikas, apmokysime šį protą. Be to, suteiksime jam lokalią terpę – tai yra išmokysime geriau atpažinti Lietuvai būdingą terminiją, informaciją ir jos kontekstą: terminus, sąvokas, vietovardžius, pavardes ir pan. Mūsų tikslas, kad lietuvių kalbos terpėje ši vertyklė verstų net geriau nei „Google“ vertėjas“, – sakė Vilniaus universiteto Taikomųjų mokslų instituto mokslininkas dr. Arūnas Samuilis.
Nepriklausoma technologija, valdoma valstybės
Pasak A. Samuilio, ši dirbtiniu protu grindžiama vertyklė svarbi ir dėl jos nepriklausomumo aspekto.
„Jau seniai kalbame, kiek daug svarbių duomenų yra koncentruojama vienos korporacijos rankose, šis projektas šaliai suteikia galimybę turėti nepriklausomą vertimo sistemą, šimtu procentu kontroliuojamą valstybės, nešališką ir užtikrinančią, jog duomenys nenutekės į privačių korporacijų rankas“, – sakė mokslininkas.
Projekto įgyvendinimo technologinius darbus atlieka konkursą laimėjusi specializuota kalbos technologijų bendrovė UAB „Tilde IT“. Ji jau anksčiau yra sukūrusi dirbtinio proto technologijomis paremtą šnekos atpažintuvą. Šią technologiją žadama integruoti ir į naująją vertyklę.
„Naudojant šią technologiją, bus galima lietuviškai įkalbėti tekstą ir automatiškai gauti tą tekstą, išverstą į prancūzų ar anglų kalbą. Ji gali būti pritaikyta kad ir universitetų auditorijose – dėstytojas gali įrašyti savo paskaitą lietuviškai ir pateikti jau išverstą tekstą užsienio studentams. Taip pat pravers konferencijų dalyviams, kai pranešimai skaitomi lietuvių kalba, o kitakalbiams nėra galimybės pasinaudoti profesionalių vertėjų pagalba“, – pritaikymo būdus minėjo vertimo sistemos kūrėjų komandos vadovas A. Samuilis.
Pravers tautinėms mažumoms, vertėjams, ieškantiems informacijos, žurnalistams
Pasak projekto kūrėjų, pagrindinis pritaikymas – tai gyventojai, kuriems reikia išversti tekstus ar internetinių svetainių turinį į kitas kalbas.
„Manome, kad jis labai pravers Lietuvoje gyvenančių tautinių mažumų atstovams, kuriems kartais gali būti keblu suvokti oficialiose svetainėse skelbiamą, tarkime, mokesčių ar teisinę, informaciją. Naudodami šią vertyklę, jie galės lengvai suprasti skaitomą turinį. Taip pat bus patogu versti užklausas, kai ieškoma informacijos, ir gauti paieškos rezultatus norima kalba. Žadama, kad vertimo įskiepis bus įdiegtas ir į e. paslaugas teikiančias svetaines, tarkime, VMI ar kitas, taip suteikiant galimybę lankytojams informaciją gauti viena iš 5 užsienio kalbų“, – sakė A. Samuilis.
E. vertyklė galės versti iškart visą dokumentą ar svetainę
Sistema suteiks galimybę versti visą dokumentą. Tai yra, įkelti į sistemą, pvz., „MS Office“ paketo dokumentą ir gauti jo išverstą analogą viena iš 5 pasirinktų kalbų.
„Kaip ir dabartinėje vertyklėje, bus galimybė versti visą dokumentą ar svetainę. Sistema paliks išverstame tekste visus formatavimus – šriftą, paryškinimą, pabrauktus žodžius. Tai didelė pagalba ir tiems, kurie iki šiol tekstus turėdavo išsiversti patys, nes sistema automatiškai atliks pradinį darbą, o verčiančiajam beliks tik pagražinti ar patikslinti“, – sakė vienas programos kūrėjų.
Sutaupo laiko
Skaičiuojama, kad dirbtinis protas, atlikęs pradinį vertimą, padidina automatinių vertimo sistemų veiksmingumą maždaug 15–30 proc., o palyginti su savarankišku vertimu – net 2–3 kartus.
„Tai yra pagalba žmonėms, kurie verčia ilgus tekstus, įstatymus, sutartis – pasitelkus šią technologiją, darbas atliekamas žymiai greičiau, visą „juodąjį“ darbą atlieka technologija, žmogus gali koncentruotis į detales, teksto grožį ir niuansus“, – pasakojo A. Samuilis.
Vertyklė turės ir 3 specializuotas sistemas, kurios padės gauti dar tikslesnį vertimą: bendrinės, teisinės ir informacinių technologijų srities tekstų. Projekto kūrėjai sako, kad e. vertyklė bus naudinga visiems, kurie dirba su skaitmeniniu turiniu keliomis kalbomis: seminarų, mokymų kūrėjams, renginių ar diskusijų vedėjams bei dalyviams, valstybinėms institucijoms, teisininkams ir kitiems. Ji taip pat bus vertinga klausos negalią turintiems žmonėms, nes garsinius įrašus galės ne tik išversti, bet ir pateikti tekstu.
„Praktiškai visiems, kurie dirba su tekstiniu turiniu keliomis kalbomis – komunikacijos specialistams, žurnalistams, tarptautinių bendrovių darbuotojams – gali praversti dirbtinio proto vertimai. Žinoma, viso žmogiškojo darbo e. vertyklė neatstos – bet tikrai palengvins, pagreitins ir daugiau laiko liks kitiems darbams“, – e. vertyklės naudą apibendrino Vilniaus universiteto mokslininkas dr. Arūnas Samuilis.
Tikėkimės, kad šį kartą jau geriau pavyks. Jau ir Gūglas gerokai pasitempė – turi neblogų patarėjų.
Nuo pat pradžių buvau didžiulė visų įmanomų technologijų entuziastė, išbandydavau jas, vos LT pasiekdavo. Deja, vertimo kokybė nuvildavo – ir dėl to, kad iš kokių 10 žodžio vertimo variantų pasirinkdavo netinkamą, nepataikydavo. Ir daugiau visokių dalykėlių būdavo. Visų teksto prasmės, gramatikos, žodžių tvarkos sakinyje ir kt. klaidų ištaisymas užtrukdavo ilgiau, negu pačiai jį išversti. Pvz., kai kurių Vakarų šalių mokslininkai, įv. šakų specialistai mėgsta net ir į rimtus veikalus ką nors meniško įpinti – ar senovės filosofų, Biblijos, ar grožinio kūrinio, operos ir pan. citatų. O mašina tokių „ekskursų” nepajunta…
Neblogai pirmųjų vertyklių kokybę iliustravo gal būt net ir pirmas vokiečių k. pasirodęs gidas po Lietuvą (ar gal po Vilnių). Pamačiusi jį „Mažvyde” nudžiugau, atverčiau, žiūriu, ir… nieko nesuprantu. Vaizdas buvo toks, lyg kažkas turėjo maišą žodžių, išpurtė juos visus į tą knygutę, ir jie įkrito ten, kur kam pakliuvo. Tada dar nesupratau, jog tai mašinos darbas.
Viena iš didelių mašininio vertimo bėdų, kad tekstai tampa beveidžiai, bejausmiai, lyg konvejeriu štampuojami. Štai tokio poveikio kalbai labiausiai bijau. Jie ir iš taip verstų tekstų skaitantį žmogų prie tokios robotų kalbos įpratins, kalba praras savo žavesį. Pamenu, mūsų mokslininkai mokėjo labai talentingus mokslo populiarinimo tekstus (vaikams) rašyti. Būtent dėl to jie pagaudavo net ir mokslu ligi tol nesidomėjusį vaiką.
reiktų dar Lietuvių-ispanų
Pirmiausia reikia išspręsti gramatikų santykio kryžiažodžius. Dabar vertykle bent kiek sėkmingiau gali tik tas naudotis, kas puikiai svetimą gramatiką išmano, o ir savąją bent kiek išmano. Kalbos nemokančiam ji surenka jo įdėto teksto žodžių vertimus ir išmeta juos jam į ekraną. O jis pats turi sutvarkyti gramatiką, žodžių tvarką sakinyje susitvarkyti, kad būtų aišku, „katras katrą apvogė”. Juk, pagaliau, atvirkščia kryptimi — iš svetimos kalbos į LK Googlu versdami, matome, jog nekoks viralas išėjo, kad reikia pasiraitoti rankoves ir iš to daikto tekstą padaryti!
Kol kas teiginiai, jog mašina tekstas kelis kartus greičiau išverčiamas, yra tiesa tik tiek, kad tau žaibiškai išpurto į ekraną maišą tų žodžių, kurie GALI BŪTI susiję su tavo originalu. Bet nebūtinai ir tikrai ne visi. Tad žiūrėti į tą rezultatą kaip į vertimą toli gražu negalima. Ne sykį pati įsitikinau, kai kildavo nesusipratimų dėl kokio nors briuselinio teksto supratimo. Paimu originalą – netiesą politikai/valdininkai teigia! Ne tai ten parašyta. Sykį šovė į galvą pažiūrėti, o ką Googlas ta tema mano – ogi akurat! Tai JE Googlas būtent taip verčia, kaip politikas tautai iš aukšto aiškina, ką „Briuselis liepia”, kaip dera į tą ar aną „civilizuotai” žiūrėti. Taigi, politikai dažnokai klaidina mus, aiškindami, kas ir kaip turi būti. (O kur garantija, kad ir Vaiko teises šakalienės ne išvirkščiai suvokia?)
Lygiai tas pat buvo ir su TM teisių supratimu. (Visų pirma negalėjau patikėti, jog ES tikrai tokie idiotai sėdi, kad okupacijs aukas SMURTU verčia OKUPANTO palikuoniams PRIVILEGIJAS teikti! Juk jų kalba lygiai tokia pat INVAZINĖ, kaip ir jų (pro)protėviai!). Užsiėmiau tikrinimu: Paimi tą dokumentą viena, kita, trečia ES kalba – visomis kalbomis vienodai rašoma: atvykėliai nelaikomi TM. O Googlas į RU kalbą verčia lygiai priešingai*! Aha, štai iš kur mūsų tautos „elitas” sužino, kas parašyta ES dokumentuose! O juk jie VISUS tuos dokumentus TAIP „studijuoja”!!!
Tuo įsitikinęs, o ir pats kelis kartus bandęs rimtesnį tekstą Googlu išversti, gaišęs, kad iš jo siūlomo žodžių maišo tekstą padarytų, žmogus nusispjauna ir pats verčia, nes ir į niuansus atsižvelgia, ir nesupainioja, „kas vagis, o kas auka”…
Beje, vertimas mašina – nėra absoliutus gėris! Mažiausiomis (laiko/pinigų) sąnaudomis didžiausias rezultatas/pelnas toli gražu ne visada gerai, nes to rezultatas – žmogaus PROTAS STINGSTA (kaip ir fiziškai nejudrus kūnas) – prarandame gebą mąstyti, lavinti protą, jausti švelniausius niuansų skirtumus. Jau ir taip daug praradome, ką turėjome, kuo džiunglių gyventojai dar sėkmingai naudojasi – jautrios juslės, puikiai analizuojančios visą juos supantį informacinį lauką. Juslėmis šifruoja tai, kam mums reikia brangios aparatūros.
Goole visiems prieinama (visi gali siūlyti „teisingus vertimus”), kaip kad būdavo prieinamos statybų tvoros, ant kurių kas tik norėjo, kas pro šalį ėjo – kurdavo ir redaguodavo savuosius „QWXus”.
Atrodytų, va, visa žmonija talkon sueiname ir padarome tobulą vertyklę. Bet, pasirodo, tai neįmanoma, kol piktavaliai turi lygias teises su dorais ir atsakingais.
———————-
* O kas galėtų paneigti, kad taip nėra: kad šį kartą (TM klausimu) tai ne mašinos klaida, o valingas klaidinimas? Ne viena ilgai nepastebėtų trolių darbo sričių? O kai mūsų elitas neapsieina be ES dokumentų vertimo į rusų kalbą, tai Šėtonas gali sau smagintis iš jų protelių ir jų darbų… Juk ir šis VIENAS sakinukas ar mažai nudirbo? Ar nepadėjo visų „former SSSR” šalių 5kolonininkams telktis agresijai?
Bet ko neatsakinga, neišmanėliška ar piktavališka
globalizacija, centralizacija, monopolizacija SILPNINA imunitetą, savigynos gebas!
Berods, vakar VISA GRUZIJA buvo PARALYŽIUOTA, nes visi su šalies valdžia, valdymu, finansais, krašto gynyba susiję centralizuoti ir gyvybiškai svarbūs tiekimo (H2O, elektra, ryšiai) tinklai buvo užgrobti. Taigi, jei kas, negalėtų pakelti savo karinių pajėgų, sustojo net ir tuo metu vykdomos operacijos ligoninėse ir t.t.).
Nebereikia nė to senojo lagaminėlio su mygtuku.
Pretenduoti į „Google“ skiriamą paramą kviečia ir Lietuvos kultūros bei meno atstovus
Skaitykite daugiau: https://www.lrytas.lt/kultura/meno-pulsas/2021/01/25/news/pretenduoti-i-google-skiriama-parama-kviecia-ir-lietuvos-kulturos-bei-meno-atstovus-18036053/