Nuo šiol ir Lietuvoje – sukūrė sprendimą, padėsiantį atpažinti DI sukurtą tekstą lietuvių kalba

Labai tikėtina, kad per pastarąją savaitę perskaitėte tekstą, kurį parašė dirbtinis protas (DI), ir apie tai net nesusimąstėte.

2022-ųjų pabaigoje pasirodęs „ChatGPT“ sumanė tikrą rašytinio turinio kūrimo revoliuciją, kuri skatina permąstyti iki šiol egzistavusį santykį su skaitomais tekstais.

Laikais, kai DI algoritmas gali sukurti argumentuotą ir įtikinamą straipsnį, el. laišką ar skelbimą iškyla svarbi problema:

kaip atskirti, ar tekstą parašė žmogus, ar mašina?

Su šiuo iššūkiu tvarkomasi skirtingais būdais, o vienas iš patikimiausių – DI kurto teksto atpažinimo sistemos, pateikiančios procentiškai išreikštą tikimybę, jog tekstas buvo sukurtas ne žmogaus.

Nors anglų kalba tokių įrankiu apstu – ką tik pasirodęs sprendimas lietuvių kalba yra pirmas toks šalyje.

Išbandyti „Oxsico AI“ teksto atpažinimo sistemą lietuvių kalba galima – čia.

„Dirbtinio proto perversmo laikais suprasti skaitomo teksto kilmę yra būtina.

Tai daugiau nei kritinio mąstymo pratimas – DI priemonės dažnai mini melagingas ar klaidinančias žinias, kurias būtina iš anksto identifikuoti, siekiant išvengti tolimesnės jų sklaidos.

Todėl atpažinti algoritmo kurtą tekstą yra vis svarbesnis įgūdis visiems siekiantiems tapti turinio vartotojais.

Be to, tai itin svarbus iššūkis švietimo įstaigose, kai vis daugiau mokinių ir studentų renkasi nesąžiningą DI įrankių pagalbą, kuriant rašto darbus.

Tad džiaugiamės galėdami pasiūlyti savąjį problemos sprendimą nuo šiol nemokamai prieinamą ir lietuvių kalba“, – teigia startuolio „Oxsico“ vadovė Kotryna Tomkevičiūtė.

Naudojimasis „Oxsico AI“ teksto atpažinimo sistema lietuvių kalba yra paprastas ir intuityvus, o rezultatas aiškus.

Įvedus norimą patikrinti tekstą ar jo ištrauką, gaminys spalviškai pažymi galimai dirbtinio proto sukurtą tekstą.

Kuo spalva ryškesnė, tuo didesnė tikimybė, kad sakinys yra sugeneruotas DI.

Ir atvirkščiai, mažėjant spalvos intensyvumui, traukiasi tikimybė, kad tekstas buvo parašytas algoritmo.

Vertinant gautus rezultatus, svarbu atminti paprastą taisyklę.

Jeigu modelis nurodo didesnę nei 50 proc. tikimybę, jog tekstas buvo sukurtas DI – galime manyti, kad tekstą parašė DI.

Ir priešingai, jei pateikiama tikimybė siekia mažiau nei 49 proc., patartina tokį turinį vertinti kaip sukurtą žmogaus.

Svarbių problemų sprendimas

Kaip priduria „Oxsico“ vadovė, plagijavimo, neteisingo citavimo, o šiandien ir DI kuriamų darbų iššūkiai aukštosiose mokyklose – ne tik švietimo, bet ir esminės visuomenės problemos.

„Praėjęs pavasaris patvirtino išankstinius lūkesčius – studentai ir mokiniai sunkiai atsispiria pagundai palengvinti savo gyvenimą rašant atsiskaitomuosius darbus.

Kaip dirbtinis protas pakeis švietimo sistemą? | „INK agency“ nuotr.

Į pagalbą DI algoritmai pasitelkiami skirtingu laipsniu:

galvojant rašto darbo temą, ieškant reikiamos literatūros, formuojant argumentus, o aplaidžiausi renkasi apskritai nerašyti, šį darbą patikint dirbtiniam protui.

Mažesnės studentų pastangos lems ne tik prastesnį gebėjimų bagažą, bet ir menkesnes karjeros galimybes.

Todėl akivaizdu, jog valstybės, kurios išmoks tinkamai panaudoti dirbtinį protą, nesumažinant, o padidinant savo gyventojų įgūdžius – pirmaus užtikrinant bendrą visuomenės gerovę“, – mintimis dalijasi Kotryna Tomkevičiūtė.

Įrankio tikslumui užtikrinti – net keli naujoviški sprendimai

„Oxsico AI“ nuo rinkoje egzistuojančių DI teksto atpažinimo sistemų skiriasi ne tik dėl lietuvių kalbos palaikymo.

Startuolio kuriamo modelio apmokymui yra naudojamos morfologinės žinios, kurios ženkliai padidina sprendimo veiksmingumą.

Įrankio taiklumui matuoti yra naudojami keli skirtingi rodikliai, įvertinantys teksto kilmės nustatymo tikslumą.

Modelio tikslumas (angl. „precision“) parodo, kiek bruožų buvo tiksliai atpažinti iš visų atpažintų bruožų.

Šiuo metu šis rodiklis siekia net 99,8 proc. – tai reiškia, kad jei sakinys yra pažymėtas kaip sukurtas DI, egzistuoja 99,8 proc. tikimybė, kad modelis pataikė.

Tuo tarpu išsamumo (angl. „recall“) rodiklis parodo kiek elementų buvo atpažinti iš visų tų, kuriuos algoritmas turėjo įvertinti.

Šiuo metu šio rodiklio reikšmė siekia 93,4 proc. – tad 6,6 proc. atvejų vis dar lieka neidentifikuoti.

„Galvojant apie DI kurto teksto atpažinimo sistemas, svarbu pažymėti ir galimus tokių sprendimų ribotumus.

Reikia turėti omenyje, jog galime kliautis tik tikimybiniu įvertinimu, kuris ne visada atitinka tikrovę.

Todėl modelio veikimą reikėtų vertinti visumoje, atsiribojant nuo epizodinių netikslumų.

Be to, svarbu iš anksto aiškiai apsibrėžti, kas yra traktuojama kaip DI kurtas turinys.

Pavyzdžiui, tekstinis turinys gali būti išskirtinis ir sukurtas žmogaus, tačiau vartotojui pasinaudojus DI pagalba, tvarkant stiliaus klaidas, gramatiką, skyrybą toks tekstas gali būti prilygintas DI kuriamam turiniui.

Todėl siekiant išvengti nesusipratimų, būtina nusistatyti aiškias DI naudojimo gaires“, – pastebi Kotryna Tomkevičiūtė.

Ateityje – dar didesni tikslai

Naujovišką įrankį sukūrusios bendrovės atstovė teigia, jog teksto atpažinimo sistema lietuvių kalba yra tik pirmasis iš plėtros etapų.

„Pirmieji mūsų sprendimo naudotojai Lietuvoje yra esami klientai:

universitetai, mokyklos, kolegijos.

Nuo rugsėjo mėnesio ši priemonė bus prieinama mūsų teksto sutapčių patikros sistemoje.

Tačiau artimiausioje ateityje žadame šią priemonę pristatyti ir kitomis kalbomis – iki spalio žadame turėti DI atpažinimą bent 20 kalbų.

Nors „Oxsico AI“ bus ir toliau nemokamai prieinamas visiems, tačiau ateityje turėtų pasirodyti „Premium“ versija, kurioje papildomos funkcijos bus prieinamos tik paslaugos prenumeratoriams.

Todėl reikia pabrėžti, kad šiandien prieinamas įrankis išlieka beta versija, kurią nuosekliai tobulinsime“, – apibendrina Kotryna Tomkevičiūtė.

Spausdinti 🖨

Pastabos 1

Na, taip, bet - ... says:

3 metai ago

M. Dubnikovas štai ką sako:
Galiu lažintis, kad dirbtinio intelekto poveikis Lietuvos ekonomikai bus reikšmingas
– alfa.lt/aktualijos/komentarai/galiu-lazintis-kad-dirbtinio-intelekto-poveikis-lietuvos-ekonomikai-bus-reiksmingas/300107/

Bet –
O kaip atpažinti svetainių, paskyrų (kad ir feisbukyne) klastotes??? Kur ir tekstas, ir paskyros savininko balsas, ir vaizdo įrašai – klastotės?

Atsakyti