14 balandžio, 2015
Rimgailė Dikšaitė, VDU

Lietuva priartėjo prie Europos kalbos technologijų išvystymo vidurkio

Ekspertai mano, kad kalba turi specialią vietą tarp kitų komunikacinių sistemų – ji yra visiškai žmogiška ir tik ji garantuoja visavertį žmonių bendravimą. Lingvistė, habilituota humanitarinių mokslų daktarė Rūta Petrauskaitė įsitikinusi: žmonėms geriausia informaciją kurti, kaupti ir perteikti žmonių kalbos tekstu, kad ir koks sudėtingas ir painus informacijos būdas tai būtų.

Šiandien kompiuteriui suprantama tik sterili ir ganėtinai primityvi kalba, be dviprasmybių, neaiškumų. Tai trukdo išnaudoti kompiuterį tokiose darbo srityse, kuriose žmogus sugaišta daug daugiau laiko, nei jeigu tai atliktų pasitelkdamas kompiuterį. Žmogaus ir mašinos bendravimas taip, kad būtų patogu žmogui, o ne kompiuteriui, jo gimtąja, natūralia, nė kiek neapribota kalba, yra laikomas didžiausiu informacinės visuomenės privalumu. Prie to dirba mokslininkai, kurie plečia dirbtinio intelekto galimybes.

Lietuvoje būtent su lietuvių kalba ir jos pritaikymu kompiuteriui dirba Vytauto Didžiojo universiteto (VDU) Kompiuterinės lingvistikos centras – prieš du dešimtmečius jis pirmasis pradėjo tokio pobūdžio veiklą Lietuvoje. „Tokia sudėtinga ir mažai gimtakalbių turinti kalba, kokia yra lietuvių, turi daug mažiau galimybių išlikti, todėl jos kompiuterizavimas ypač aktualus. Jis svarbus ne tik siekiant išsaugoti kalbą, bet ir dėl daugelio kitų priežasčių“, – teigia mokslininkė R. Petrauskaitė.

Pritaikomumo galimybės tik didėja

Kompiuterinės lingvistikos taikymas leidžia ne tik efektyviau ieškoti informacijos, naudotis mašininiu vertimu, mokytis kalbų, bet ir automatiškai užrašyti šneką. Pavyzdžiui, Olandijoje gydytojui nieko nereikia rašyti. Gydytojai informaciją apie paciento būklę diktuoja kompiuteriui, o jis viską suveda į ligos kortelę. Kompiuteris taip įdarbintas, kad net nusiunčia gydytojo receptą į vaistinę, o pacientui reikia tik nueiti ir nusipirkti vaistus. Tuo tarpu Jungtinėse Amerikos Valstijose kompiuterinė lingvistika pasitelkiama sekimo ir šnipinėjimo tikslams – taip sekami ir analizuojami teroristų, nusikaltėlių susirašinėjimai ir aptinkami jų tinklai. Visose šalyse kompiuterinės lingvistikos galimybės naudojamos nustatant mokslinių darbų, ir ne tik jų, plagiatus, norint sudaryti didžiulių tekstų santraukas ar išgaunant informaciją ir nagrinėjant tekstų, vaizdų ir garso įrašų turinio ypatybes.

Pasak lingvistės R. Petrauskaitės, visuomenėje vyrauja klaidinga nuomonė, kad filologas negali mokėti programuoti, o informatikas – kompiuteriu analizuoti kalbos. „Kompiuterinė lingvistika yra tarpdalykinė veiklos sritis. Čia susiduria dviejų skirtingų mokslų atstovų, kalbininkų ir informatikų, požiūris į kalbą. Dėl tokio bendradarbiavimo galima nagrinėti daug įvairių dalykų, pavyzdžiui, šiuo metu VDU Kompiuterinės lingvistikos centras vykdo vieną įdomų projektą – internetinių straipsnių komentarų analizę. Toks komentarų tyrimas gali padėti nuspėti bendras visuomenės nuotaikas, nustatyti patyčias, netgi grėsmes, padeda identifikuoti komentatorių tipažus“, – atskleidė VDU dėstytoja.

Pasak jos, šiandienė informacijos priemonių stebėsena, kurią užsisako didžiosios kompanijos, norinčios žinoti, koks jų įvaizdis vyrauja viešojoje erdvėje, dažnai nėra išsami arba tiksli. „Galima teigti, kad dabar esančios kokybinės spaudos analizės priemonės nėra tobulos, nes įrankiai, kuriais jie naudojasi, nėra išbaigti. Norint, kad kokybinė analizė būtų tiksli, reikia atlikti vadinamąją sentimentų analizę, įvertinti tiriamojo teksto toną ir kitus dalykus, neužtenka tik surašyti tiriamos kompanijos paminėjimus ir pagal tai daryti vertinimus“, – įsitikinusi kompiuterinės lingvistikos ekspertė.

Lietuvių kalba – iššūkis kompiuteriui

Jau seniai kompiuterinės lingvistikos galimybės leidžia ne tik taisyklingai sukirčiuoti žodžius, išsiaiškinti nežinomo žodžio reikšmę, morfologiškai išnagrinėti bet kokią kalbos dalį ar sudaryti tam tikrą veiksmažodžio formą, bet ir tą žodį ar netgi visą tekstą pagal skirtingus parametrus įvairiapusiškai išanalizuoti. Kalbos analizės programos atlieka daug funkcijų: skaičiuoja ženklus, žodžius, sakinius, sakinio  ir žodžio ilgį, automatiškai nustato kalbos dalis, sakinio ribas, nustato sustabarėjusius žodžių junginius, verčia ir net kuria tekstus. Lygiagretusis tekstynas palengvina vertimą, nes iš jo galima perimti atitikmenis. Svetainėje http://tekstynas.vdu.lt/ esanti vertimo sistema verčia kur kas geriau ir tiksliau nei tuo pačiu metu kurtas „Google“ vertėjas, nors visada yra ką patobulinti.

Vienu didžiausių savo pasiekimų Kompiuterinės lingvistikos centro mokslininkai laiko analogų Lietuvoje neturinčio Dabartinės lietuvių kalbos tekstyno suformavimą ir kalbinių bei semantinių technologijų vystymo projekto kodiniu pavadinimu „Semantika LT“ įgyvendinimą. Nors galutiniai projekto „Semantika LT“ tikslai buvo kalbos ir semantinėmis technologijomis grįstų viešųjų paslaugų sukūrimas, bet tai pavyko padaryti tik įvykdžius esminį proveržį lietuvių rašytinės kalbos analizės technologijose. To anksčiau nebuvo įmanoma atlikti dėl riboto valstybės finansavimo ir mažo dėmesio šiai sričiai.

„Įvykdžius projektą, Lietuva pagaliau priartėjo prie Europos kalbos technologijų išvystymo vidurkio, nuo kurio buvo atsilikusi daugiau nei aštuoneriais metais. Pasinaudodami projekto rezultatais, vartotojai viešai ir nemokamai prieinama informacine sistema galės atlikti sintaksinę-semantinę tekstų analizę, surasti ir koreguoti rašybos bei gramatines klaidas, atpažinti interneto žiniasklaidos kalbos naujoves, atlikti interneto žiniasklaidos sintaksinę-semantinę analizę. Tai ne tik skatins taisyklingos lietuvių kalbos vartojimą elektroninėje erdvėje, bet ir palengvins informacijos lietuvių kalba suradimą bei jos analizę“, –  rezultatais džiaugiasi mokslininkė R. Petrauskaitė.


Kazimieras Garšva / manokrastas.lt nuotr.
10 gegužės, 2021

Gegužės 5 d. ministrės A. Armonaitės siūlymu Vyriausybė neteisėtai patvirtino konstitucinio Valstybinės kalbos įstatymo Nr. I-779 16 straipsnio, Civilinio kodekso […]

15 gruodžio, 2017

Artėjant  šventėms, vis dažniau pasitaiko sakinių, susijusių su tam tikrais, ne kasdien vartojamais, žodžiais, pvz., dažnas suabejoja, ar rašyti „Kalėdų […]

30 lapkričio, 2017

Apie Kūčias ir Kalėdas Rudeniui nueinant, į mūsų gyvenimą atkeliauja rimties, apmąstymų ir susikaupimo metas – adventas. Tai tarsi stabtelėjimas, […]

4 liepos, 2017

Liepos 6-ąją švenčiame Valstybės (Lietuvos karaliaus Mindaugo karūnavimo) dieną. Istorikai teigia, kad Didysis Lietuvos kunigaikštis ir pirmasis Lietuvos karalius Mindaugas […]

28 birželio, 2017

Atrodytų smulkmena – ar brūkšnelis, ar brūkšnys, yra tarpeliai, nėra jų, tačiau… yra priimtos tam tikros taisyklės, nustatyti reikalavimai, tad […]

31 gegužės, 2017

Lietuvių kalbos sąjūdžio vardu – hab. dr. Kazimieras GARŠVA, „Dabartinės lietuvių kalbos gramatikos“ abėcėlės skyriaus autorius, www.voruta.lt Lietuvos Respublikos Prezidentei […]

4 gegužės, 2017

Vardų ir pavardžių rašymo dokumentuose įstatymo projektas Nr. XIIIP–535 (2017–04–04) numato, kad nelietuviškomis raidėmis būtų galima rašyti Lietuvos Respublikos piliečių […]

19 balandžio, 2017

Atrodo, jau buvo aprimę vardyno rašybos chaotizavimo propaguotojai.  Net tarp trijų raidžių – W, Q ir X – pasiklydę entuziastai […]

18 balandžio, 2017

2017 sausio 12 d. Lietuvos Respublikos užsienio reikalų ministras Linas Linkevičius atsakė į Seimo narių klausimus. Kalbėdamasapie 2010 m. Seimo […]

14 balandžio, 2017

Parašiau pirmąjį antraštės žodį, norėdama papasakoti, kokia įdomi alfabetų kūrimosi istorija iki tol, kol jie virsta uždaromis ženklų sistemomis kalbos […]

7 balandžio, 2017

Pirmaisiais gyvenimo metais vaikai intensyviai klausosi – taip jie pradeda suvokti ir įsisavinti aplinkoje girdimos gimtosios kalbos ypatybes, kiek vėliau […]

8 kovo, 2017

Šiandien Vyriausybė patvirtino Lietuvių kalbos kultūros metų minėjimo 2017-aisiais planą. Jame numatytos įvairios veiklos, kurios populiarins taisyklingą lietuvių kalbos vartojimą […]

31 sausio, 2017

Valstybinis lietuvių kalbos statusas Lietuvos Respublikoje įtvirtintas Lietuvos Respublikos Konstitucijos I skirsnio „Lietuvos valstybė“ 14 straipsnyje. 1995 m. sausio 31 […]

26 sausio, 2017

Lietuviška abėcėlė, kurios skirtumai nuo kitų pasaulio kalbų raidynų daugeliui krenta į akis, šiemet atsidūrė ir Vilniaus knygų mugės organizatorių […]

25 sausio, 2017

Valgiaraštis yra viešoji informacija, kuri turi būti rengiama ir platinama laikantis Valstybinės kalbos įstatymo bei Valstybinės lietuvių kalbos komisijos nutarimų. […]

19 gruodžio, 2016

Jau šį savaitgalį švęsime Kalėdas. Ar žinote, kad tuo žodžiu vadinta ne tik Kristaus gimimo šventė. Didžiajame „Lietuvių kalbos žodyne“ […]

14 lapkričio, 2016

Valstybinė lietuvių kalbos komisija (VLKK) atsižvelgdama į tai, kad universitetinių studijų kalbos taisyklingumas turi įtakos ne tik mokslo kalbos raidai, […]

26 liepos, 2016

Liepos 26-oji – Onìnės – šv. Onos šventė, Onos vardo diena. Gal kiek ir keista, bet senovėje labai stengdavosi iki […]

7 liepos, 2016

Šiais metais  Kėdainių rajono savivaldybės kalbos tvarkytoja daug dėmesio skiria kavinių bei restoranų valgiaraščių bei viešųjų užrašų kalbai. Šios įstaigos […]

1 liepos, 2016

Šiandien, liepos pirmą dieną, – Liepos vardadienis ir Tarptautinė architektų diena. O kokios kitos šio mėnesio šventės ir atmintinos dienos, ką […]