Lietuvių kalbos sintaksinės ir semantinės analizės informacinė sistema

Lietuviško teksto analizė ir taisymas

Paslauga leidžia išanalizuoti įkeltą lietuvišką tekstą. Vartotojas gali pasitikrinti teksto kalbą, įkelto teksto rašybą . Be to, tekstas išanalizuojamas morfologiškai ir sintaksiškai, jame pažymimos įvardytos esybės (asmenų, organizacijų ir vietovių pavadinimai) ir kolokacijos.

Analizuojamas tekstas

Vartotojas įkelia savo tekstą į paslaugos langą, pasirenka reikiamus analizatorius ir spaudžia „Analizuoti“.

Rašybos klaidos

Šiame lange parodomos teste rastos rašybos klaidos ir jų taisymo pasiūlymai. Ištaisius klaidas, spaudžiamas mygtukas „atsiųsti“ (ištaisytą tekstą).

Gramatikos klaidos

Šiame lange parodomos teste rastos gramatikos ir stiliaus klaidos ir jų taisymo pasiūlymai. Ištaisius klaidas, spaudžiamas mygtukas „atsiųsti“ (ištaisytą tekstą).

Morfologijos analizė

Šiame lange ekrano dešinėje parodomos pasirinkto žodžio morfologinė analizė. Pasirinkus žodį ir paspaudus „Ieškoti semantinės informacijos“, parodomi to žodžio sinonimai ir kita semantinė informacija iš Bendrosios lietuvių kalbos ontologijos.

Įvardytos esybės

Šiame lange parodomos tekste rastos įvardytos esybės, kurios tekste pažymimos, paspaudus ekrano apačioje esančioje juostoje nurodytas įvardytų esybių kategorijas.

Žodžių junginiai

Šiame lange analizuojamam tekste pažymi žodžių junginiai pagal ekrano dešinėje esančias žodžių junginių kategorijų pasirinktis.

Sintaksė

Šiame lange analizuojame tekste pažymimi sintaksiniai junginiai pagal dešinėje pusėje esančias pasirinktis

Pastabos

Pabaigus analizę, galima grįžti pradinį langą („Analizuojamas tekstas“), kur paspaudus mygtuką „Atsisiųsti analizės žymas“ vartotojui atsiunčiamas analizės metu naudotų analizatorių anotacijos žymelių rezultatas.

Vertinti

Interneto svetainių semantinė analizė ir paieška

Paslauga leidžia atlikti lietuviškų interneto svetainių straipsnių semantinę analizę ir paiešką politikos, ekonomikos ir verslo bei viešojo administravimo sričių tekstuose pateikiant klausimus SBVR struktūrizuota lietuvių kalba.

Vertinti

Internetinės žiniasklaidos analizė

Paslauga leidžia analizuoti lietuviškų interneto svetainių turinį. Vartotojas gali sužinoti, kokie asmenys, organizacijos ar vietovės buvo dažniausiai paminėtos pasirinktu laikotarpiu ir kas paminėta jų kontekstuose. Vartotojui pateikiami grafiniai ir tekstiniai analizės rezultatai.

Vertinti

Paieška Dabartinės lietuvių kalbos tekstyne (DLKT)

Paslauga leidžia atlikti paiešką Dabartinės lietuvių kalbos tekstyne (DLKT). Paieškos rezultatas – pagal įvairius kriterijus sugeneruotas konkordansas.

Vertinti

Lietuviško teksto anotavimas

Paslauga leidžia morfologiškai ir sintaksiškai suanotuoti įkeltą lietuvišką tekstą.

Lietuvių kalbos tekstas

Vartotojas įkelia savo tekstą į paslaugos langą, pasirenka jam tinkamą anotavimo grandinėlę.

Grandinėlė

Išsiskleidžiančiame lange vartotojas turi pasirinkimą: tik morfologinio lygio anotavimo grandinėle arba morfologinė-sintaksinė anotavimo grandinėlė.

„Anotuoti“

Paspaudus mygtuką „anotuoti“, vyksta įvesto teksto analizės ir anotavimo procesas.

Pastabos

Pabaigus analizę, anotavimo rezultatas (suarchyvuota byla su anotacijomis) automatiškai siunčiamas į vartotojo kompiuterį. Vartotojas siuntimo metu gali atsisakyti siuntimo ir peržiūrėti anotacijas arba nurodyti, kur siųsti anotacijų rinkinį.

Vertinti

Paieška Bendrajame interneto tekstyne (BIT)

Paslauga leidžia atlikti paiešką Bendrajame interneto tekstyne (BIT). Paieškos rezultatas – pagal įvairius kriterijus sugeneruotas konkordansas.

Vertinti

Interneto kalbos naujovių analizė

Paslauga leidžia neužsiregistravusiems vartotojams peržiūrėti rašytinės kalbos naujoves arba siūlomas naujoves ir už jas balsuoti . Užsiregistravę sistemoje vartotojai gali pateikti savo siūlomas naujoves.

Neregistruoti naudotojai

Neregistruoti sistemos naudotojai šios paslaugos lange gali peržiūrėti 3 žodžių sąrašus „Kandidatai į naujoves“, „Naujovės“, „Nevartotini žodžiai / frazės“.

„Kandidatai į naujoves“. Šiame sąraše pateikiamos žodžių formos, kurias LKSSAIS sistema ir ekspertas atrinko kaip galimus kandidatus į naujoves. Tai žodžių formos, kurios yra dažnos Bendrajame internetiniame tekstyne (BIT), tačiau neatpažįstamos sistemos analizės įrankių. Taip pat šiame sąraše yra pateikiamos naujovės, kurias pasiūlė registruoti naudotojai (žr. skyrių „Registruoti naudotojai“) ir kurias patvirtino ekspertas.

Sąraše nurodami žodžių formų dažnumai Dabartinės lietuvių kalbos tekstyne (DLKT) ir Bendrajame internetiniame tekstyne (BIT). Jei pritariate ir nepritariate siūlomai naujovei galite balsuoti paspausdami atitinkamus mygtukus.

„Naujovės“. Šiame sąraše pateikiamos žodžio formos, kurias ekspertas patvirtino kaip naujoves remdamasis siūlomos naujovės vartosenos analize, savo kompetencija ir sistemos naudotojų balsavimu.

Sąraše nurodami žodžių formų dažnumai Dabartinės lietuvių kalbos tekstyne (DLKT) ir Internetiniame tekstyne (BIT).

„Nevartotini žodžiai / frazės“. Šiame sąraše pateikiamos dažnai sutinkamos žodžių formos, kurias ekspertas įvardijo kaip nevartotinas. Šalia pateikto žodžio turi pateikti komentarą.

Registruoti naudotojai

Registruoti sistemos naudotojai gali papildomai siūlyti žodžius ekspertui kaip galimas naujoves ir peržiūrėti savo pasiūlytą „Kandidatų į kandidatus“ sąrašą.

Norėdamas pasiūlyti naują žodžio formą ekspertui, naudotojas turi paspausti mygtuką „Siūlyti kandidatą į naujoves“ ir atsidariusiame lange įrašyti žodžio formą. Tada paspaudus mygtuką „Analizuoti“, ši žodžio forma yra ieškoma Dabartinės lietuvių kalbos tekstyne ir Bendrajame internetiniame tekstyne (BIT). Jei žodis sistemai yra žinomas (pvz., „knygos“) tai naudotojui gražinamas rezultatas „knygos yra ne naujovė“ su dažnumais tekstynuose (žr. paveikslą apačioje), jei žodis galima naujovė, tai sistema naudotojui leidžia užregistruoti šią formą „Kandidatai į kandidatus“ sąraše.

Be to savo analizuojamai žodžio formai naudotojas gali sugeneruoti konkordansu BIT ir DLKT tekstynuose, taip pat patikrinti ją Bendrojoje lietuvių kalbos ontologijoje arba patikrinti ar tokios žodžio formos nėra Eurotermbanke. Šiems veiksmams atlikti naudotojas turi paspausti atitinkamus mygtukus.


„Kandidatai į kandidatus“. Šiame sąraše registruotas naudotojas gali peržiūrėti savo pasiūlytas kandidatus į naujoves. Sistemos ekspertas gali arba pašalinti šiuos žodžius arba perkelti į viešai matomą „Kandidatų į naujoves“ sąrašą.

Pastabos

1. Visų sąrašų sudėtį patvirtina ekspertas, remdamasis savo kompetencija, sistemos duomenimis ir sistemos naudotojų balsavimu.
2. Siūlomi kandidatai į naujoves, visų pirma, yra nauji kalbos analizės įrankiams, tačiau tai nebūtinai reiškia, kad siūlomos naujovės yra nauji kalboje atsiradę leksiniai vienetai. Atnaujinus kalbos analizės įrankius, šis sąrašas bus taip pat atnaujinamas.
3. Nustatytos naujovės yra tik informacinio pobūdžio. Taip siekiama atkreipti interneto žiniasklaidos skaitytojų, kalbos specialistų ir žmonių atsakingų už kalbos politikos formavimą dėmesį.
Vertinti

Paieška ontologijose SPARQL užklausomis

Paslauga leidžia atlikti SPARQL 1.1 SELECT tipo užklausas politikos, ekonomikos ir verslo, viešojo administravimo sričių ontologijose. Užklausas galima pasirinkti iš sąrašo arba parašyti savo. Užklausų rezultatas – ontologijos elementų tripletai.

Vertinti