Vardų distribucijos tyrimas statistikos metodais

2016-08-19, Ina Klijūnaitė, Aurimas Nausėda
Straipsnio naujumas sietinas su lietuviškų ir lotyniškų vardų funkcionavimo intensyvumu distribucijose, kurių leksinė sudėtis apibūdinama matematinės kalbotyros (lingvostatistinės analizės) rezultatais. Distribucijos tyrimas statistikos metodais padeda nustatyti leksemų vietą kalbos leksinėje sistemoje (santykinį centrą ir periferiją). Tyrimo rezultatai rodo, kokie būna dažniausi ir rečiausi pastovūs junginiai, arba kolokacijos, vardų distribucijose.
Distribucijų leksinės sudėties ašis yra pasirinktasis vardas, kuris suponuoja žodžių atrankos negriežtas, kartais visiškai laisvas ribas. Pavyzdžiui, jeigu teikiamas vardas Šarūnas, tai pastarojo dešimtmečio tekstuose ir, suprantama, tekstynų kai kuriose dalyse (tarkim, periodikoje) labai tikėtina, jog bus pavartotos pavardės Jasikevičius, Marčiulionis; leksemos krepšinio, lenta, komandinis, žaidimas ir pan.
Tyrimui laisvai parinktos trumpos moterų ir vyrų vardų sekos:
1) lietuvių: Audronė, Aušra, Birutė, Eglė, Jūratė; Algirdas, Gediminas, Giedrius, Jogaila, Mindaugas, Šarūnas, Vytautas;
2) lotynų: Akvilė, Diana, Kristina, Patricija,Viktorija; Dominykas, Donatas, Modestas, Paulius, Remigijus.
Vardų distribucijų leksika buvo imama iš didelės imties enciklopedinių tekstų ar tekstynų (DLKT). Vardai ir su jais susietos leksemos diferencijuotos pagal funkcionavimo intensyvumą – dažninį vartojimą (centrą ir periferiją) originalios (savarankiškai sumanytos bei realizuotos) kompiuterinės programos pagrindu.
Iš duomenų matyti, jog lietuviški vardai vartojami daug intensyviau negu lotyniški skolinti vardai. Todėl pastarųjų distribucijos leksikos apimtys daugeliu atvejų reiškiamos mažesniais suminiais skaičiais. Intuityviai sunkoka nusakyti, koks konkretus vardas vartojamas dažniau arba rečiau.
Remiantis statistine analize nustatyta, kad raštuose dažniausiai aptinkami lietuviškos kilmės vardai yra Vytautas, Algirdas, Gediminas, Mindaugas, Eglė, Aušra, Jūratė. Tačiau taip pat labai dažni kai kurie seniai vartojami skolintiniai lotynų kalbos vardai: Paulius, Kristina, Viktorija, Donatas, Diana. Retai vartojami Patricija, Dominykas, Akvilė, Modestas.
Lingvostatistinė vardų distribucijų analizė parodė, jog šaltinių medžiaga turėtų būti nuolatos atnaujinama
(ne rečiau kaip kas 5–10 metų), nes leksikos dinamika nuolat kinta, atsinaujina ir (arba) gausėja profesinė terminija, ypač šnekamosios ir kompiuterinės kalbos elementai.

Visą straipsnį žr.: Klijūnaitė I., Nausėda A. Vardų distribucijos tyrimas statistikos metodais / Jaunųjų mokslininkų darbai, 2010, Nr. 2 (27), p. 81–86. (Skelbiama iš duomenų bazės Lituanistika.)

Apie projektą

Projektas skirtas Lietuvos Respublikos piliečių vardams įvertinti normos aspektu, vardai sukirčiuojami, iš nerekomenduojamų vardų kreipiama į teiktinus, trumpai nusakoma jų kilmė. Duomenų šaltinis – Lietuvos Respublikos gyventojų registras: vardų sąvado pagrindas – 2006 m. pilietybę turėjusių asmenų vardai, toliau pildoma naujagimių vardais (sąvadas ir registras tiesiogiai nesusieti). VLKK iniciatyva vardus nagrinėja Vilniaus universiteto tyrėjai, probleminius klausimus svarsto Kalbos komisijos Vardyno pakomisė. Jus kviečiame pasakoti, kaip gavote vardą, kaip išrinkote savo vaikams, taip pat visas kitas su vardais susijusias istorijas.

Remiantis šios svetainės medžiaga būtina nurodyti svetainės adresą: Lietuvos Respublikos piliečių vardų sąvadas, VLKK. Prieiga internete http://vardai.vlkk.lt. (Žiūrėta [data]). Draudžiama svetainę ar jos dalį susieti su kitais interneto šaltiniais, jei tai sudarytų klaidingą įspūdį dėl svetainės autorystės ar administravimo.