Vardų distribucijos tyrimas statistikos metodais
2016-08-19, Ina Klijūnaitė, Aurimas NausėdaStraipsnio naujumas sietinas su lietuviškų ir lotyniškų vardų funkcionavimo intensyvumu distribucijose, kurių leksinė sudėtis apibūdinama matematinės kalbotyros (lingvostatistinės analizės) rezultatais. Distribucijos tyrimas statistikos metodais padeda nustatyti leksemų vietą kalbos leksinėje sistemoje (santykinį centrą ir periferiją). Tyrimo rezultatai rodo, kokie būna dažniausi ir rečiausi pastovūs junginiai, arba kolokacijos, vardų distribucijose.
Distribucijų leksinės sudėties ašis yra pasirinktasis vardas, kuris suponuoja žodžių atrankos negriežtas, kartais visiškai laisvas ribas. Pavyzdžiui, jeigu teikiamas vardas Šarūnas, tai pastarojo dešimtmečio tekstuose ir, suprantama, tekstynų kai kuriose dalyse (tarkim, periodikoje) labai tikėtina, jog bus pavartotos pavardės Jasikevičius, Marčiulionis; leksemos krepšinio, lenta, komandinis, žaidimas ir pan.
Tyrimui laisvai parinktos trumpos moterų ir vyrų vardų sekos:
1) lietuvių: Audronė, Aušra, Birutė, Eglė, Jūratė; Algirdas, Gediminas, Giedrius, Jogaila, Mindaugas, Šarūnas, Vytautas;
2) lotynų: Akvilė, Diana, Kristina, Patricija,Viktorija; Dominykas, Donatas, Modestas, Paulius, Remigijus.
Vardų distribucijų leksika buvo imama iš didelės imties enciklopedinių tekstų ar tekstynų (DLKT). Vardai ir su jais susietos leksemos diferencijuotos pagal funkcionavimo intensyvumą – dažninį vartojimą (centrą ir periferiją) originalios (savarankiškai sumanytos bei realizuotos) kompiuterinės programos pagrindu.
Iš duomenų matyti, jog lietuviški vardai vartojami daug intensyviau negu lotyniški skolinti vardai. Todėl pastarųjų distribucijos leksikos apimtys daugeliu atvejų reiškiamos mažesniais suminiais skaičiais. Intuityviai sunkoka nusakyti, koks konkretus vardas vartojamas dažniau arba rečiau.
Remiantis statistine analize nustatyta, kad raštuose dažniausiai aptinkami lietuviškos kilmės vardai yra Vytautas, Algirdas, Gediminas, Mindaugas, Eglė, Aušra, Jūratė. Tačiau taip pat labai dažni kai kurie seniai vartojami skolintiniai lotynų kalbos vardai: Paulius, Kristina, Viktorija, Donatas, Diana. Retai vartojami Patricija, Dominykas, Akvilė, Modestas.
Lingvostatistinė vardų distribucijų analizė parodė, jog šaltinių medžiaga turėtų būti nuolatos atnaujinama
(ne rečiau kaip kas 5–10 metų), nes leksikos dinamika nuolat kinta, atsinaujina ir (arba) gausėja profesinė terminija, ypač šnekamosios ir kompiuterinės kalbos elementai.
Visą straipsnį žr.: Klijūnaitė I., Nausėda A. Vardų distribucijos tyrimas statistikos metodais / Jaunųjų mokslininkų darbai, 2010, Nr. 2 (27), p. 81–86. (Skelbiama iš duomenų bazės Lituanistika.)
Susiję vardai:
Akvìlė,
Al̃girdas,
Aušrà,
Dianà,
Dominỹkas,
Donãtas,
Ẽglė,
Gedimìnas,
Jūrãtė,
Kristinà,
Mìndaugas,
Modèstas,
Patrìcija,
Paũlius,
Viktòrija,
Výtautas