Euskararen Erreferentzia Corpusean hartu du parte Aikor aldizkariak

Aikor aldizkaria 2025ko api. 1a, 10:46

Euskararen Erreferentzia Corpusa (EEC) aurkeztu zuen atzo, martxoak 31, Euskaltzaindiak. Helburua da EEC hizkuntza-, literatura- edo ikerketa-xedeetarako corpus estandar edo erreferente moduan erabiltzea, eta bere baitan azken 25 urteetako testuak jaso dira. Corpus irekia eta kolektiboa da, Euskaltzaindiak Euskal Herriko 68 erakunde pribatu eta publikorekin egin duelako. Haien artean daude gizarte-eragile asko eta hedabide nagusiak. Aikor aldizkariak ere hartu du parte.

EEC duela lau urte ipini zuen martxan Euskaltzaindiak. Izan ere, corpus handiagoa eta orekatuagoa izatea beharrezkotzat jo zuen, euskararen eguneroko erabilera ezagutzeko eta hizkuntza-teknologiek ekartzen dituzten erronkei aurre egiteko. EECn 123.124 dokumentu, 154,21 milioi testu-hitz eta 129.817 lema bildu dira, zeinak 2000. urtetik 2023. urtera bitartean euskaraz idatzitako edo ekoitzitako testuetatik hartu baitira. Testuak lematizatu eta sailkatu dira, lema, forma eta kategoria gramatikalen bidezko kontsultak egin ahal izateko. EEC https://eec.euskaltzaindia.eus webgunean dago eskuragarri. ECC urtero eguneratuko da, testuak gehitzeko, hutsuneak osatzeko eta ahalik eta erreferentzialtasunik handiena lortzeko.

ECC euskaraz idatzitako testuetan oinarrituta dago, batez ere bertsio elektronikoetan, eta momentuz ahozko transkripziorik ez badu ere, ahozkorako prestatutakoa biltzen du, hala nola telesailak, filmak eta gidoiak. Testuen % 48 liburuetatik hartu da; % 48, aldizkako argitalpenetik –Aikor, haien artean–; eta % 4, sarerako berariaz sortutako materialetik. Testuak bi sailetan sailkatu dira: fikzioa (% 25) eta ez fikzioa (% 75).