EEC duela lau urte ipini zuen martxan Euskaltzaindiak. Izan ere, corpus handiagoa eta orekatuagoa izatea beharrezkotzat jo zuen, euskararen eguneroko erabilera ezagutzeko eta hizkuntza-teknologiek ekartzen dituzten erronkei aurre egiteko. EECn 123.124 dokumentu, 154,21 milioi testu-hitz eta 129.817 lema bildu dira, zeinak 2000. urtetik 2023. urtera bitartean euskaraz idatzitako edo ekoitzitako testuetatik hartu baitira. Testuak lematizatu eta sailkatu dira, lema, forma eta kategoria gramatikalen bidezko kontsultak egin ahal izateko. EEC https://eec.euskaltzaindia.eus webgunean dago eskuragarri. ECC urtero eguneratuko da, testuak gehitzeko, hutsuneak osatzeko eta ahalik eta erreferentzialtasunik handiena lortzeko.
ECC euskaraz idatzitako testuetan oinarrituta dago, batez ere bertsio elektronikoetan, eta momentuz ahozko transkripziorik ez badu ere, ahozkorako prestatutakoa biltzen du, hala nola telesailak, filmak eta gidoiak. Testuen % 48 liburuetatik hartu da; % 48, aldizkako argitalpenetik –Aikor, haien artean–; eta % 4, sarerako berariaz sortutako materialetik. Testuak bi sailetan sailkatu dira: fikzioa (% 25) eta ez fikzioa (% 75).