EDIEC

Deskribapen laburra: 
Euskararako Desanbiguatutako Izendun Entitateen Corpusa
Harremanetarako: 
n.ezeiza[abildua/at]ehu.es
Deskribapena: 

Euskararako Desanbiguatutako Izendun Entitateen Corpusa (EDIEC)
euskarazko 1032 testu-dokumentuez osatutako corpus bat da, izendun
entitateak eskuz desanbiguatuta dituena. Dokumentuak 2002. urteko
Euskaldunon Egungariako albisteen zatiak dira.



EDIEC corpusa eratzeko gutxienez entitate bat duten albisteen
paragrafoak hartu dira. Ondoren, corpuseko entitateak eskuz
desanbiguatu dira, izendun entitate bakoitzaren agerpen bakoitza
zegokion Wikipedia sarrerarekin lotuaz.

Berrikuntza: 

Lehenengo euskarazko corpusa izendun entitateak eskuz desanbiguatuta dituena

Jabetza: 
Copyright (C) by IXA Taldea, University of the Basque Country UPV/EHU
Lizentzia: 
Creative Commons Attribution 4.0 International License (CC BY 4.0)