EPEC-DEP (BDT)

Short description: 
A syntactic corpus tagged using the Dependency Grammar Theory
Contact: 
maxux.aranzabe[abildua/at]ehu.es
Description: 
The Basque Dependency Treebank EPEC is the reference corpus for the processing of Basque.
EPEC is a 300,000 word corpus of standard written journal texts which aims to be a training corpus for the development and inprovement of several Natural Language Procesing tools.
It has been manually tagged at different levels: morphology, partial syntax and semantic.
Functionality: 
Conference on Computational Natural Language Learning (CoNLL 2007) lehiaketan metodo edo sistema berrien probaleku; euskarako MaltIxa analizatzaile estatistikoaren oinarri; ezagutza linguistikoan oinarritutako analizatzaile sintaktikoaren oinarri; EusPropBank, semantikoki etiketatutako EPEC corpusaren oinarri
Innovation: 
Dependentzia Gramatikaren Teorian oinarrituta euskaraz sintaktikoki etiketatu den lehen corpusa edo treebank-a da.
Ereduzko patroia da ikerketa linguistikoetan eta hizkuntzaren prozesamenduan.
Publications (papers):