EPEC-DEP (BDT)
Deskribapen laburra:
A syntactic corpus tagged using the Dependency Grammar Theory
Egileak (ixakideak):
Esteka (deskarga):
Harremanetarako:
maxux.aranzabe[abildua/at]ehu.es
Deskribapena:
The Basque Dependency Treebank EPEC is the reference corpus for the processing of Basque.
EPEC is a 300,000 word corpus of standard written journal texts which aims to be a training corpus for the development and inprovement of several Natural Language Procesing tools.
It has been manually tagged at different levels: morphology, partial syntax and semantic.
EPEC is a 300,000 word corpus of standard written journal texts which aims to be a training corpus for the development and inprovement of several Natural Language Procesing tools.
It has been manually tagged at different levels: morphology, partial syntax and semantic.
Funtzionalitatea:
Conference on Computational Natural Language Learning (CoNLL 2007) lehiaketan metodo edo sistema berrien probaleku; euskarako MaltIxa analizatzaile estatistikoaren oinarri; ezagutza linguistikoan oinarritutako analizatzaile sintaktikoaren oinarri; EusPropBank, semantikoki etiketatutako EPEC corpusaren oinarri
Berrikuntza:
Dependentzia Gramatikaren Teorian oinarrituta euskaraz sintaktikoki etiketatu den lehen corpusa edo treebank-a da.
Ereduzko patroia da ikerketa linguistikoetan eta hizkuntzaren prozesamenduan.
Ereduzko patroia da ikerketa linguistikoetan eta hizkuntzaren prozesamenduan.
Argitalpenak (tesiak):
Argitalpenak (artikuluak):