Master Tesia

Tituloa: 
Euskararako aipamen-detektatzailea: korreferentzia-ebazpenerako sistema baten lehen urratsak
Egilea: 
Ander Soraluze Irureta
Laburpena: 
Master bukaerako proiektu honetan, euskarazko korreferentzia-ebazpena gauzatzeko sortu nahi den sistema baten garapenean egindako lehen urratsak azaltzen dira. Lehen pauso bezala, aipamenen azterketa linguistiko batean oinarritutako aipamen-detektatzailea aurkezten dugu. Sistema euskaraz idatzitako testuetan korreferentzia-kateetako partaide izan daitezkeen aipamenak detektatzeko gai da. Aipamen-detektatzailea erregelatan oinarritutakoa da, eta egoera nituko teknologia erabiliz inplementatu da. % 77,58ko F-measure balioa lortzen duExact Matching ebaluazio-irizpidea erabiliz, eta % 82,81koa, berriz, Lenient Matching erabiltzean. Aipamen-detektatzaileari aplikazio erreal bat eman nahi izan zaio. Horretarako EPEC corpusa automatikoki etiketatu da eta detektatuko aipamenak MMAX2 etiketatze tresnan erabiltzeko prestatu dira. Abstract This paper presents the rst steps in the development of a Basque coreference resolution system. We propose a mention detector system based on a linguistic study of the nature of mentions. The system identi es mentions that are potential candidates to be part of coreference chains in Basque written texts. The mention detector is rule-based and has been implemented using nite state technology. It achieves a F-measure of 77.58% under the Exact Matching protocol and of 82.81% under Lenient Matching. The mention detector has been used to automatically tag an EPEC corpus with mentions, for later use them in MMAX2 annotation tool.
Tutorea: 
Xabier Arregi Iparragirre eta Olatz Arregi Uriarte
Urtea: 
2012