Master Tesia

Tituloa: 
Testuak informazio gehigarriarekin aberasten, entitate-izenen ezagutze eta desanbiguazioa
Egilea: 
Ander Barrena
Laburpena: 
Laburpena Gaur egun, testu batean azaldu diren entitate-izenak identifikatu eta desanbiguatzea, lengoaia naturalaren prozesamenduko ezinbesteko ataza bihurtu da. Motibazio nagusiak izen hauek dagozkion entitatearekin lotzeak testuari ematen dion aberastasun eta ulergarritasuna dira. Lan honetan entitate-izenen desanbiguaziorako garatu diren hiru sistema ezberdin azalduko dira. Lehen sistema eredu probabilistiko batean oinarritua dago eta beste biak ikasketa automatikoko teknikak aplikatzen dituzte. Sistema guztiak desanbiguazio arloan erabilienak diren datu-multzoetan ebaluatu dira. Gainera artearen egoeran dauden sistemekin alderatuz garatu diren sistemen eraginkortasuna aztertu da emaitza onak lortuz. Abstract: Nowadays, named entity recognition and disambiguation is one of the growing tasks of natural language processing. The main motivation is text enrichment, by linking entity mentions to referent entities in a knowledge-base. In this project we have developed three systems for automatic recognition and linking. One of them is based on probabilistic ranking and the other two are based on machine learning classification. These algorithms were tested and evaluated in datasets of the state of the art obtainig good results.
Fitxategia: 
Tutorea: 
Eneko Agirre eta Aitor Soroa
Urtea: 
2013