Master Tesia

Tituloa: 
Agur-bertsoetako egitura diskurtsiboaren xerka. Ikasketa automatikoaren zein erregela linguistikoen bidezko hurbilketa sailkatzailea
Egilea: 
Mikel Osinalde Agirre
Laburpena: 
Bat-bateko bertsogintzan agur-bertsoek atal beregaina osatzen dute, baina elkarrekin partekatzen duten ezaugarririk ba ote dute? Ba al dago ezaugarri horietan oinarrituta bertso mota horren egitura narratibo jakina edo askotarikoari antzematerik? Galdera horien erantzunaren bila dihardu honako lanak, zeinak azterketa eta sailkapen helburuak besarkatzen dituen. Horretarako, bide-buruan jarri eta bi norantzatan ekin diogu azterketa lanari. Batik bat testu-sailkapen automatikorako teknikekin osatu da esperimentuen multzo nagusia. Bagenuen aurreuste bat, hots, ezaugarri linguistikoak baliatuta emaitza onak lor genitzakeela. Alabaina, ikasketa automatikorako teknikek sailkatzaile egokiak bilatzeko eskain ziezaguketen laguntza egiaztatzen saiatu gara. Bertsoak egoki sailkatze aldera gai-kategoriatzat proposatu ditugu zenbait erreferente eta ideia; ondoren, aztergai ditugun hainbat bertso sorta analizatzeko baliatu ditugu aurrez zehaztutako kategoria horiek, egin ere, ikasketa automatikoko teknikak erabilita. Naive Bayes, k-NN, BayesNet, Support Vector Machines eta Decision Tree Learner sailkatze- algoritmoak hautatu ditugu eginkizuna burutzeko. Orobat, dimentsio-murrizte teknikak ezarri izan dira terminoek osatzen zuten eremua mehaztu eta egokitze aldera. Esperimentuetan erdietsitako emaitzek proposatutako hurbilketaren egokitasuna erabat baztertzen ez duten arren, bidea findu beharra iradokitzen dute eta aukera berrietarako abiapuntua zedarritzen. Bestalde, hasierako usteei oinarri sendoagoak ezartzeko aukera ere izan dugu. Etiketatutako bertso-puntuen behaketaren ostean, klaseak harrapatzeko zenbait hizkuntza-ezaugarri partekatu erauzi ditugu. Ondoren haien gainean erregelak sortu, eta azkenik, aurretiaz burututako lanaren pareko emaitzak lortzeko gai izan garela egiaztatu dugu.
Tutorea: 
Bertol Arrieta eta Mikel Lersundi
Urtea: 
2013