EUSMT

Deskribapen laburra: 
Itzulpen automatiko estatistikoa euskararako
Esteka (orokorra): 
Harremanetarako: 
gora.labaka[abildua/at]ehu.es
Deskribapena: 
Hitzen segmentazioa eta berrordenaketa erabiltzen da itzulpen estatistikoan espainieratik euskarara itzultzeko.
Horri esker %10eko hobekuntza lortzen da HTER metrikarekin ebaluatzen denean.

(1) Hitzak segmentatzea. Lemak eta atzizkiak banatzea. Lau modu desberdin aztertu ditu, horrela ez-ohiko hitz-formen arazoa bideratzeko.

(2) Erdarazko hitzak berrordenatzea. Izen-sintagmaren mailan eta esaldi mailan. beren ordainek euskaraz izango duten ordenara erakarriz. Berrantolaketa hau oso lagungarria izaten zaio dekodetzaile estatistikoari itzulpen egokiak bilatzerakoan.