Hizkuntza-ulermenari ekarpenak: n-gramen arteko atentzio eta lerrokatzeak antzekotasun eta inferentzia interpretagarrirako

Hizkuntzaren Prozesamenduaren bitartez hezkuntzaren alorreko sistema adi-
mendunak hobetzea posible da, ikasleen eta irakasleen lan-karga nabarmenki
arinduz. Tesi honetan esaldi-mailako hizkuntza-ulermena aztertu eta propo-
samen berrien bitartez sistema adimendunen hizkuntza-ulermena areagotzen
dugu, sistemei erabiltzailearen esaldiak modu zehatzagoan interpretatzeko
gaitasuna emanez. Esaldiak modu finean interpretatzeko gaitasunak feed-
back a modu automatikoan sortzeko aukera ematen baitu.

Tesi hau garatzeko hizkuntza-ulermenean sakondu dugu antzekotasun seman-
tikoari eta inferentzia logikoari dagokien ezaugarriak eta sistemak aztertuz.
Bereziki, esaldi barneko hitzak multzotan egituratuz eta lerrokatuz esaldiak
hobeto modelatu daitezkeela erakutsi dugu. Horretarako, hitz solteak lerro-
katzen dituen aurrekarien egoerako neurona-sare sistema bat inplementatu
eta n-grama arbitrarioak lerrokatzeko moldaketak egin ditugu. Hitzen arte-
ko lerrokatzea aspalditik ezaguna bada ere, tesi honek, lehen aldiz, n-grama
arbitrarioak atentzio-mekanismo baten bitartez lerrokatzeko propo-
samenak plazaratzen ditu.

Gainera, esaldien arteko antzekotasunak eta desberdintasunak modu zeha-
tzean identifikatzeko, esaldien interpretagarritasuna areagotzeko eta ikasleei
feedback zehatza emateko geruza berri bat sortu dugu: iSTS. Antzekota-
sun semantikoa eta inferentzia logikoa biltzen dituen geruza horrekin
chunk ak lerrokatu ditugu, eta ikasleei feedback zehatza emateko gai izan
garela frogatu dugu hezkuntzaren testuinguruko bi ebaluazio-eszenariotan.

Tesi honekin batera hainbat sistema eta datu-multzo argitaratu dira etorki-
zunean komunitate zientifikoak ikertzen jarrai dezan.

Saying no but meaning yes: negation and sentiment analysis in Basque

In this work, we have analyzed the effects of negation on the semantic orientation in Basque. The analysis shows that negation markers can strengthen, weaken or have no effect on sentiment orientation of a word or a group of words. Using the Constraint Grammar formalism, we have designed and evaluated a set of linguistic rules to formalize these three phenomena. The results show that two phenomena, strengthening and no change, have been identified accurately and the third one, weakening, with acceptable results.

The ADAPT System Description for the IWSLT 2018 Basque to English Translation Task

In this paper we present the ADAPT system built for the Basque to English Low Resource MT Evaluation Campaign. Basque is a low-resourced, morphologically-rich language. This poses a challenge for Neural Machine Translation models which usually achieve better performance when trained with large sets of data.

Hizkuntza-teknologia: aukera bat

- Hizkuntza Teknologia: erabilera arrakastatsu batzuk - Sustatzeko politikak Europan eta Espainian. - Zein dira hurrengo urteetako erronka nagusiak?

Orriak

Ixa taldea RSS-rako harpidetza egin