Language Technology (in general)

Verb+Noun Multiword Expressions: A linguistic analysis for identification and translation

Multiword Expressions (MWEs) are combinations of words which exhibit some kind of idiosyncrasy. Due to their idiosyncratic nature, they pose several problems to Natural Language Processing (NLP). In this PhD, two of the most challenging tasks concerning MWE processing are addressed: the automatic identification of MWE occurrences in corpora and their translation in Machine Translation (MT).

Aditza+izena Unitate Fraseologikoak gaztelaniatik euskarara: azterketa eta tratamendu konputazionala

Unitate Fraseologikoak (UFak) hizkuntzek bere-bereak dituzten hitz-konbinazio idiomatikoak dira. Hizkuntzaren Prozesamenduko (HPko) tresnek kalitatezko emaitzak izan ditzaten, beharrezkoa da halakoak ondo tratatzea, baina lan horrek hainbat zailtasun ditu; besteak beste, hitzez hitzeko itzulgarritasun eza. Tesi-lan honetan, aditza+izena motako UFen azterketa linguistiko bat egin dugu, halakoek HPren alorrean sortzen dituzten bi arazo garrantzitsuri aurre egiten laguntzeko: batetik, corpusetan UFak automatikoki identifikatzeari, eta bestetik, UF horiek gaztelaniaren eta euskararen

LINGUATEC: Desarrollo de recursos lingüı́sticos para avanzar en la digitalización de las lenguas de los Pirineos

El objetivo del proyecto es desarrollar, probar y difundir nuevos recursos, nuevas herramientas y aplicaciones lingüı́sticas innovadoras para mejorar el nivel de digitalización del aragonés, vasco y occitano.

Literal occurrences of Multiword Expressions: rare birds that cause a stir

Multiword expressions can have both idiomatic and literal occurrences. For instance pulling strings can be understood either as making use of one’s influence, or literally. Distinguishing these two cases has been addressed in linguistics and psycholinguistics studies, and is also considered one of the major challenges in MWE processing. We suggest that literal occurrences should be considered in both semantic and syntactic terms, which motivates their study in a treebank.

Unitate Fraseologikoen agerpen literalak, urre baina urri

Unitate fraseologiko asko idiomatikoki eta literalki uler daitezke. Esate baterako, ziria sartzeak bi esanahi
izan ditzake testuinguruaren arabera: norbaiti iruzur egitea edo nonbait ziri bat sartzea literalki. Lan honetan,
corpusetan oinarritutako azterketa eleaniztun baten berri emango dugu, eta erakutsiko dugu, batetik, halako
hitz-konbinazioak oso gutxitan erabiltzen direla literalki praktikan, eta bestetik, idiomatiko-literal bereizketa

Zer i(ra)kas dezakegu geure corpusekin "jolastuz"?

Hizkuntzak ikasteko askotariko metodologiak erabili izan dira: metodo zuzena, itzulpen metodoa, metodo audiolinguala, metodo komunikatiboa, hurbilpen lexikoa, ariketetan oinarritutako metodoa, ikasleen erroreetan oinarritutakoa edota metodo eklektikoak. Azken urteotan, berriz, corpusekin «jolasteak» hizkuntzak modu esanguratsuan i(ra)kasteko aukerak eskaintzen dizkigunaren ustean gaude.

Tresna digitalak hizkuntzak eta gramatikak ikertzeko eta irakasteko

Hitzaldi honetan hizkuntzak eta gramatikak ikertzeko eta i(ra)kasteko baliabide ezberdinak aurkezten ditugu.

Hizkuntza-teknologiaren abagunea. Euskara jalgi hadi teknologiara, jalgi hadi mundu

2017an Eusko Jaurlaritzara bidalia eta geroago oinarria izan zen Ixa Taldeko Iñaki Alegriak eta Xabier Artolak EAEko Legebiltzarrean 2018ko apirilaren 16an egin zuten agerraldirako, Kultura, Euskara eta Kirol Batzordearen aurrean, “Euskara eta hizkuntza-teknologiak: egungo egoera eta zenbait proposamen”.
Txostena eskuragarri dago hemen: http://www.legebiltzarra.eus/irud/11/00/009531.pdf

Euskara (batua) ingurune digitalean: bidean ikasiXa eta etorkizuneko erronkak

Euskara batuaren etorkizuneko erronkak ingurune digitalean: horra Euskaltzaindiak Ixa Taldekooi paratu zigun gaia, Arantzazun 2018ko urrian egin zen biltzarrera gonbidatu gintuelarik. Ondorio hauek ateratzen ditugu artikuluan:
- Hizkuntza‐teknologien arloak garrantzi estrategikoa du hizkuntzaren etorkizunari begira.
- Hizkuntza-teknologia ardatz bat izango da Europan datozen urteetan, eta inbertsioak egingo dira; Espainian bada dagoeneko - plan bat, diruz ondo hornitua, eta Euskal Herrian ere pareko zerbait beharko genuke berandu baino lehen.

Pages

Subscribe to RSS - Language Technology (in general)