
Leveraging SNOMED CT terms and relations for machine translation of clinical texts from Basque to Spanish

We present a method for machine translation of clinical texts without using bilingual clinical texts, leveraging the rich terminology and structure of the Systematized Nomenclature of Medicine – Clinical Terms (SNOMED CT), which is considered the most comprehensive, multilingual clinical health care terminology collection in the world. We evaluate our method for Basque to Spanish translation, comparing the performance with and without using clinical domain resources.

Multilingual segmentation based on neural networks and pre-trained word embeddings

The DISPRT 2019 workshop has organized a shared task aiming to identify cross-formalism and multilingual discourse segments. Elementary Discourse Units (EDUs) are quite similar across different theories. Segmentation is the very first stage on the way of rhetorical annotation. Still, each annotation project adopted several decisions with consequences not only on the annotation of the relational discourse structure but also at the segmentation stage. In this shared task, we have employed pre-trained word embeddings, neural networks (BiLSTM+CRF) to perform the segmentation.

Ipuin-moldaketa herri-hizkerara egokitzeko, aldatzeko eta modu esanguratsuan kontatzeko markaketa: Ahozko komunikazioa lantzen eta aztertzen Haur Hezkuntzako gelan

Lan honetan Martin Txiki eta Basajaunak ipuinaren irakurketa ozen esanguratsuak talde zehatz bateko haurren hizkuntza- eta komunikazio-gaitasunean izan duen eragin zuzena aztertu da, beren beregi diseinatutako esku-hartze eta ikerketa baten bidez. Zehatzago, ipuina bizkaierara moldatu da eta Mungiako Legarda HLHI ikastetxeko Haur Hezkuntzako 4 urteko gela batean irakurri da, horrek haurrek duten euskalkiaren ezagutzan eta egiten duten erabileran duen eragina aztertzeko. Esku-hartzea egiteko lan moldea konstruktibismoan oinarritu da.

Hizkuntza-teknologiaren abagunea. Euskara jalgi hadi teknologiara, jalgi hadi mundu

2017an Eusko Jaurlaritzara bidalia eta geroago oinarria izan zen Ixa Taldeko Iñaki Alegriak eta Xabier Artolak EAEko Legebiltzarrean 2018ko apirilaren 16an egin zuten agerraldirako, Kultura, Euskara eta Kirol Batzordearen aurrean, “Euskara eta hizkuntza-teknologiak: egungo egoera eta zenbait proposamen”. Txostena eskuragarri dago hemen:

Ayuda de las tecnologı́as lingüı́sticas en la investigación en Humanidades Digitales

El acercamiento digital al estudio de las humanidades ofrece nuevas oportunidades para la colaboración, la reutilización de herramientas y la difusión multimodal de estos estudios. Nuevas actividades, objetos de estudio y técnicas de investigación han propiciado nuevas formas para leer, escribir, revisar, buscar, ordenar, describir y enseñar. Todo esto puede suponer un hándicap considerable en la inmersión de las Humanidades Digitales, pero el uso de las tecnologı́as lingüı́sticas y la ayuda o colaboración de las infraestructuras en humanidades como CLARIN

The ADAPT System Description for the IWSLT 2018 Basque to English Translation Task

In this paper we present the ADAPT system built for the Basque to English Low Resource MT Evaluation Campaign. Basque is a low-resourced, morphologically-rich language. This poses a challenge for Neural Machine Translation models which usually achieve better performance when trained with large sets of data.


