CROSSTEXT: Automatic Generation of Multilingual Semantic Processors

Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (eu): 
Etiketatzaile eleaniztasunak automatikoki sortzen
Etiketatzaile eleaniztasunak automatikoki sortzen
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (en): 
Automatic generation of multilingual semantic taggers
Deskribapena (en): 
The lack of hand curated data is a major impediment to developing statistical semantic processors for many of the world languages, including the 4 official languages of Spain. Our project aims at bridging this gap by leveraging existing annotations and semantic processors from multiple source languages by projecting their annotations via statistical word alignments traditionally used in Machine Translation. Furthermore, we will investigate and propose semi- and weakly-supervised techniques to induce robust semantic processors from the (potentially noisy) automatic generated data by the annotation transfer. In addition to addressing a novel and scarcely research problem in NLP, the semantic processors automatically generated in CrossText could then be deployed by public and private institutions to meet their technologies needs
Deskribapen motza, derrigorrezkoa proiektuak logorik ez badu (es): 
CROSSTEXT: Generación automática de procesadores semánticos.
Deskribapena (es): 
Este proyecto tiene como objetivo generar automáticamente procesadores semánticos multilingües mediante el uso de herramientas de Procesamiento del Lenguaje Natural (PLN) y corpus paralelos existentes para otros idiomas para su proyección mediante alineamientos de palabras (tradicionalmente usadas en Traducción Automática) a un idioma para el cual no se dispone de datos manualmente anotados. Además, se investigarán técnicas de semi-supervisión para inducir procesadores semánticos robustos a partir de los datos obtenidos mediante las proyecciones de varios idiomas origen.
Kode ofiziala: 
TIN2015-72646-EXP
Ikertzaile nagusia: 
German Rigau
Erakundea: 
Ministerio de Economía , Industria y Competitividad (Explora)
Hasiera data: 
2017/05/01
Bukaera data: 
2019/04/30
Taldeko ikertzaile nagusia: 
German Rigau
Kontratua: 
No
HiTZen ez bistaratu