Protágoras: Desarrollo de algoritmos de procesamiento de lenguaje natural para el desarrollo de un motor cognitivo.

Deskribapen motza (eu): 
Protágoras: Motor kognitibo bat garatzeko hizkuntza prozesamenduko algoritmoak

Indra-BPO unitateak hainbat enpresari haien dokumentazioaren alde administratiboaren kudeaketa egiten die, eta hau horrela, eskuz erauzitako informazioa duten milaka dokumentu ditu bere baitan. Informazioa dokumentuetatik eskuz erauzteak lan handia da eta gainera, oso garestia. Kontratu honen bitartez garatu den sistemaren helburua, eskuz egiten den lan hori osorik edo zati batean, automatizatzea da.

Erabilpen-kasu zehatza honakoa izan da: notario-dokumentuetatik, hipotekekin zerikusia duten ohar soiletatik, hain zuzen ere, hainbat eremuri dagokion informazioa automatikoki erauztea. Adibidez, eraikin baten eroslea zein izan den, saltzailea, notarioaren izena, eraikin mota etab. Gaur egun dokumentuak irakurri egiten ditu Indra-ko langilegoak, eremu hauek eskuz identifikatzen ditu eta Indra-BPOk informazioa biltegiratzeko prestatua duen aplikazio batean sartzen ditu eremuen balioak.

Kontratuan garatu den sistemak emaitza onak lortu ditu eta aplikazio errealetan erabil daitekeela uste dugu. Eremu kritikoetarako %80eko estaldura eta doitasuna lortu ditu eta hauen erauzketan %75eko f-neurria. Izenak eta datak dituzten eremuen erauzketan sistemak %90ko doitasuna lortzen du.

Deskribapen motza (en): 
Protagoras: Development of natural language processing algorithms for the development of a cognitive engine.
Deskribapena (en): 

Indra-BPO gives service to other companies managing their documentary backoffice and it stores thousands of manually extracted documents. This information extraction process is very laborious and expensive. The main objective of Protágoras has been to partially automate this manual work.

The use-case has been the following: to extract the relevant information from notarial documents, from the certificates issued by the real estate registries related to mortgages, information related to buyers, sellers, properties, the notary and so on. Nowadays, Indra’s employees read the documents, identify the information by hand and introduce it in an application.

In our opinion the system developed by means of this contract can be used in real applications. A recall and precision of 80% was obtained for the critical fields with an f-score of 75% in the extraction. In the fields containing names and dates, the systems achieves a 90% of precision.

Deskribapen motza (es): 
Protágoras: Desarrollo de algoritmos de procesamiento de lenguaje natural para el desarrollo de un motor cognitivo.
Deskribapen motza (fr): 
Protagoras : Développement d'algorithmes de traitement du langage naturel pour le développement d'un moteur cognitif.
Kode ofiziala: 
x
Ikertzaile nagusia: 
Maite Oronoz
Erakundea: 
Indra Sistemas S.A.
Hasiera data: 
2017/12/15
Bukaera data: 
2018/12/15
Taldea: 
ixa
Taldeko ikertzaile nagusia: 
Maite Oronoz
Kontratua: 
Bai
HiTZ