ElkarHizketak

Deskribapen laburra: 
Euskarazko elkarrizketa bidezko galdera-erantzunen datu-multzoa
Egileak (ixakideak ez direnak): 
Aitor Agirre
Harremanetarako: 
Arantxa Otegi - arantza.otegi[abildua/at]ehu.eus
Deskribapena: 

ElkarHizketak euskarazko elkarrizketa bidezko galdera-erantzunen datu-multzoa da, euskal hiztun boluntarioek sortua. Datu-multzoak ia 400 elkarrizketa eta 1600 galdera baino gehiago ditu. Tamaina txiki horrek baliabide urriko eszenario erreal bat eskaintzen du elkarrizketa bidezko galdera-erantzun sistemetarako.

Datu-multzoa jende edo erakunde ezagunen Wikipediako artikuluetako ataletan oinarritzen da. Elkarrizketa bakoitzak 2 pertsonen artean sortu da: (1) ikasleak galderak egiten ditu pertsonaiaren inguruko sarrera motz bat irakurri ondoren, baina atalari dagokion testua ikusi gabe; eta (2) irakasleak galderak erantzuten ditu ataleko testutik testu zatiak aukeratuz.

Datu-multzoa hiru JSON fitxategitan banatzen da, lehenengoa entrenamendu fasean erabilteko (train fitxategia), bigarrena doiketarako (dev) eta, azkena, ebaluatzeko (test).

Jabetza: 
Copyright (C) by Ixa Taldea, University of the Basque Country UPV/EHU
Lizentzia: 
Creative Commons Attribution-ShareAlike 4.0 International Public License (CC BY-SA 4.0)