DoQA
Deskribapen laburra:
Ingelesezko elkarrizketa bidezko galdera-erantzunen datu-multzoa
Egileak (ixakideak):
Egileak (ixakideak ez direnak):
Jan Deriu, Mark Cieliebak
Esteka (deskarga):
Esteka (beste batzuk):
To download older versions:
http://ixa2.si.ehu.es/convai/doqa-v1.0.zip
Available at Hugging Face: https://huggingface.co/datasets/doqa
Available at Hugging Face: https://huggingface.co/datasets/doqa
Harremanetarako:
Jon Ander Campos jonander.campos[abildua/at]ehu.eus
Deskribapena:
DoQA elkarrizketa bidezko galdera-erantzunek osatzen duten datu-multzoa da. Domeinu espezifikoetako FAQ webguneak (Frequently Asked Questions edo maiz egiten diren galderak) edo foroak atzitzeko balio duten 2.437 elkarrizketa ditu (10.917 galdera/erantzun pare guztira), 3 domeinu ezberdinetakoak: sukaldaritza, bidaiak eta filmak.
Elkarrizketa hauek crowd workder deritzenek sortu dituzte, binaka rol hauek hartuz: erabiltzaileak Stack Exchange foroan (https://stackexchange.com/) idatzitako gai jakin bati buruzko galderak egiten ditu, eta adituak galderei erantzuten die jatorrizko artikuluko testutik zati labur bat hautatuz. Hautatutako testu-zatia berridatzi dezake adituak, naturalagoa izan dadin. Datu-multzoan erantzunik gabeko galdera batzuk ere badaude.
Tresna hau erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:
J.A. Campos, A. Otegi, A. Soroa, J. Deriu, M. Cieliebak, E. Agirre. DoQA - Accessing Domain-Specific FAQs via Conversational QA. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 7302–7314. 2020.Datu-multzo honen bertsio zaharrago bat ere (v1.0) eskuragarri dago (ikus esteka goian). Kasu horretan lan honen aipamena egin beharko zenuke:
J.A. Campos, A. Otegi, A. Soroa, J. Deriu, M. Cieliebak, E. Agirre. Conversational QA for FAQs. Proceedings of NeurIPS 3rd Conversational AI Workshop: Today's Practice and Tomorrow's Potential. 2019.
Argitalpenak (artikuluak):
Jabetza:
Copyright (C) by Ixa Taldea, University of the Basque Country UPV/EHU
Lizentzia:
Creative Commons Attribution-ShareAlike 4.0 International Public License (CC BY-SA 4.0)