HP eta ordenagailuz lagundutako ikasketa

IGARRITZ: euskarazko testu iragarpenerako web ingurune egokitua

Motrizitate mugatua duten ikasleek, garun paralisi batek sorturiko muga dutenek adibidez, tresna egokituak izaten dituzte testuak idazteko; esaterako, begiradaren jarraipeneko hardware bat, zeinarekin ordenagailuan letrak aukeratu eta sistemak iragartzen dituen hitzak aukeratu daitezkeen. Sistema hauek euskaraz idazteko baliabideak izaten dituzte, edo euskarazko hitz zerrendak sartuta iragarpenak aukeratzeko abagunea ematen dute. Edozein testu iragarpenen xedea da testua idazteko esfortzua murriztea, baita testu luzeagoak azkarrago idatzi ahal izatea ere.

Latxa: An Open Language Model and Evaluation Suite for Basque

We introduce Latxa, a family of large language models for Basque ranging from 7 to 70 billion parameters. Latxa is based on Llama 2, which we continue pretraining on a new Basque corpus comprising 4.3M documents and 4.2B tokens.

XNLIeu: a dataset for cross-lingual NLI in Basque

XNLI is a popular Natural Language Inference (NLI) benchmark widely used to evaluate cross-lingual Natural Language Understanding (NLU) capabilities across languages. In this paper, we expand XNLI to include Basque, a low-resource language that can greatly benefit from transfer-learning approaches. The new dataset, dubbed XNLIeu, has been developed by first machine-translating the English XNLI corpus into Basque, followed by a manual post-edition step.

Orriak

RSS - HP eta ordenagailuz lagundutako ikasketa-rako harpidetza egin