NLP Evaluation in trouble: On the Need to Measure LLM Data Contamination for each Benchmark

Egileak: 
Oscar Sainz, Jon Ander Campos, Iker García, Julen Etxaniz, Oier Lopez de Lacalle, Eneko Agirre
Fitxategi publikoak: 
Urtea: 
2023
Artikuluaren erreferentzia: 
Findings of the Association for Computational Linguistics: EMNLP 2023
ISBN edo ISSN (aldizkari, kongresu, liburu edo liburu atalak): 
979-8-89176-061-5

Argitalpen mota fina (argitalpen_sailkapen_ohia):

Kongresuaren balorazioa: