Evaluating Multimodal Representations on Sentence Similarity:vSTS, Visual Semantic Textual Similarity Dataset
Egileak (ixakideak):
Egileak:
Oier Lopez de Lacalle, Eneko Agirre, Aitor Soroa
Fitxategi publikoak:
Urtea:
2017
Artikuluaren erreferentzia:
ICCV17: second workshop on Closing the Loop Between Vision and Language. Venice, Italy