Ayuda de las tecnologı́as lingüı́sticas en la investigación en Humanidades Digitales

El acercamiento digital al estudio de las humanidades ofrece nuevas oportunidades para la colaboración, la
reutilización de herramientas y la difusión multimodal de estos estudios. Nuevas actividades, objetos de estudio y
técnicas de investigación han propiciado nuevas formas para leer, escribir, revisar, buscar, ordenar, describir y
enseñar. Todo esto puede suponer un hándicap considerable en la inmersión de las Humanidades Digitales, pero el
uso de las tecnologı́as lingüı́sticas y la ayuda o colaboración de las infraestructuras en humanidades como CLARIN
o DARIAH, pueden ayudar a descubrir algunas ventajas y paliar de alguna forma ciertos obstáculos ya superados en
proyectos anteriores.
En este curso de carácter teórico-práctico los asistentes realizarán o plantearán temas de interés o de investigación
basados en textos y diseñaran un pequeño corpus que podrı́a ser válidos para un estudio futuro. Después, realizarán
en ese (o en otro) corpus algunas búsquedas con expresiones regulares; extraerán las palabras y sus concurrencias
del corpus creado, utilizando varias herramientas de Procesamiento del Lenguaje Natural (PLN); reorganizarán
algunos enunciados del fenómeno lingüı́stico que podrı́an ayudar a responder sus hipótesis con evidencias textuales
(búsquedas en KWIC); observarán secuencias de palabras extrayendo n-gramas y personalizando filtros en hojas de
cálculo; utilizarán las herramientas que se ofrecen en diferentes corpus (como por ejemplo Ameresco, CREA y
CORPES) y, finalmente, se presentarán algunas herramientas de PLN útiles y de fácil uso (como por ejemplo
ANALHITZA y Voyant Tools) con casos prácticos realizados tanto en IXA-CLARIN-K como en otros grupos de
investigación, que pensamos podrı́an ser de provecho tanto para docentes, bibliotecarios/as e investigadores en
Humanidades y Ciencias Sociales
Para terminar la sesión se hará un análisis de las necesidades que podrı́an tener los asistentes, para estudiar tipos de
colaboración dentro de la infraestructura lingüı́stica de IXA-CLARIN-K y las interesadas y los interesados.

Authors: 
Arantza Diaz de Ilarraza, Mikel Iruskieta

Publication topic:

Year: 
2019
Publication place: 

XVI Simposio Internacional de Comunicacion Social (XVI-SICS)

Publication type:

Publication clasification: