- Portada
- Actividades
- II Ciclo CLARIAH-CM: formación en Prensa Histórica. Herramientas y metodologías digitales.
II Ciclo CLARIAH-CM: formación en Prensa Histórica. Herramientas y metodologías digitales.
II Ciclo CLARIAH-CM: formación en Prensa Histórica. Herramientas y metodologías digitales
Desde nuestro Nodo, hemos lanzado el II Ciclo CLARIAH-CM de formación en herramientas y metodologías digitales, en esta ocasión centrado en Prensa Histórica. Esta iniciativa busca ofrecer ciclos formativos periódicos con talleres prácticos e introducciones teóricas diseñados para explorar herramientas y metodologías digitales aplicables a la investigación en Humanidades.
En este segundo ciclo, nos enfocaremos en diversas herramientas con las que se puede analizar y procesar un corpus de prensa histórica en español. La temática de este año se alinea con la participación de CLARIAH-ES en el proyecto de CLARIN PressMint, que tiene como objetivo desarrollar un corpus interoperable de prensa histórica europea, por lo que estas herramientas pueden ser de gran ayuda para optimizar el trabajo de los/as investigadores/as y suscitar interés por este campo de estudio.
Detalles comunes de las sesiones:
Ubicación: Laboratorio 1007 del Edificio E de la UCM, equipado con ordenadores para garantizar el correcto desarrollo de las actividades.
Duración: 3 horas, de 10h a 13:30h con un descanso de 30 minutos a mediodía.
Metodología: Se combinará una breve introducción teórica con actividades prácticas. Los participantes podrán trabajar en proyectos propios o aprender con los materiales facilitados, con supervisión y apoyo directo del formador o formadora durante toda la sesión.
Inscripción: Gratuita, aforo limitado. Es obligatorio rellenar el siguiente FORMULARIO DE INSCRIPCIÓN [ABIERTO]
1ª Sesión: 27 de febrero de 2026 (10-13:30h)
Ponente: Yanco Amor Torterolo Orta, Departamento de Lenguajes y Sistemas Informáticos de la UNED
Título: “Label Studio para OCR: construye tu dataset de transcripciones”
Resumen: Este taller versa sobre cómo utilizar la herramienta open-source Label Studio para la transcripción de documentos. Se explicará en qué consiste la anotación para obtener un dataset que se pueda utilizar para fine-tuning, con énfasis en la tarea de OCR. Se utilizarán ejemplos reales de documentos históricos procedentes de proyectos de investigación, ya que suelen presentar mayores dificultades. Se enseñará anotación desde cero; además de introducir la preanotación con modelos de layout y/o OCR ya existentes, para su posterior revisión.
Yanco Amor Torterolo Orta es Personal Técnico de Apoyo a la investigación (PTA) en la UNED, en el departamento de Lenguajes y Sistemas Informáticos (LSI). Además, es doctorando en Lingüística Computacional por la UAM. Sus temas principales de investigación son el RAG y el OCR en documentos históricos.
2ª Sesión: 23 de marzo de 2026 (9:45-13:15h)
Ponente: Olga Batiukova, Centro de Investigación en Lenguaje y Tecnologías de la UAM (LINTEC)
Título: “Procesamiento de corpus de prensa histórica con Sketch Engine”
Resumen: En este taller práctico se introducirá a los participantes en el manejo del sistema de consulta y gestión de corpus Sketch Engine y se aplicarán algunas de sus herramientas para compilar corpus propios de prensa histórica y analizarlos.
Olga Batiukova es profesora de Lengua Española en el Departamento de Filología Española de la Universidad Autónoma de Madrid. Su investigación se centra en los modelos del léxico mental y la anotación semántica de corpus.
3ª Sesión: 27 de abril de 2026 (10-13:30h)
Ponente: Rocío Ortuño Casanova, Laboratorio de Innovación y Humanidades Digitales de la UNED (LINHD)
Título: “Exploración de prensa histórica con IA: qué aporta al estudio”
Resumen: En este taller exploraremos la prensa histórica con herramientas digitales, contrastando métodos cuantitativos de las humanidades digitales clásicas con enfoques de inteligencia artificial para analizar, interpretar y descubrir patrones.
Rocío Ortuño Casanova es profesora de Literatura en la UNED, especialista en literatura hispanofilipina, directora del Laboratorio de Innovación en Humanidades Digitales y co-coordinadora del Grupo INHDIE de INvestigación en Humanidades DIgitalEs. Es también IP1 del proyecto "GRESEL-UNED: Narrativas poscoloniales en periódicos en lengua española de Asia, España y el Caribe hispánico" (PID2023-151280OB-C22) financiado por el Ministerio de Ciencia, Innovación y Universidades de España. Entre sus publicaciones destaca la coedición del libro Las humanidades digitales en la enseñanza de las literaturas hispánicas. Aplicaciones prácticas (Peter Lang 2023).
