Lingüística y Lenguas Aplicadas Plan 2019

Grado y Doble Grado. Curso 2020/2021.

LINGÜÍSTICA COMPUTACIONAL - 805145

Curso Académico 2020-21

Datos Generales

SINOPSIS

COMPETENCIAS

ACTIVIDADES DOCENTES

Clases teóricas
para la exposición de los contenidos teóricos a los estudiantes (2 créditos)
Seminarios
para la construcción del conocimiento a través de la interacción y actividad de los estudiantes (1 crédito)
Clases prácticas
para mostrar a los estudiantes cómo proceder (2 créditos)
Laboratorios
para diseñar y probar soluciones a problemas planteados por el profesor y/o el estudiante (1 crédito)
Otras actividades
Trabajo autónomo: construir conocimiento de forma autónoma, desarrollar la capacidad de autoaprendizaje
Trabajo en equipo: desarrollar la capacidad de autoprendizaje cooperativo y colaborativo
TOTAL
6 créditos

Presenciales

6

Semestre

8

Breve descriptor:

Esta asignatura se centra en la comunicación en lenguaje natural entre máquinas y personas. El lenguaje natural es el lenguaje que utilizan las personas para comunicarse y pensar. La cuestión es ¿cómo hacer que una máquina se comunique con las personas en lenguaje natural? Conseguir esto simplificaría enormemente el uso de los ordenadores y sistemas informáticos al mismo tiempo que incrementaría las aplicaciones de ayuda a las personas: traducción automática en línea, sistemas de ayuda a personas que no pueden oír, ver o moverse, búsqueda inteligente de datos en la web, clasificación automática de documentos, análisis automático de la opinión sobre un producto o servicio y un sinfín de aplicaciones inteligentes que necesitan procesar el lenguaje natural escrito o hablado.

Para responder a la cuestión de la comunicación hombre-máquina en lenguaje natural, la idea es, en primer lugar, conseguir representar computacionalmente (en una máquina) el conocimiento que tienen las personas en su cerebro y, en segundo lugar, conseguir que con ese conocimiento, las máquinas puedan procesar, es decir entender y producir, el lenguaje natural. La cuestión es fascinante, pero nada sencilla. En esta asignatura examinaremos por qué es tan complejo representar y procesar lenguaje natural pero, también, algunas soluciones para representar y procesar el lenguaje natural que provienen de la Lingüística, la Inteligencia Artificial, la Psicología Cognitiva y las Matemáticas.

Requisitos

El alumno debe tener conocimientos de Lingüística, especialmente de Morfología, Sintaxis y Semántica. Es muy recomendable, pero no imprescindible, tener conocimientos de: (1) algún lenguaje de programación apropiado para el procesamiento del lenguaje (Prolog, Python), (2) representación formal del conocimiento y, (3) conceptos básicos de Lingüística Matemática. Estos conocimientos se han podido adquirir a lo largo de la carrera. En todo caso se proporcionará al alumno material para que pueda nivelarse.

Objetivos

1. Saber definir el ámbito, terminología, objetivos y problemas de la Lingüística Computacional
2. Saber describir la evolución histórica de la Lingüística Computacional
3. Saber enumerar y describir de forma precisa las principales aplicaciones de la Lingüística Computacional
4. Conocer y saber aplicar los principales modelos de representación computacional del lenguaje natural en los niveles morfológico, sintáctico y semántico
5. Conocer y saber aplicar las estrategias básicas de análisis del lenguaje natural en los niveles morfológico y sintáctico
6. Saber aplicar los conocimientos adquiridos para representar computacionalmente fenómenos lingüísticos y/o resolver cuestiones lingüísticas con el apoyo del ordenador

Contenido

1. Introducción a la Lingüística Computacional
1.1. Definición, objetivos, terminología e interdisciplinaridad
1.2. Niveles del conocimiento lingüístico
1.3. Componentes de un Sistema de Procesamiento del Lenguaje Natural
1.4. Modelos simbólicos, estadísticos y biológicos
1.5. Problemas del procesamiento del lenguaje natural
1.6. Evaluación de conocimientos
2. Aplicaciones e Historia de la Lingüística Computacional
2.1. Aplicaciones de la Lingüística Computacional
2.2. Evolución histórica de la Lingüística Computacional
2.3. Retos actuales
2.4. Evaluación de conocimientos
3. Modelos de representación de datos e información léxica
3.1. Representación de datos, información y conocimiento
3.2. Modelos de representación de datos e información
3.2.1. Bases de datos
3.2.2. Lenguajes de marcado (revisión)
3.3. Evaluación de conocimientos
4. Modelos de representación del conocimiento léxico
4.1. Lógica de predicados (revisión)
4.2. Redes semánticas (revisión)
4.3. Marcos y estructuras de rasgos (opcional)
4.4. Evaluación de conocimientos
5. Modelos de representación morfosintáctica
5.1. Fundamentos de la teoría de lenguajes formales (revisión)
5.2. Gramáticas regulares
5.3. Gramáticas independientes del contexto
5.4. Gramáticas aumentadas: gramáticas de atributos
5.5. Gramáticas independientes del contexto probabilísticas (opcional)
5.6. Evaluación de conocimientos
6. Métodos de análisis del lenguaje
6.1. Algoritmos descendentes
6.2. Algoritmos ascendentes
6.3. Algoritmos con “chart” (opcional)
6.4. Evaluación de conocimientos
7. Modelos de representación semántica
7.1. Gramática de casos
7.2. Gramática de dependencia conceptual
7.3. Ontologías
7.4. Evaluación de conocimientos

Evaluación

La evaluación será continua y se realizará a partir de las calificaciones obtenidas en las seis evaluaciones de conocimiento de cada tema. Los plazos de realización de las evaluaciones son únicos. El alumno que no entregue en el plazo establecido tendrá una penalización en la calificación que depende del tiempo de retraso, siendo de 1 punto por cada semana de retraso y teniendo que cuenta que los días 1º al 7º después del fin del plazo se consideran una semana de retraso y así sucesivamente.

Al finalizar el curso se realizará un examen final con preguntas de carácter teórico y práctico sobre los contenidos de la asignatura. Las fechas del examen final se pueden consultar en la página web de la Facultad, http://filologia.ucm.es/ en el apartado Alumnos

La calificación final se obtendrá:
El 50% se obtiene de la media aritmética de las evaluaciones realizadas al finalizar los seis temas
El 50 % restante de la calificación obtenida en el examen final

Bibliografía

- JURAFSKY, D.; MARTIN J.H. (2009) Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 2nd. Edition
- RICH, E.; KNIGHT, K. (1994). Inteligencia Artificial (2ª edición). McGrawHill
- FERNÁNDEZ FERNÁNDEZ, G.; SAEZ VACAS, F. (1987). Fundamentos de la Informática. Alianza Editorial / 1995 Anaya Multimedia

Otra información relevante

Es imprescindible el uso de campus virtual en esta asignatura. Para ello es necesario disponer de un ordenador o dispositivo móvil (Android, iOS) con conexión a internet. La Facultad de Filología, la Biblioteca y la Universidad disponen de aulas de informática de libre acceso para los estudiantes. La URL del campus virtual es: http://www.ucm.es//campusvirtual

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A17/02/2021 - 28/05/2021JUEVES 12:30 - 14:30-ANA MARIA FERNANDEZ-PAMPILLON CESTEROS
VIERNES 12:30 - 14:30-ANA MARIA FERNANDEZ-PAMPILLON CESTEROS