• English
  • Youtube
  • Facebook
  • Twitter
  • Linkedin
  • Instagram
  • tiktok
  • bluesky

Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2026/2027.

BIG DATA: PROCESAMIENTO DISTRIBUIDO Y PARALELO - 806324

Curso Académico 2026-27

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1, CG2, CG8,CG10.
Específicas
CE7, CE8, CE16

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%

Presenciales

2,4

No presenciales

3,6

Semestre

7

Breve descriptor:

La asignatura plantea una introducción de las técnicas más utilizadas para el Análisis de Datos en ámbitos de Big Data.
Se introducen los conceptos que se utilizan para permitir el almacenamiento masivo distribuido y el procesamiento paralelo.
Especial atención se dedica a las técnicas de programación para clústers. En particular la metodología Map-Reduce y al entorno Spark.

 A lo largo de toda la asignatura se utilizará el lenguaje de programación Python y entornos interactivos de programación, análisis y prueba.


Objetivos

  • Comprender el marco conceptual del BigData
  • Entender y manejar básicamente un sistema distribuido HDFS Hadoop
  • Diseñar soluciones paralelizables utilizando el esquema Map Reduce
  • Escribir programas en Spark
  • Conocer y programar la abstracción de datos RDD
  • Conocer y programar la abstracción de datos DataFrame
  • Conocer los módulos avanzados de Spark: Streaming, SQL, ML...



Contenido

  • Introducción a Big Data.
  • Almacenamiento de datos en ambientes Big Data
    • Sistemas de Ficheros distribuidos Hadoop HDFS
  • Técnicas de procesamiento paralelo:
    • Map Reduce
    • Apache Spark
    • Módulos avanzados
  • Trabajo en Casos de Uso


Evaluación


Convocatoria Ordinaria

Todos los estudiantes tienen que realizar un Examen Final Teórico-Práctico.
Todos los estudiantes tienen la posibilidad de hacer una evaluación continua en la que se valorará, además del Examen Final Teórico-Práctico, la asistencia, la participación y la entrega de prácticas y trabajos.

La calificación final en la convocatoria ordinaria se obtendrá como el máximo entre:
a) La calificación del Examen Final Teórico-Práctico
b) La media ponderada de las actividades de evaluación evaluación continua y el Examen Final Teórico-Práctico.
Los pesos en esta ponderación son 10% asistencia, 10% participación, 40% prácticas y trabajos y 40% examen final.
La nota mínima en el Examen Final Teórico-Práctico para poder hacer la ponderación es 4 sobre 10, si no se alcanza el 4, la calificación final será la del Examen Final Teórico-Práctico.

Convocatoria Extraordinaria

Todos los estudiantes tienen que realizar un Examen Final Teórico-Práctico que constituirá el 100% de la nota.

Bibliografía

L. Massaron; A. Boschetti, Python Data Science Essentials, Packt. 2015
J. VanderPlas, Python Data Science Handbook, O'Reilly. 2016
Documentación Hadoop: http://hadoop.apache.org/docs/current/
Documentación MrJob: https://pythonhosted.org/mrjob/
Documentación Spark: http://spark.apache.org/docs/latest/
Karau H., Konwinski A., Wendell P., and Zaharia M. Learning Spark. O'Reilly. 2015

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único07/09/2026 - 18/12/2026JUEVES 18:00 - 20:00-CARLOS GREGORIO RODRIGUEZ


Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único07/09/2026 - 18/12/2026LUNES 18:00 - 20:00-CARLOS GREGORIO RODRIGUEZ