escudo UCM
Oficina de Transferencia de Resultados de Investigación
Universidad Complutense de Madrid

Complutecno: Tecnologías de la Información y la Comunicación

SODAS 2.5 SISTEMA PARA EL ANÁLISIS DE DATOS SIMBÓLICOS

Descripción:

Software para el Análisis de Datos Simbólicos (ADS) que extiende el análisis estadístico de datos a estructuras de datos más complejas, tales como intervalos, conjuntos de valores, distribuciones de probabilidad, relaciones jerárquicas entre categorías (taxonomías), etc… que representan conceptos. El software permite crear conjuntos de datos simbólicos a partir de bases de datos relacionales, además de analizarlos y visualizarlos.

esquema
Fig. 1: Módulos del software SODAS y objetos simbólicos.

 

¿Cómo funciona?:

SODAS 2.5 proporciona herramientas para la creación, manipulación, análisis, visualización y diseminación de conceptos permitiendo dar una explicación más comprensible a los resultados estadísticos interpretándolos en el mismo lenguaje de los conceptos. Aporta funciones de minería de datos sobre estos data warehouse para la extracción de conocimientos de estos ficheros. Está orientado a grandes volúmenes de datos, de los que pueden obtenerse descripciones agregadas de subgrupos por datos simbólicos y ser analizadas y visualizadas.

SODAS: obtención de datos simbólicos
Fig. 2: Obtención de datos simbólicos a partir de una base de datos relacional (DB2SO)

 

SODAS:  ejemplo de gráfico generado
Fig. 3: Encadenamiento SODAS y salidas de los módulos VSDT y SOE

 

Ventajas:

Proporciona a sus clientes nuevas técnicas de tratamiento de grandes bases de datos con la inclusión de una nueva metodología y una nueva herramienta (software) de apoyo en su cartera de soluciones.

Las ventajas de SODAS y los datos simbólicos son:

• Análisis de datos agregados (ej: una región = conjunto de individuos): mediante la creación de nuevas unidades estadísticas (grupos) por consultas a una base de datos relacional o mediante el conocimiento del experto.

• Incluyen información adicional a los datos: reglas lógicas entre variables, jerarquías entre categorías (taxonomías).

• Volúmenes de datos menores.

• Preservan la confidencialidad.

• Permiten comparar datos de diversas fuentes.

• Se interpretan los resultados de los análisis en el mismo lenguaje de los datos simbólicos.

¿Dónde se ha desarrollado?:

SODAS 2.5 es resultado de los proyectos europeos ESPRIT IV 20821 SODAS y IST-2000-25161 ASSO (19 partners de 10 países: 3 institutos oficiales de estadística, 9 universidades, 4 centros de investigación y 3 empresas), y cofinanciado por EUROSTAT. Coordinador científico: Prof. E. Diday (Universidad París IX-Dauphine). Coordinadores administrativos: THOMSOM-CSF DETEXIS y Université de Notre Dame de la Paix.

Software validado por los 5 benchmarks de los proyectos para su aplicación final en la Estadística Oficial de la Unión Europea, si bien está orientado a grandes volúmenes de datos, de cualquier procedencia.

La UCM (Departamento de Estadística e Investigación Operativa y Centro de Proceso de Datos) ha desarrollado los módulos SDT (Strata Decision Tree) y VSDT.

Se puede consultar la información actualizada del software en: http://www.info.fundp.ac.be/asso/

Bibliografía específica del software:

Diday, E. (ed.) and Noirhomme-Fraiture, M. (2008), Symbolic Data Analysis and the SODAS software, Wiley, ISBN: 978-0-470-01883-5.

Bock, H.H. and Diday, E. (eds.) (2000): Analysis of Symbolic Data. Exploratory methods for extracting statistical information from complex data. Springer-Verlag, Heidelberg, ISBN 3-540-66619-2.

Y además:

Este grupo puede ofrecer los siguientes servicios:

  • Distribución del software.
  • Asesoramiento y consultoría sobre posibilidades del Análisis de Datos Simbólicos en aplicaciones concretas.
  • Colaboración, estudio, y aplicación del software sobre aplicaciones concretas.
  • Interpretación de resultados
  • Formación en Análisis de Datos Simbólicos y utilización del programa SODAS 2.5

Científico responsable:

José M. García-Santesmases/Maria del Carmen Bravo Llatas email
Dpto. de Estadística e Investigación Operativa
Facultad de CC. Matemáticas
[Inicio OTRI] - [Inicio Complutecno] || © OTRI-UCM - Queda prohibida la reproducción parcial o total sin permiso.