SODAS 2.5 SISTEMA PARA EL ANÁLISIS DE DATOS SIMBÓLICOS
Software para el Análisis de Datos Simbólicos (ADS) que extiende el análisis estadístico de datos a estructuras de datos más complejas, tales como intervalos, conjuntos de valores, distribuciones de probabilidad, relaciones jerárquicas entre categorías (taxonomías), etc… que representan conceptos. El software permite crear conjuntos de datos simbólicos a partir de bases de datos relacionales, además de analizarlos y visualizarlos.

SODAS 2.5 proporciona herramientas para la creación, manipulación, análisis, visualización y diseminación de conceptos permitiendo dar una explicación más comprensible a los resultados estadísticos interpretándolos en el mismo lenguaje de los conceptos. Aporta funciones de minería de datos sobre estos data warehouse para la extracción de conocimientos de estos ficheros. Está orientado a grandes volúmenes de datos, de los que pueden obtenerse descripciones agregadas de subgrupos por datos simbólicos y ser analizadas y visualizadas.


Proporciona a sus clientes nuevas técnicas de tratamiento de grandes bases de datos con la inclusión de una nueva metodología y una nueva herramienta (software) de apoyo en su cartera de soluciones.
Las ventajas de SODAS y los datos simbólicos son:
• Análisis de datos agregados (ej: una región = conjunto de individuos): mediante la creación de nuevas unidades estadísticas (grupos) por consultas a una base de datos relacional o mediante el conocimiento del experto.
• Incluyen información adicional a los datos: reglas lógicas entre variables, jerarquías entre categorías (taxonomías).
• Volúmenes de datos menores.
• Preservan la confidencialidad.
• Permiten comparar datos de diversas fuentes.
• Se interpretan los resultados de los análisis en el mismo lenguaje de los datos simbólicos.
SODAS 2.5 es resultado de los proyectos europeos ESPRIT IV 20821 SODAS y IST-2000-25161 ASSO (19 partners de 10 países: 3 institutos oficiales de estadística, 9 universidades, 4 centros de investigación y 3 empresas), y cofinanciado por EUROSTAT. Coordinador científico: Prof. E. Diday (Universidad París IX-Dauphine). Coordinadores administrativos: THOMSOM-CSF DETEXIS y Université de Notre Dame de la Paix.
Software validado por los 5 benchmarks de los proyectos para su aplicación final en la Estadística Oficial de la Unión Europea, si bien está orientado a grandes volúmenes de datos, de cualquier procedencia.
La UCM (Departamento de Estadística e Investigación Operativa y Centro de Proceso de Datos) ha desarrollado los módulos SDT (Strata Decision Tree) y VSDT.
Se puede consultar la información actualizada del software en: http://www.info.fundp.ac.be/asso/
Bibliografía específica del software:
Diday, E. (ed.) and Noirhomme-Fraiture, M. (2008), Symbolic Data Analysis and the SODAS software, Wiley, ISBN: 978-0-470-01883-5.
Bock, H.H. and Diday, E. (eds.) (2000): Analysis of Symbolic Data. Exploratory methods for extracting statistical information from complex data. Springer-Verlag, Heidelberg, ISBN 3-540-66619-2.
Este grupo puede ofrecer los siguientes servicios: