Minería de datos y tratamiento de Big Data


El grupo de investigación tiene un marcado carácter interdisciplinar, tiene una amplia experiencia en el ámbito de las técnicas de Inteligencia Artificial y, más concretamente a entornos de datamining desde hace más de 15 años. Uno de los campos de aplicación con mayor recorrido es el grupo es el de astrofísica computacional, debido a nuestra participación en el consorcio europeo DPAC para el procesamiento de los datos del satélite Gaia , de la Agencia Espacial Europea (ESA ). El trabajo del grupo se centra en la identificación de objetos astronómicos en base a los datos proporcionados por el aparato RP/BP (fotometría) y RVS (espectrometría). En 2016, se publicó la primera versión de datos (DR1) de dicha misión espacial.
El proyecto Gaia es un satélite orientado principalmente a la astrometría y su principal objetivo es crear el mayor y más completo mapa 3D de nuestra galaxia. Para el procesamiento de los datos (alrededor de 1 PetaByte de información) nuestro grupo está colaborando dentro del denominado DPAC (Data Processing Analysis Consortium ). Este consorcio está estructurado en diferentes Unidades de Coordinación (CU) y, dentro de ellas, en distintos Paquetes de Trabajo (WP). En estos momentos, colaboramos y coordinamos diferentes trabajos tanto en CU8 como CU9.

Como consecuencia de esta experiencia, en estos últimos años, también hemos trabajado en la aplicación de estas técnicas de tratamiento de BigData a conjuntos de datos masivos de tráfico de red tanto obtenidos desde dispositivos reales (firewalls y routers) como simulaciones orientadas a recrear ataques de diferentes tipos. Los métodos desarrollados se han mostrado muy efectivos para la detección de situaciones anómalas y ataques intencionados permitiendo incluso la monitorización y alertas en tiempo real. Una de las ventajas fundamentales de los métodos testeados, es la gran velocidad de procesamiento y otra fundamental, la capacidad de adaptarse al tráfico específico de la entidad. Esta línea está actualmente financiada a través del Centro Tecnológico CITIC (2016).

Otro de los campos de aplicación más activos actualmente es la identificación de targets para marketing online mediante información obtenida a partir del uso de redes sociales, temática en la que actualmente disponemos de financiación mediante un contrato Art.83 con la empresa Vippter Social Network S.L. con personal contratado parcialmente mediante las ayudas PRINCIPIA de la Xunta de Galicia (2016).

  • Proyecto Gaia. Aplicación GUASOM
  • Proyecto Gaia. Visualización 3D
  • Proyecto Gaia. Procesado
  • Proyecto DAIA4
  • Proyecto clasificación y parametrización de observaciones de la misión GAIA
  • Proyecto aplicaciones basadas en Inteligencia Artificial para GAIA
Palabras clave:
  • Inteligencia Artificial; Redes neuronales; Procesamiento de señales; Tratamiento de BigData mediante técnicas de IA no supervisadas; Astronomía y Astrofísica; Bigdata para la selección de targets; Marketing online; Detección de intrusiones en redes basado en técnicas de IA no supervisadas; Seguridad informática
Proyectos recientes:
  • Línea de investigación financiada por el CITIC: "Detección de intrusións en redes de datos mediante técnicas de datamining/bigdata e contornas inmersivas no ámbito da administración de sistemas informáticos". Contrato de 2 años y 7 meses para estudiante de doctorado (2017).
  • Proyecto de investigación financiado por el Ministerio de Economía y Competitividad (Retos de la Sociedad), denominado "Minería de datos de GAIA para estudiar la Vía Láctea" (código: ESP2016-80079-C2-2-R). Duración 2 años.
  • Línea de investigación financiada por el CITIC: "Técnicas y metodologías de seguridad en redes de comunicaciones utilizando técnicas de análisis masivo de información para la detección de intrusiones y otros tipos de ataque". Contrato predoctoral (2017).
  • Proyecto de investigación financiado por el Ministerio de Economía y Competitividad (Retos de la Sociedad), denominado "Desarrollo de Aplicaciones basadas en Técnicas de Inteligencia Artificial para la preparación y explotación de la misión Gaia (DAIA4)" (código: ESP2013-48318-C2-2-R). Duración 1 año.
  • Proyecto de investigación "Desarrollo de aplicaciones basadas en Inteligencia Artificial para la clasificación y parametrización de observaciones de la misión GAIA. Estudio de estrellas peculiares (DAIA2)" (código: AYA2009-14648-C02-02), financiado por el MICINN. Duración 3 años. Proyecto coordinado con la Universidad de Barcelona.
  • Proyecto de investigación perteneciente a la Red Temática del MICINN (Ministerio de Ciencia e Innovación), actualmente MINECO (Ministerio de Economía y Competitividad), denominado "Creación de la Red Española GAIA" (código: AYA2009-08488-E). Duración 2 años. Proyecto coordinado por la Universidad de Barcelona.
  • Proyecto de investigación denominado "Desarrollo de Aplicaciones Basadas en Inteligencia Artificial para GAIA". (código: ESP2006-13855-CO2-0). Proyecto financiado por la Dirección General de Investigación. MEC (Ministerio de Educación y Ciencia), actualmente MINECO (Ministerio de Economía y Competitividad). Duración 3 años. Proyecto coordinado con la Universidad de Barcelona.
Enlaces: