UNIVERSIDAD DE GRANADA | 4 septiembre, 2014 - 14:13 | Redacción aG

Científicos de la UGR ganan un importante concurso internacional sobre 'big data'

Pertenecen al grupo de investigación “Soft Computing y Sistemas de Información Inteligentes”, que dirige el catedrático de la Universidad de Granada Francisco Herrera

Investigadores participantes en la competición. De izquierda a derecha: Sara del Río, Isaac Triguero, Victoria López, Francisco Herrera y José Manuel Benítez. Foto: aG.

Científicos de la Universidad de Granada, pertenecientes al grupo de investigación “Soft Computing y Sistemas de Información Inteligentes” (SCI2S), han ganado la "ECBDL’14 Big Data Competition", un concurso celebrado este verano en Vancouver (Canadá), en el marco del congreso internacional GECCO-2014.

Este certamen, uno de los más prestigiosos del mundo en este ámbito de investigación, premia los mejores trabajos relacionados con los "big data", conjuntos de datos de un elevado tamaño cuyo volumen, diversidad y complejidad requieren el uso de nuevas arquitecturas, técnicas, algoritmos y análisis para gestionar y extraer el valor y conocimiento oculto en ellos.

La "ECBDL’14 Big Data Competition" se ha centrado en esta edición en un problema de clasificación en bioinformática. En concreto, los participantes debían trabajar sobre un conjunto de datos del campo de la predicción de estructuras de proteínas, en el que se pretendía conseguir un predictor para distinguir un conjunto de estructuras a partir de las ya conocidas, especialmente la detección de contactos residuo-residuo en las proteínas.

El conjunto de entrenamiento utilizado en la competición constaba de dos clases, con alrededor de 32 millones de instancias con 631 atributos ocupando 56,7 Gigabytes de datos. Para validar la utilidad de los métodos de la competición se ha considerado un conjunto de test con unos 2,8 millones de ejemplos que se almacenan aproximadamente en 5 Gigabytes de datos.

El equipo de la UGR que ha ganado la competición ha propuesto una combinación de técnicas de preprocesamiento de datos (sobremuestreo de alta ratio sobre la clase minoritaria y selección de características basada en pesos) y multiclasificadores basados en árboles de decisión utilizando MapReduce, extendiendo las ideas publicadas en la revista "Information Sciences". En segundo lugar quedó la Universidad de Newcastle (Reino Unido), y en tercero la Universidad de Nueva Gales del Sur (Australia).

Como explica el director del grupo de investigación "Soft Computing y Sistemas de Información Inteligentes" de la UGR, Francisco Herrera, “los desarrollos tecnológicos en torno al "big data" y el análisis inteligente de datos han dado lugar recientemente al término de Ciencia de Datos (Data Science), definido como un área emergente de trabajo relacionada con la preparación, análisis, visualización, gestión y mantenimiento de grandes colecciones de datos para la obtención de conocimiento que genere ventajas de negocio. Debido al impacto que estas temáticas están llegando a alcanzar, ha aparecido un nuevo término profesional: el "científico de datos".

El alto potencial del "big data" ha sido reconocido de inmediato debido a su influencia sobre problemas de diversos campos de conocimiento. “Entender la economía global, obtener una mejor planificación de servicios públicos, desarrollar investigaciones científicas o buscar nuevas oportunidades de negocio son algunas de las grandes aplicaciones relacionadas con estos grandes repositorios de datos”, apunta el profesor Herrera.

Dos artículos importantes

El grupo de investigación SCI2S de la Universidad de Granada ha desarrollado diversas aproximaciones basadas en MapReduce y las tecnologías Hadoop y Spark para abordar problemas de "big data". Estas aproximaciones tratan de lidiar con grandes conjuntos de datos, con datos heterogéneos y con datos textuales como los disponibles en las redes sociales.

Recientemente ha publicado dos trabajos en los que se aborda el problema del desbalanceo entre clases en "big data", un problema recurrente en aplicaciones del mundo real en el que tenemos pocas instancias asociadas a un hecho concreto frente a las muchas instancias en el problema, por ejemplo, los casos de fraude respecto al número total de transacciones.

Así, en un primer trabajo han desarrollado sistemas de clasificación basados en reglas difusas combinados con aproximaciones sensibles al coste utilizando MapReduce. Estos avances han sido publicados en la revista “Fuzzy Sets and Systems”, y se caracterizan por proporcionar clasificadores en forma de reglas con etiquetas lingüísticas, de manera que sean interpretables por el usuario y que a su vez son capaces de obtener una alta efectividad en la clasificación.

Por otra parte, en un segundo trabajo los investigadores de la UGR han estudiado la aplicación de multiclasificadores siguiendo el modelo Random Forest junto a algoritmos de preprocesamiento bajo el paradigma MapReduce, habiéndose publicado estos resultados en la revista internacional “Information Sciences”. Para abordar el desequilibrio de clases con éxito, se proponen diversas estrategias como las técnicas sensibles al coste y el uso de técnicas de preprocesamiento basadas en el muestreo de clases para tratar de obtener una distribución de instancias equilibrada que permite mejorar el funcionamiento de los algoritmos de aprendizaje.

Además, en el grupo de investigación se ha iniciado una línea de trabajo en el área conocida como "Social Big Data" para desarrollar algoritmos cuyo objetivo sea el procesamiento de información textual, como la obtenida en las redes sociales.

Comentarios

©Queda totalmente prohibida la reproducción total o parcial del contenido de esta noticia sin autorización expresa de la dirección de ahoraGranada

Te puede interesar

ÁREA METROPOLITANA

Visitas guiadas, paseos en bicicleta y talleres, entre las actividades de la VII Semana de la Vega de Granada

SUCESOS

Sorprendido en un control en la A7 con cinco kilos de marihuana en el maletero del coche

GRANADA

Más de 6.000 escolares de Granada se beneficiarán del Programa Escenia 2023

EDUCACIÓN

Crecen en Granada las familias que obtienen plaza en el centro educativo elegido en primera opción

¿Te lo perdiste?

GRANADA

Marzo recibió un 281% más de lluvia en Granada que la media histórica desde 1991

SUCESOS

Pillado en Granada cuando llevaba cuatro pastillas de hachís en una bolsa de comida para animales

SUCESOS

Investigan en Granada a un joven de 18 años por pagar con un billete de 100 euros falso en una gasolinera

SUCESOS

Roba en una vivienda de Órgiva tras entrar por la ventana mientras sus dueños dormían

La Capital

Echa a andar la fundación que quiere fomentar iniciativas conjuntas entre la Alhambra y Granada

Maracena

La estabilización de las trabajadoras de ayuda a domicilio, primera medida del nuevo alcalde de Maracena

Actualidad en imágenes

La XVIII edición de la Carrera Padre Marcelino

Procesión de la Virgen del Pincho de Chauchina 2024

Movilización contra la instalación de un centro de migrantes en la Base Aérea

Un hombre se atrinchera en su vivienda en Las Gabias y amenaza con hacerla explotar

La Mezquita Mayor de Granada celebra el Ramadán

La nieve llega a varios pueblos de Granada

SUCESOS

SUCESOS

Cae una banda en el Cinturón de Granada que enviaba marihuana a través de una empresa de paquetería

Localizan en Iznalloz las dos unidades de un aparato industrial de aire acondicionado robadas en Láchar

Un guardia civil fuera de servicio recupera 937 kilos de aceituna robada en Algarinejo

Muere un trabajador atropellado por una máquina en una fábrica de Moraleda de Zafayona

Acepta 21 años de prisión por matar a su expareja en Parque Nueva Granada: "Pido perdón a mis niñas"

MAGAZÍN

Magazín

Una muestra repasa en Granada la realidad de la guerra a través de 40 fotografías de James Nachtwey

Ana Belén, Víctor Manuel y Serrat acompañarán a Miguel Ríos en el 'Granada All Stars'

La Catedral de Granada, protagonista de 80.000 sellos de Correos por su V Centenario

Una exposición recoge los mejores proyectos del alumnado de la Escuela de Diseño Val del Omar de Granada

Un programa cultural para conmemorar el aniversario de la Alhambra y el Albaicín como Patrimonio Mundial

ÁREA METROPOLITANA

Santa Fe

La Junta refuerza su colaboración en asuntos sociales con el Ayuntamiento de Santa Fe

La comunidad educativa de Peligros se une en una gala contra el acoso escolar

Santa Fe abre el Circuito Provincial de Ciclismo de Carretera Escuelas y Cadetes Diputación de Granada

La salud será protagonista de cuatro pueblos metropolitanos durante abril

Chauchina se convierte en 'capital gastronómica' de la Vega de Granada con su VI Ruta de la Tapa

LA CAPITAL

Universidad de Granada

Granada alberga la escuela 'Dones Xcitech' para adentrarse en la industria del 'Big Science'

La asamblea de Bomberos de Granada anuncia movilizaciones por las mejoras en el servicio

Granada contará con 473 nuevos contenedores marrones distribuidos por todos los distritos

El centro deportivo 'We' de Granada reabrirá este verano

Vox dice que el Supremo avala su "confianza en la transparencia" de las primarias de 2020 en Granada

PROVINCIA

SORTEOS

La ONCE reparte 70.000 euros entre 20 vecinos de Guadix

Taxis a demanda, wifi gratuito y clases de refuerzo para combatir la despoblación en Granada

Diputación destinará a pueblos de Granada hasta un millón de euros para la conservación del patrimonio

Sindicatos llevan a la Fiscalía la muerte de un trabajador en Moraleda de Zafayona

La CHG precinta una balsa usada para regar 153 hectáreas de pistachos en Pedro Martínez

Cofradías

Cofradías

Cuenta atrás para 2025, la Semana Santa de Granada que tendrá que esperar

Estrenos, recorridos por ver o el aumento de los cortejos quedan pendientes para el próximo año tras no salir dos tercios de las cofradías

Cofradías

La peor Semana Santa de Granada en 17 años: solo nueve de las 32 cofradías hicieron estación de penitencia

Se supera el registro de 2007, en el que entonces fueron once hermandades las que pudieron llegar al interior de la Catedral

Semana Santa de Granada

Todas las fotos de la Semana Santa de Granada 2024

Solo diez de las 32 corporaciones nazarenas pudieron salir a las calles de Granada este año

DÍA A DÍA

Universidad de Granada

Descubren agua dulce bajo la superficie del fondo marino en Granada

La Universidad de Granada ha concluido la campaña oceanográfica Sanimed 24 en el litoral granadino tras 20 días de observación y recogida de muestras

Universidad de Granada

Investigadores de la UGR desarrollan un modelo para diagnosticar el melanoma de forma temprana

En el trabajo multidisciplinar también han participado investigadores de los hospitales universitarios Virgen de las Nieves y Hospital Clínico San Cecilio