Ciencia UdeC aporta a mejorar la comprensión del Universo desde la IA
24 de Julio 2023 | Publicado por: Natalia Quiero
La inteligencia artificial facilita tareas como procesar rápido altos volúmenes de datos y se obtienen constantemente en la observación astronómica, cada vez más con nuevos telescopios. Así, usar técnicas inteligentes en la astrofísica es crítico para ir a la frontera del conocimiento y eso promueven los investigadores locales.
Construir un modelo eficiente de inteligencia artificial capaz de clasificar objetos celestes de distintos telescopios; mejorar la capacidad de dominio para transferir modelos de inteligencia artificial desde instrumentos actuales a datos que aún no se conocen; crear modelos que detecten anomalías para encontrar objetos astronómicos desconocidos.
Tres objetivos científicos en la frontera del conocimiento de las ciencias astronómicas e investigaciones lideradas desde la Unidad de Data Science (UDS) de la Universidad de Concepción (UdeC) han permitido llegar hasta esos límites para derribarlos.
Guillermo Cabrera, director de la UDS; Manuel Pérez, subdirector de la UDS; y Daniel Moreno, estudiante de Doctorado en Ciencias de la Computación; han desarrollado estos trabajos de alto impacto presente para el futuro.
Y esa es la meta en la UDS. El doctor Cabrera, académico del Departamento de Ingeniería Informática y Ciencias de la Computación de la Facultad de Ingeniería, destacó que el foco del grupo que lidera está en crear herramientas que permitan abordar desafíos actuales en el área de la inteligencia artificial (IA) y sus técnicas como aprendizaje de máquina o automático (machine learning) o aprendizaje profundo (deep learning).
Ciencia competitiva
Un gran reto es usar la IA en la astronomía o astrofísica, en relación con la observación y procesamiento de datos para impulsar avances en generar información y conocimientos que mejoren la comprensión del Universo.
No es estar a la vanguardia científica-tecnológica porque sí, sino que es crucial estudiar, desarrollar y emplear la IA. “El aporte de estas herramientas es fundamental: si se desea ser realmente competitivo se debe utilizar este tipo de herramientas que son de última generación”, sostuvo Cabrera.
Donde puso el acento el investigador, como también los data scientist Manuel Pérez y Daniel Moreno, es el significativo aporte que la IA tiene cuando se trabaja con grandes volúmenes de datos, gracias a algoritmos que permiten el procesamiento veloz y optimizar otros procesos relevantes en el uso de la información, generar conocimientos y/o tomar decisiones.
Así que emplear estas herramientas “es fundamental cuando se analizan datos de nuestro vasto Universo observable”, aseguró Pérez.
Vastedad también en el nivel de datos que se pueden obtener. Para tratar de dimensionarlo basta saber que se estima que sólo los planetas son más de 4 cuatrillones en el Universo observable. No por mera poesía se dice que es infinito. “En astronomía se generan terabytes de datos todas las noches”, aclaró Moreno, por la observación de los distintos instrumentos. “La capacidad de estos modelos para extraer patrones complejos y representaciones internas permiten trabajar con millones de objetos astronómicos y categorizarlos en un tiempo razonable”, afirmó.
Mostrar al mundo
Estar a la vanguardia competitiva en términos de IA aplicada a las ciencias astronómicas es aún más relevante en Chile, capital mundial de la astronomía por su posición en el planeta y cualidades naturales del desierto de Atacama que hacen de sus cielos unos privilegiados para observar. Por algo allí están parte de los observatorios más importantes y se construyen o proyecta instalar nuevos e impactantes telescopios, como el más grande y moderno.
En ese escenario está y aporta el trabajo de los científicos de la UDS UdeC, quienes lo van a socializar al mundo durante la International Conference on Machine Learning (ICML).
La ICML es un evento mundialmente reconocido que se realizará desde hoy 23 hasta el 29 de julio en Hawái (Estados Unidos), cuando presentarán los papers que documentan los resultados de sus estudios en un workshop sobre machine learning para astrofísica.
Presencia que se asume como un hito personal y para la comunidad científica regional y nacional.
Sobre ello, el doctor Cabrera resaltó que “es una de las tres conferencias internacionales más importantes en el área de IA; aquí se publican los trabajos que realmente están rompiendo barreras en estos temas y que son los que llevan a desarrollos tales como los que hemos visto en los últimos años en herramientas como Chat GPT, DALL·E y todas estas herramientas que utilizamos en el día a día”.
Por esto manifestó que el espacio permite mostrar “al mundo que en Chile se está haciendo investigación en IA de punta” y “a estudiantes e investigadores mostrar que son capaces de hacer IA y posicionarse internacionalmente”.
IA e investigaciones locales que llegan hasta la frontera del conocimiento
Los algoritmos de IA aprenden muy bien aquella tarea asociada a la gran cantidad de datos con que se entrenaron, mas no son capaces de extender el aprendizaje a datos similares que no integraron el entrenamiento. Eso puede implicar una brecha del uso de modelos creados, porque hay muchos datos de instrumentos existentes y se construyen otros de los que no existen datos.
“Queremos que nuestros sistemas basados en IA sean capaces de funcionar con muy pocos datos, apenas los nuevos instrumentos comiencen a operar. Además, nos gustaría tener modelos generalistas que sean capaces de funcionar sobre múltiples instrumentos y aprender simultáneamente de todos ellos”, resaltó Guillermo Cabrera al respecto.
Y ese reto aborda en su estudio “Domain Adaptation for Multi-band Photometric Classification“ que presentará en la próxima ICML y desarrolló mediante una colaboración con estudiantes del Departamento de Informática UdeC.
En el trabajo, contó, utilizaron un modelo de IA capaz de aprender desde un gran conjunto de datos y luego transferirse a un número limitado de otros datos sin perder su capacidad predictiva. Por ende, se espera que el resultado aporte a fortalecer la generalización y robustez de los modelos.
Para llegar a ello usaron varias herramientas de machine learning, fundamentalmente con foco en redes neuronales artificiales o deep learning, respecto a las que destacó “Transformers, arquitectura en la cual se basa el Chat GPT; adaptación de dominio profunda, aprendizaje fuera de dominio, y modelamiento Bayesiano y Variacional”.
El resultado obtenido implicó gran avance, porque afirmó que “en Astronomía se han utilizado otros algoritmos para otras tareas, pero esta es la primera vez que se utiliza para la detección de objetos transientes apuntando a sistemas basados en IA como ALeRCE”.
Uso en ALeRCE
ALeRCE es el foco de “Multi-Class Deep SVDD: Anomaly Detection Approach in Astronomy with Distinct Inlier Categories“, estudio que Manuel Pérez realizó en colaboración con el Instituto Milenio de Astrofísica y comunicará en el evento sobre machine learning en astrofísica.
Sigla de Automatic Learning for the Rapid Classification of Events (Aprendizaje Automático para la Clasificación Rápida de Eventos, en español), ALeRCE es una iniciativa nacional que operará de bróker en sistemas de clasificación y alerta temprana de datos del Observatorio Vera C. Rubin.
Es un instrumento de última generación que se construye en el norte chileno, operará desde 2024 y observará el Universo con capacidad de registro sin precedentes, requiriendo procesar millones de alertas por noche.
Pérez dijo que el trabajo propone un nuevo modelo de IA para detectar estrellas con comportamientos anómalos no identificados. “Hoy podemos estudiar algunos mecanismos físicos que rigen el Universo mediante la observación de diversas estrellas que varían a través del tiempo. Algunas variaciones están bien estudiadas, pero hay mecanismos desconocidos que queremos estudiar y entender”, explicó al respecto. “Es especialmente desafiante dado el inmenso volumen de estrellas del Universo, lo cual hace que su búsqueda sea como buscar una aguja en un pajar”, afirmó.
Monitorear y estudiar estos objetos es imposible sólo por inspección humana, y el grupo diseñó un modelo basado en redes neuronales que permite detectar automáticamente estrellas que varían de forma anómala y potencialmente pudieran regirse por mecanismos desconocidos. Este se comparó con algoritmos que el investigador definió como más promisorios y halló mayor cantidad de objetos anómalos.
Destacó que este trabajo permitiría “focalizar esfuerzos para el estudio de estos mecanismos” y que a partir de este “se espera descubrir estrellas que siguen mecanismos físicos no estudiados y expandir el conocimiento acerca del Universo, además de ser capaces de descubrir estrellas que creemos que debieran existir y no han sido vistas”.
Distintos telescopios
“Positional Encodings for Light Curve Transformers“ es el paper que Daniel Moreno presentará en la conferencia internacional, donde aborda la construcción de un modelo de IA eficiente para clasificar objetos celestes de distintos telescopios.
“La idea fue entrenar un modelo sobre millones de datos astronómicos provenientes desde un telescopio en particular y ajustar el modelo pre-entrenado sobre datos provenientes de otros telescopios”, precisó.
Y explicó que surgió ante el desafío de ayudar a los modelos de IA a distinguir el cambio en las distribuciones de datos: “cuando se trabaja con datos de diferentes telescopios ocurren cambios en la distribución temporal, es decir, en la frecuencia de muestro de las observaciones obtenidas cada noche, lo cual genera un desafío considerable para estos modelos”.
En resultados que el científico relevó están las significativas mejoras en la precisión al clasificar estrellas y reducción del tiempo computacional para entrenar los modelos. “Mostramos que somos capaces de disminuir el tiempo de entrenamiento de 6 días a sólo 2 días, enfocándonos en mejorar la robustez y flexibilidad del componente temporal de los modelos Transformer de datos astronómicos temporales”, destacó.
Desde allí aclaró que “a nivel mundial existían 6 modelos Transformers entrenados para la clasificación de datos astronómicos temporales, pero ningún estudio había analizado el efecto del componente temporal de los Transformer mediante la clasificación de datos provenientes de diferentes telescopios”.
Y lo que resaltó de su estudio es que permitió destacar la importancia de mejorar este componente en modelos cuando se trabaja con datos astronómicos temporales: “así se pueden disminuir los tiempos de entrenamiento, en la práctica es esencial, y mejorar la adaptabilidad a datos de diferentes telescopios y la precisión en la clasificación de objetos astronómicos”, cerró.