Pesquisadores chineses criaram um modelo de inteligência artificial capaz de encontrar padrão em dados e descrever matéria escura.

Uma forma de estudar matéria escura é através da análise de dados de aglomerados de galáxias. A matéria escura tem um papel importante em aglomerados de galáxias porque representa a maior parte da massa. Nos últimos anos, modelos de inteligência artificial estão sendo usados para encontrar padrões nesses dados observacionais e de simulações para encontrar padrões e insights. No entanto, a maioria desses modelos tem pouca interpretabilidade física, dificultando a extração de informação.
Para contornar esse problema, físicos e astrônomos têm buscado usar modelos com interpretabilidade para aprender representações que possam ser analisadas e relacionadas diretamente a estruturas matemáticas ou físicas conhecidas. Uma estratégia envolve arquiteturas em que as funções de ativação não são fixas, mas aprendidas a partir dos dados. Isso facilita a identificação de dependências entre grandezas físicas dos dados e consegue ser mais diretamente comparada com modelos teóricos.
Um grupo de pesquisadores chineses desenvolveu um novo modelo denominado Convolutional Kolmogorov–Arnold Network (CKAN). O modelo foi treinado com dados de simulações de aglomerados de galáxias com as informações de distribuição de massa e emissão de raios-X para entender o comportamento da matéria escura. O CKAN permite investigar como estruturas observáveis estão relacionadas com a distribuição de matéria escura.
Matéria escura
A matéria escura é uma componente do Universo que é responsável por cerca de 85% da matéria total. Ela não interage com a luz e com nenhuma interação além da interação gravitacional. Por causa disso, a matéria escura só consegue ser observada indiretamente através de curvas de rotação de galáxias, dinâmica de aglomerados, lentes gravitacionais e anisotropias na radiação cósmica de fundo. Apesar disso, a natureza microscópica da matéria escura ainda é um mistério na Astrofísica.
O modelo padrão assume matéria escura fria e sem interação que descreve bem a estrutura em grandes escalas mas não explica alguns fenômenos em escalas menores. Uma alternativa é a hipótese de Self-Interacting Dark Matter (SIDM), na qual as partículas de matéria escura possuem interações entre si com seções de choque pequenas. Essas interações podem redistribuir energia e momento no interior de halos galácticos e explicar algumas observações de galáxias e aglomerados.
Redes neurais interpretáveis
Redes neurais são usadas na Astronomia e na Física para resolver problemas como classificação, regressão e reconhecimento de padrões. No entanto, entender porque uma rede tomou tal decisão, que resultou em um resultado, é uma limitação. Dentro da Ciência, essa falta de interpretabilidade dificulta encontrar relações físicas e validar hipóteses. Em áreas como Astronomia, onde os dados são complexos, os modelos não fornecem nenhuma compreensão sobre os mecanismos físicos reais que governam os fenômenos observados.
Por causa dessa limitação, cada vez mais pesquisadores estão buscando criar redes neurais interpretáveis que incorporam estruturas, restrições ou representações que permitam extrair significado físico dos modelos. Exemplos incluem arquiteturas com funções de ativação aprendidas, redes inspiradas em leis de conservação e modelos híbridos. Essas abordagens permitem não apenas prever propriedades mas também identificar quais variáveis dominam o comportamento observado.
Novo modelo
Pesquisadores chineses desenvolveram um novo modelo de inteligência artificial interpretável denominado Convolutional Kolmogorov–Arnold Network (CKAN). O CKAN foi desenvolvido com o objetivo de superar a limitação das redes convolucionais tradicionais. Nessa arquitetura, funções de ativação fixas são substituídas por funções de ativação treináveis. Essa característica permite que o modelo aprenda representações mais flexíveis e fisicamente interpretáveis.

O modelo foi treinado com dados de simulações cosmológicas de aglomerados de galáxias, incluindo diferentes hipóteses para matéria escura. As entradas do modelo consistem em imagens que possuem três canais: distribuição de massa total, massa estelar e emissão em raios X. Além de classificar os diferentes modelos físicos, a estrutura interna do CKAN pode ser obtida e reescrita em forma simbólica. Os resultados ajudaram os pesquisadores a identificar quais características espaciais e físicas são mais relevantes para distinguir os cenários de matéria escura.
Resultados obtidos
A análise da representação do CKAN revelou que a rede neural passou a ver quantidades físicas como o deslocamento entre o centro do halo de matéria escura e o centro do aglomerado de galáxias. Esses padrões extraídos automaticamente são consistentes com previsões teóricas indicando que o modelo não apenas classifica os dados corretamente, mas também entende relações físicas reais.
Combinando métricas de erro com diagnósticos de interpretabilidade, os pesquisadores obtiveram um resultado interessante. Eles encontraram que nas escalas de aglomerados de galáxias, a hipótese SIDM exige uma seção de choque mínima da ordem de 0.1-0.3 cm²/g. Esse limite é consistente com estimativas baseadas em simulações cosmológicas recentes. Além disso, ao incluir ruído observacional, o CKAN manteve sua capacidade e conseguiu manter os erros na mesma ordem.
Referência da notícia
Huang et al. 2025 An Interpretable AI Framework to Disentangle Self-interacting and Cold Dark Matter in Galaxy Clusters: The CKAN Approach The Astronomical Journal
