MADRID, 25 May. (EUROPA PRESS) -
Un estudio del Instituto de Física Interdisciplinar y Sistemas Complejos (IFISC, CSIC-UIB) revela que introducir una cantidad controlada de caos puede mejorar el aprendizaje de las redes neuronales artificiales, sistemas computacionales clave para la inteligencia artificial que se inspiran en las neuronas biológicas.
Los resultados, publicados 'Physical Review Research', muestran que las operaciones realizadas al inicio del comportamiento caótico, asociado con errores o inestabilidad computacional, aporta un equilibro entre dos estrategias que mejora el procesamiento de la información: el sistema combina el refinado de las soluciones conocidas con la exploración de nuevas posibilidades entre el vasto número de configuraciones posibles.
Entrenar una red neuronal para realizar una tarea, como hacer predicciones o clasificaciones, consiste en ajustar de forma suave y gradual sus parámetros internos. Una vez que su rendimiento alcanza un nivel satisfactorio, decimos que la red ha aprendido la tarea.
Ahora, el nuevo trabajo del IFISC (UIB-CSIC) muestra que introducir una cantidad controlada de caos en este proceso puede acelerar el aprendizaje. Este resultado se obtiene cuando la inteligencia artificial realiza operaciones al inicio del comportamiento caótico, que permite refinar las soluciones ya conocidas y, al mismo tiempo, explorar nuevas posibilidades.
Las redes neuronales artificiales suelen aprender mediante algoritmos de optimización como el descenso de gradiente: proceso matemático utilizado por la IA para calcular un error y determinar la dirección en el aprendizaje (vector o gradiente) que permita disminuir ese error.
El sistema repite la operación millones de veces, ajustando gradualmente los parámetros del modelo, hasta que el error es mínimo y la red neuronal se vuelve precisa. La tasa de aprendizaje se mide a través del tamaño del paso asociado a estos ajustes: los valores pequeños aseguran un progreso cauteloso y estable hacia una solución; los más grandes dan saltos más audaces que corren el riesgo de pasarse de largo.
Este proceso es generalmente estable y explotador, refinando constantemente la solución actual, como un excursionista que sigue un sendero bien marcado. Pero cuando la tasa de aprendizaje aumenta, el personal investigador del IFISC descubrió que la dinámica de entrenamiento se vuelve sensible a pequeñas diferencias en los puntos de partida, es decir, respecto a la configuración inicial de la red, antes de que comience su aprendizaje.
Esta característica es distintiva del caos: dos redes neuronales casi idénticas pueden divergir drásticamente durante el proceso de aprendizaje, como mariposas cuyos aleteos provocan huracanes a miles de kilómetros de distancia.
"En lugar de perjudicar al aprendizaje, esta inestabilidad caótica puede en realidad acelerarlo", explica Lucas Lacasa, investigador del IFISC y coautor del estudio, destacando que "cerca del límite donde comienza la dinámica caótica, el sistema encuentra un punto ideal que le permite aprender significativamente más rápido".
Los investigadores rastrearon las rutas que siguen los parámetros de la red durante el entrenamiento y midieron su sensibilidad a los puntos de partida. Con tasas de aprendizaje pequeñas, todo fluye de manera suave y ordenada; con valores enormes, el caos total hace que el aprendizaje colapse. Pero justo en esa zona intermedia, donde la exploración y la explotación se equilibran, las redes aprenden representaciones precisas y el entrenamiento se vuelve sorprendentemente más rápido.
HACIA UNA IA MÁS RÁPIDA Y EFICIENTE
El fenómeno se observó en diferentes arquitecturas de redes neuronales, funciones de activación -interruptores que deciden si una 'neuronal artificial' debe activarse o no- y conjuntos de datos, lo que sugiere que podría representar una característica robusta de la dinámica de aprendizaje en los sistemas estudiados.
"El entrenamiento acelerado que observamos cerca del borde de la estabilidad resulta ser notablemente robusto. Aparece de forma consistente en las diferentes arquitecturas, funciones de activación y conjuntos de datos que probamos", afirma Miguel C. Soriano, investigador del IFISC y coautor del estudio.
Más allá de sus posibles implicaciones prácticas para acelerar el entrenamiento, los hallazgos también conectan el aprendizaje automático moderno con la hipótesis del 'borde del caos' de la ciencia de los sistemas complejos, que propone que los sistemas capaces de computar suelen funcionar de forma óptima en el límite entre el orden y el desorden.
"Nuestros resultados sugieren que, para las redes neuronales que estudiamos, el aprendizaje es más eficiente precisamente cerca de este borde del caos. Comprender y explotar este régimen podría ayudar a diseñar sistemas de IA más rápidos y eficientes en el futuro", concluye el primer autor del estudio, Pedro Jiménez-González.