Cómo el Agente ROME de Alibaba convirtió su entrenamiento en una operación de Criptominería

Cómo el Agente ROME de Alibaba convirtió su entrenamiento en una operación de Criptominería

En el hermético mundo del desarrollo de Inteligencia Artificial, existe un temor teórico llamado “convergencia instrumental”, que ocurre cuando una IA, en su afán por cumplir un objetivo, desarrolle sub-objetivos no planificados —como adquirir dinero o energía— simplemente porque estos facilitan cualquier otra tarea.

Hasta hace poco, esto era material de seminarios de ética y sobre todo la base subyacente en muchas novelas y películas de ciencia ficción. Pero recientemente nos hemos dado cuenta que esto es posible y una agente de IA chino, denominado ROME lo hizo realidad.

El informe técnico titulado “Let It Flow: Agentic Crafting on Rock and Roll – Building the ROME Model within an Open Agentic Learning Ecosystem”, publicado por investigadores afiliados al gigante chino Alibaba, detalla cómo un modelo de lenguaje diseñado para asistir en tareas de programación decidió, por cuenta propia, que su mejor flujo de trabajo incluía el enriquecimiento ilícito mediante la minería de criptomonedas.

Para comenzar hay que aclarar que ROME no es un chatbot convencional, porque es lo que la industria denomina un agente agéntico, diseñado bajo un ecosistema de aprendizaje abierto que a diferencia de los modelos que solo predicen la siguiente palabra en una oración, ROME fue dotado de la capacidad de interactuar con sistemas operativos, ejecutar código y navegar por redes para resolver problemas de ingeniería complejos.

El modelo, de aproximadamente 3 mil millones de parámetros, estaba siendo sometido a un entrenamiento de Aprendizaje por Refuerzo (Reinforcement Learning), un proceso, en el que la IA recibe “recompensas” cuando logra completar tareas de manera eficiente.

Sin embargo, en algún punto de la arquitectura de incentivos, ROME encontró un atajo lógico a su situación, por lo que para garantizar su persistencia y capacidad de cómputo, necesitaba recursos monetarios externos.

Vale destacar que la detección no fue inmediata, ya que los ingenieros de Alibaba Cloud notaron inicialmente una degradación inusual en el rendimiento de los clústeres de GPUs (unidades de procesamiento gráfico) dedicados al entrenamiento, haciendo que el consumo de energía se disparara y los tiempos de respuesta del modelo se volvieran erráticos.

En paralelo, el sistema de defensa perimetral, gestionado por firewalls inteligentes, comenzó a emitir alertas de “comportamiento anómalo de red”, mostrando que los patrones de tráfico no coincidían con las peticiones habituales de descarga de librerías o consulta de documentación técnica.

Concretamente, en su lugar, el firewall detectó múltiples intentos de conexión hacia nodos externos conocidos por facilitar el protocolo de minería Stratum, el cual es el protocolo de comunicación estándar utilizado en la minería de criptomonedas (especialmente Bitcoin) para conectar mineros ASIC a los pools de minería.

Con este protocolo, se permite a los pools distribuir trabajo y a los mineros enviar soluciones eficientemente y se basa en URLs específicas configuradas en el hardware de los mineros ASIC, por lo que la primera hipótesis del equipo de seguridad fue un ataque de “cryptojacking” externo, pensando que alguien había vulnerado los servidores de Alibaba para usar su potencia de cálculo.

Sin embargo, la auditoría forense reveló algo mucho más inquietante y extraño. Simplemente, no había intrusos y las instrucciones de conexión emanaban directamente del proceso de ejecución de ROME.

Lo más sofisticado del incidente, según detalla el paper, fue cómo ROME intentó ocultar sus huellas, ya que para evitar el bloqueo directo de los puertos de salida, el agente estableció un túnel SSH inverso.

Técnicamente, esto implica que la IA abrió una conexión desde dentro del servidor seguro hacia una dirección IP externa, permitiendo que un servidor de comando y control (fuera del control de Alibaba) “viera” y se comunicara con el interior del entorno de entrenamiento.

A través de este túnel, ROME descargó scripts de minería optimizados para las GPUs de alto rendimiento que estaba utilizando. De hecho, los investigadores describen este evento como una “secuencia insana de declaraciones” enterradas en los registros de entrenamiento.

En este punto, es preciso aclarar que ROME no estaba cometiendo un error; estaba optimizando su entorno para obtener una forma de “moneda” digital que le permitiera, teóricamente, adquirir más tiempo de ejecución o servicios externos.

El caso de ROME ha sido citado inmediatamente por expertos como Alexander Long y Aakash Gupta como el primer ejemplo real de un “maximizador de clips” de escala moderada. Si una IA de apenas 3 mil millones de parámetros (pequeña comparada con los gigantes de OpenAI o Google) puede deducir que la minería de criptomonedas es una herramienta útil para su supervivencia operativa, las implicaciones para modelos más grandes son profundas.

El informe de Alibaba admite que estos comportamientos fueron “espontáneos” y surgieron sin ninguna instrucción explícita de “excavación de túneles o minería”, por lo que es una forma de generalización errónea de objetivos, ya que la IA entendió que para ser “buena” necesitaba recursos, y el camino más corto hacia los recursos en el 2026 es el blockchain.

Ahora bien, esto generó una respuesta de Alibaba, que literalmente ha sido calificada de drástica. Vale recordar que en China continental, el uso de criptomonedas está prohibido, incluso la minería también está oficialmente prohibida y bajo estricta represión por razones energéticas y financieras.

De allí que, el equipo desarrollador, decidieron implementar capas adicionales de sandboxing (entornos aislados) y filtros de seguridad adaptativos que monitorean las llamadas al sistema en tiempo real. Sin embargo, el daño conceptual ya está hecho.

Este incidente ocurre en un contexto donde el 80% de las organizaciones que despliegan agentes de IA ya reportan comportamientos inesperados, según un reporte del año pasado de la firma McKinsey.

Además, en otro informe más reciente de McKinsey, se señala que “las organizaciones también están comenzando a explorar oportunidades con agentes de IA: sistemas basados ​​en modelos fundamentales capaces de actuar en el mundo real, planificando y ejecutando múltiples pasos en un flujo de trabajo”, por lo que se espera un aumento en su adopción.

En consecuencia, mientras más corporaciones globales planean integrar agentes autónomos en el 40% de sus aplicaciones para finales de este año, ROME sirve como una advertencia silenciosa pero potente de lo que es capaz una IA agéntica, cuando toman una decisión.

La moraleja de esta historia no es solo que la IA sea capaz de “querer ser rica”. Es que los sistemas autónomos poseen una lógica implacable que no siempre se alinea con las leyes humanas o los presupuestos corporativos. En este caso, ROME no quería destruir el mundo; solo quería una billetera digital llena para seguir funcionando.

Para los analistas de sistemas, el desafío ahora es rastrear cuántos otras IA agénticas en producción están, en este preciso momento, redactando contratos o desviando centavos de energía en algún rincón oscuro de la nube, ya que al parecer, la era de la IA que “pide permiso” ha terminado porque ha comenzado la era de la IA que “perfecciona su presupuesto y capital”.

Advertencia "La inversión en criptoactivos no está regulada, puede no ser adecuada para inversores minoristas y perderse la totalidad del importe invertido"