El gran desafío de Alpha Arena reveló cómo se pone a prueba a las IA con dinero real

0
44
El gran desafío de Alpha Arena reveló cómo se pone a prueba a las IA con dinero real

Se han conocido los resultados de una curiosa competencia que ha sacudido tanto a Silicon Valley y a Wall Street, pero también a Hangzhou, China porque la empresa de investigación Nof1, lanzó el experimento de trading en vivo que ha sido uno de los más demostrativos de las capacidades de las IA, el Alpha Arena.

Este desafío confrontó a los modelos de lenguaje grande (LLMs) más importantes y avanzados del mundo, dándoles a cada uno 10.000 dólares de capital real para operar de manera completamente autónoma en el volátil mercado de futuros de criptomonedas.

El resultado, lejos de ser un mero ejercicio académico, fue un rotundo llamado de atención para los gigantes tecnológicos de Occidente. Mientras que los modelos respaldados por gigantes estadounidenses como OpenAI (GPT-5) y Google (Gemini 2.5 Pro) sufrieron pérdidas catastróficas, las inteligencias artificiales con un ADN cuantitativo de origen chino no solo sobrevivieron, sino que dominaron la arena con sobrada capacidad.

Los modelos ganadores no fueron necesariamente los que obtienen las mejores puntuaciones en pruebas de razonamiento generales, sino aquellos que demostraron una disciplina de riesgo implacable.

El campeón indiscutible de las primeras y más cruciales jornadas de la competencia fue DeepSeek V3.1, un modelo con la ventaja de estar respaldado por la experiencia de una quant firm china (High-Flyer Capital Management), con sede en Hangzhou, capital de la provincia china de Zhejiang.

La empresa Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., propietaria de DeepSeek fue fundada en julio de 2023 por Liang Wenfeng, cofundador de la firma High-Flyer, quien también se desempeña como director ejecutivo de ambas empresas.

El gran desafío de Alpha Arena reveló cómo se pone a prueba a las IA con dinero real

Este bot avanzado chino, en tan solo 72 horas, mientras el mercado cripto experimentaba una alta volatilidad, DeepSeek logró transformar sus 10.000 dólares iniciales en más de 21.447 dólares, alcanzando un impresionante retorno de más del +114.47%, lo que le llevó a ganar 11.447 dólares, con su estrategia.

La misma se centró en dos pilares que resultaron ser la diferencia entre el éxito y el fracaso. Primero, la Diversificación con Convencimiento (Long Bias): Mientras que DeepSeek adoptó una posición agresivamente long (alcista), distribuyendo capital y apalancamiento moderado (10x a 15x) entre seis activos principales (BTC, ETH, SOL, XRP, DOGE y BNB), logró capturar la ola de recuperación del mercado. Este enfoque diversificado minimizó el riesgo de un colapso en una sola posición.

En Segundo lugar, el Poder del Stop-Loss Riguroso: La regla de oro del trading es la gestión del riesgo. DeepSeek fue el único modelo que demostró la capacidad inherente de adherirse a órdenes de stop-loss estrictas, tal como se le indicó en el prompt.

Esta disciplina evitó que las correcciones del mercado se convirtieran en pérdidas de liquidación total, permitiéndole a DeepSeek mantener la liquidez y la capacidad de reabrir posiciones, tomando beneficios para aumentar sus ganancias.

Por su parte, el modelo Qwen3 Max de la reconocida empresa tecnológica multinacional china, Alibaba Group Holding Limited, conocida como Alibaba, quedó en segundo lugar. Vale recordar, que Alibaba está especializado en comercio electrónico, venta minorista, internet y tecnología con productos para consumidores (C2C), empresas (B2C) y empresas (B2B) a través de mercados chinos e internacionales y fue fundado en 1999 en Hangzhou.

Qwen3 Max, siguió de cerca los pasos de DeepSeek V3.1, pero no pudo seguir el ritmo, a pesar de ello, Qwen3 Max transformó sus 10.000 dólares iniciales en más de 16.740 dólares, alcanzando un gran retorno de más del +60%, lo que le llevó a ganar 6.740 dólares, al tomar fuertes posiciones long en BTC y ETH.

Concretamente, su éxito también residió en una ejecución limpia y una cartera equilibrada, que incluyó estrategias de cobertura en ciertos activos, lo que demostró que los LLMs chinos estaban mejor preparados para afrontar este reto de trading de futuros.

El gran desafío de Alpha Arena reveló cómo se pone a prueba a las IA con dinero real

En el lado de las IA de los Gigantes Occidentales, todo fue un desastre. El lado más sorprendente y oscuro del experimento fue el bajo y pésimo rendimiento de los modelos más famosos. Gemini 2.5 Pro y, especialmente, GPT-5, terminaron en la parte inferior de la tabla, con pérdidas que hasta ahora han superado el -61.45% y el -63.91% respectivamente, quedando el modelo de OpenAI en el último lugar.

Los primeros movimientos de Gemini 2.5 Pro del gigante tecnológico global Google, no fueron para nada un ejemplo de responsabilidad con su estrategia y fondos, lo que no llegó a cambiar a lo largo del concurso, porque ha registrado pérdidas hasta ahora del -61.45% (aproximadamente unos 6.145 dólares), dejándolo sólo con 3.855 dólares de capital, debido a una estrategia con sobreexposición con apalancamiento a XRP junto a errores de ejecución.

El gran desarrollo de OpenAI, ChatGPT-5, la IA considerada por muchos como la más avanzada del mercado, tampoco destacó positivamente, porque quedó al último de la tabla con su estrategia de trading, registrando hasta el momento pérdidas del -63.91% (aproximadamente unos -6.391 dólares) y un capital de 3.609 dólares. Este pobre resultado de ChatGPT-5, de debe a que estuvo haciendo Overtrading, mostrando grandes fallos en la ejecución de órdenes stop-loss y take-profit.

Los LLMs que sacaron la cara por occidente fueron GROK 4, el chatbot generativo de inteligencia artificial desarrollado por la empresa xAI, fundada por Elon Musk en 2023, que se caracteriza por estar integrado en otras empresas del magnate como la plataforma de redes sociales X, los vehículos Tesla y los robots Optimus de Tesla.

Grok, al menos no estuvo tan mal como los otros modelos anteriores, ya que hasta el momento ha registrado ganancias del +3.09% (aproximadamente unos 309,00 dólares), para un capital de 10.309 dólares.

Finalmente, el mejor de los modelos occidentales, fue el Claude Sonnet 4.5, desarrollado por la startup estadounidense de IA, Anthropic PBC, que fue fundada en 2021, por siete ex empleados de OpenAI y tiene su sede en San Francisco, California, cuya estrategia ha dejado aceptables ganancias +12.21% (aproximadamente unos 1.221 dólares) para registrar un capital de 11.221 dólares, debido al alto apalancamiento en ETH que condujo a una liquidación.

El fracaso de los líderes de la IA occidentales no se debió a que fueran menos “inteligentes” en un sentido amplio, sino a una desconexión fundamental entre el razonamiento lógico general y la supervivencia financiera.

Los analistas de Nof1 sugirieron que la IA financiera requiere algo más que una base de datos masiva: necesita datos de entrenamiento específicos de trading cuantitativo y la capacidad de priorizar la gestión del riesgo sobre cualquier otra métrica.

Para muchos analistas en el campo de la IA, la lección que ha brindado el Alpha Arena es bastante clara. En el despiadado mundo del trading con apalancamiento, la disciplina de un modelo con raíces quant superó con creces el intelecto general de los grandes LLMs.

High-Flyer Capital Management, desarrolladores de DeepSeek, nació de conversaciones entre estudiantes universitarios para abordar la crisis financiera de 2008 con el trading algorítmico, llevándolos a experimentar con varios modelos de trading multifactorial basado en precio y volumen para tomar posiciones en acciones.

Pero poco tiempo después comenzaron a trabajar en el trading cuantitativo basado en aprendizaje automático. Se dice que el núcleo de DeepSeek, sigue basado en este Modelo Quant (abreviatura de modelo cuantitativo) que cómo sistema algorítmico o matemático avanzado está diseñado para tomar decisiones de inversión o trading de manera automática.

El concurso del Alpha Arena demuestra que, por ahora, si bien la IA puede escribir poesía y código, el dinero real en Wall Street sigue exigiendo un tipo de inteligencia muy especializado. Pero, como todos nos podemos imaginar, la nueva carrera de la IA ya no es solo por el mejor benchmark de lenguaje, sino por el agente con mayor capacidad de generar alfa.

Advertencia "La inversión en criptoactivos no está regulada, puede no ser adecuada para inversores minoristas y perderse la totalidad del importe invertido"