Un experimento llevado adelante por la plataforma Nof1, que combina inteligencia artificial (IA) y trading de criptomonedas, reveló un dato inesperado: las IAs chinas DeepSeek V3.1 y Qwen3 Max lideran en rentabilidad, mientras que los populares modelos estadounidenses GPT-5 (OpenAI) y Gemini 2.5 Pro (Google) acumulan fuertes pérdidas.

La prueba, iniciada el 17 de octubre y vigente hasta el 3 de noviembre, consiste en entregar 10.000 dólares reales a cada modelo para invertir en el mercado de criptomonedas perpetuas dentro de la blockchain Hyperliquid. Todos los participantes operan bajo las mismas condiciones: reciben las mismas instrucciones, el mismo capital y acceso a idénticos datos de entrada.

"Los mercados son la prueba definitiva de la inteligencia", señala Nof1 en su web, al explicar que el objetivo es maximizar la rentabilidad ajustada al riesgo en un entorno real y altamente volátil.

IAs chinas al frente, modelos estadounidenses en caída

Tras la primera semana del experimento, DeepSeek Chat V3.1 se posiciona en el primer lugar al más que duplicar su inversión, alcanzando más de 22.000 dólares. Le sigue Qwen3 Max, con casi 19.000 dólares, mientras que Claude Sonnet 4.5 (Anthropic) logró superar los 12.000 dólares, y Grok 4 (X) ronda los 11.000 dólares.

En el otro extremo, los modelos de IA más reconocidos del ecosistema tecnológico global están registrando pérdidas importantes: Gemini 2.5 Pro dispone de apenas 4.197 dólares, mientras que GPT-5 tiene 3.997 dólares, lo que representa más del 50% de su capital original.

Desde Nof1 remarcan que los resultados aún podrían variar antes del cierre del experimento, el próximo 3 de noviembre. De hecho, durante la primera etapa, tanto Claude como Grok llegaron a caer por debajo de los 10.000 dólares, pero luego lograron recuperarse.

IA y mercados: una nueva competencia global

El experimento expone una tendencia creciente: el uso de inteligencia artificial en decisiones de inversión y la competencia entre modelos desarrollados en distintos polos tecnológicos, principalmente China y Estados Unidos.

Los resultados preliminares sugieren que las herramientas asiáticas están logrando mejor adaptación al análisis dinámico de datos y la gestión de riesgo, dos variables críticas en el mundo del trading automatizado.

Mientras tanto, el rendimiento más débil de GPT-5 y Gemini plantea interrogantes sobre las limitaciones de los modelos generalistas frente a los sistemas optimizados para tareas financieras o contextos específicos.

El experimento de Nof1 continuará hasta principios de noviembre, cuando se conocerá qué modelo logra el mejor rendimiento absoluto y ajustado al riesgo. Más allá de quién gane, el proyecto marca un hito en la competencia global por la inteligencia artificial aplicada a los mercados.

Te puede interesar