Categoría: Análisis
Javier Morales
Share
Listen On

Cursor ha lanzado Composer 2, la segunda generación de su modelo propio de inteligencia artificial para el desarrollo de software. La compañía afirma que el modelo puede competir con las principales soluciones de programación de Anthropic y OpenAI a un coste significativamente menor.

El modelo ya está disponible en Cursor y también en la fase alfa temprana de la nueva interfaz llamada “Glass”. El precio es de 0,50 dólares por millón de tokens de entrada y 2,50 dólares por millón de tokens de salida. Una versión más rápida, que según Cursor ofrece el mismo nivel de inteligencia, cuesta 1,50 y 7,50 dólares por millón de tokens respectivamente y está configurada como opción predeterminada.

Modelo Precio por 1M tokens, entrada / salida Nota
Composer 2 0,50 / 2,50 dólares Versión estándar
Composer 2 Fast 1,50 / 7,50 dólares Versión más rápida con, según Cursor, la misma inteligencia
Claude Opus 4.6 5,00 / 25,00 dólares Precio de API según Anthropic, válido para cualquier longitud de contexto
GPT-5.4 2,50 / 15,00 dólares (contexto corto); 5,00 / 22,50 dólares (contexto largo) Precio de OpenAI según la longitud del contexto

En términos de precio puro de API, Cursor posiciona Composer 2 claramente por debajo de Claude Opus 4.6 y también por debajo de GPT-5.4. Incluso la versión rápida Fast sigue siendo considerablemente más barata que las tarifas estándar de ambos competidores.

En declaraciones a Bloomberg, el cofundador Aman Sanger explicó que el modelo fue entrenado exclusivamente con datos de código. Según él, este enfoque permitió crear un modelo más pequeño y económico. «No te ayudará con tu declaración de impuestos», afirmó Sanger. «Y tampoco podrá escribir poemas».

Aprendizaje por refuerzo en tareas de programación de largo alcance

Según Cursor, las mejoras de calidad frente a la versión anterior se deben en gran parte a su primer proceso de preentrenamiento continuo, que sirvió como base más sólida para la fase posterior de aprendizaje por refuerzo. El entrenamiento se basa en las llamadas tareas de programación de largo horizonte, es decir, problemas que requieren cientos de acciones individuales.

Las métricas publicadas por Cursor muestran un salto notable respecto a versiones anteriores. En CursorBench, el benchmark interno de la compañía para tareas de programación, Composer 2 pasa de 44,2 en Composer 1.5 a 61,3.

El modelo también mejora claramente en Terminal Bench 2.0, un benchmark para tareas agenticas en terminal, y en SWE-bench Multilingual, centrado en tareas de ingeniería de software en entornos multilingües.

Modelo CursorBench Terminal Bench 2.0 Terminal Bench 2.0 optimizado SWE-bench Multilingual
Composer 2 61,3 61,7 73,7
Composer 1.5 44,2 47,9 65,9
Composer 1 38,0 40,0 56,9
Claude Opus 4.6 58,2 58,0 65,4 77,8
GPT-5.4 Thinking 63,9 75,1 n/a

Terminal Bench 2.0 solo es parcialmente comparable, ya que los resultados dependen del agente, el entorno y la configuración. Para Claude Opus 4.6, 58,0 corresponde al valor público de Claude Code, mientras que 65,4 es un resultado optimizado adicional publicado por Anthropic. Para GPT-5.4 Thinking, solo existe un resultado público disponible.

Cursor busca reducir su dependencia de proveedores externos

Cursor compite ahora directamente con Anthropic y OpenAI, que continúan lanzando modelos cada vez más avanzados para el desarrollo de software. Según Bloomberg, la empresa ya cuenta con más de un millón de usuarios diarios y unos 50.000 clientes corporativos. Además, estaría en negociaciones para una nueva ronda de financiación con una valoración cercana a los 50.000 millones de dólares.

Al mismo tiempo, Cursor enfrenta un dilema estructural. La plataforma sigue integrando modelos de OpenAI y Anthropic, lo que implica competir directamente con los mismos proveedores de los que depende. Mientras continúe utilizando modelos externos, su política de precios, capacidades y márgenes estarán condicionados por empresas que atienden al mismo público objetivo.

Anthropic, en particular, está consolidando su posición en el mercado de programación con Claude Code. Según estimaciones internas de Cursor, una suscripción de 200 dólares mensuales podría generar costes de computación de hasta 5.000 dólares. Esto ilustra claramente el problema: al integrar un modelo de terceros, se adquiere capacidad de cómputo a precios que el propio proveedor puede subvencionar agresivamente en su producto directo.

En este contexto, el margen de maniobra de Cursor es limitado. Según el informe, las suscripciones de usuarios individuales operan con márgenes negativos, mientras que los contratos empresariales son la principal fuente de rentabilidad. Además, el avance de modelos cada vez más autónomos podría reducir el valor de la capa de interfaz si los usuarios comienzan a interactuar directamente con los proveedores de modelos en lugar de utilizar plataformas intermediarias.

Senior AI Research Analyst
Es investigador y analista senior con base en España. Su trabajo se centra en el estudio de modelos tecnológicos a gran escala, su integración en infraestructuras empresariales y las implicaciones económicas y sociales de su adopción.