Claude Sonnet 4.6 arrasa en los benchmarks — Anthropic recupera el trono de la IA

Anthropic ha lanzado Claude Sonnet 4.6, un nuevo modelo de IA que la empresa considera el más fuerte del mercado para realizar tareas en el PC de forma autónoma. El modelo también destaca en pruebas de inteligencia general.

El nuevo modelo de Anthropic, Claude Sonnet 4.6, fue presentado el 17 de febrero de 2026 con un mensaje claro: este es el mejor modelo de IA del mercado para navegar y realizar tareas en un PC sin intervención humana. Según digi.no, la empresa posiciona el modelo explícitamente para el uso autónomo de PC, lo que significa que el modelo puede controlar interfaces, ejecutar programas y completar tareas por sí solo.

Sólida posición en pruebas de inteligencia

Los benchmarks independientes del Artificial Analysis Intelligence Index respaldan parte de las afirmaciones de Anthropic. En el modo de razonamiento adaptativo con máximo esfuerzo, Claude Sonnet 4.6 logra una puntuación en el Intelligence Index de 51, muy por encima de la mediana de 26 para modelos comparables.

En GPQA —un benchmark que pone a prueba el razonamiento a nivel de doctorado en ciencias naturales— el modelo obtiene un 87,5 por ciento en modo adaptativo. Es marginalmente inferior al GPT-5.2 de OpenAI, que según las tablas de clasificación de Artificial Analysis alcanza el 90,3 por ciento en ciertas subpruebas, pero sigue estando entre las puntuaciones más altas del sector.

87,5 %

Puntuación GPQA (modo adaptativo)

Intelligence Index (sobre mediana de 26)

Claude Sonnet 4.6 arrasa en los benchmarks — Anthropic recupera el trono de la IA

La competencia es reñida — y barata

La competencia por la cima del mercado de la IA es más feroz que nunca. Mientras Anthropic y OpenAI se baten en duelo por fracciones en los exigentes benchmarks, la empresa china DeepSeek ha causado dolores de cabeza a los actores estadounidenses, no por igualarlos en rendimiento máximo, sino por ofrecer resultados impresionantes a una fracción del precio.

DeepSeek V3.1 cuesta solo 0,40 dólares por millón de tokens de entrada — frente a los 3 dólares de Anthropic y los 1,75 dólares de OpenAI

Esta presión de precios obliga a los actores establecidos a justificar su precio premium con mayor claridad, lo que podría explicar el enfoque evidente de Anthropic en un caso de uso concreto: el control autónomo de PC. Es un área en la que los competidores chinos aún no han presentado requisitos tan específicos.

Sin embargo, existe una debilidad sustancial en la base de datos: faltan resultados de benchmarks independientes publicados específicamente para el "uso de computadoras", es decir, tareas agénticas como la navegación por GUI y el control de terminales. La afirmación de Anthropic de liderar el mercado en este ámbito es, por ahora, en gran medida la palabra de la propia empresa, según los datos de mercado disponibles.

La velocidad es el talón de Aquiles

Una debilidad que surge en las mediciones independientes es la velocidad de generación. Claude Sonnet 4.6 produce entre 56 y 57 tokens por segundo, lo que se sitúa por debajo de la mediana de 60,5 y 71,2 tokens por segundo, respectivamente, dependiendo del modo. Para aplicaciones donde el tiempo de respuesta es crítico, esto podría ser un argumento a favor de los competidores.

Anthropic afirma liderar el mercado en control autónomo de PC — pero los benchmarks independientes para este caso de uso específico están ausentes por ahora

Un mercado en crecimiento

El lanzamiento se produce en un mercado en fuerte crecimiento. Las estimaciones para el mercado de agentes de IA y automatización de procesos varían significativamente entre las firmas de análisis, pero apuntan consistentemente al alza con un crecimiento anual que supera el 40 por ciento. El valor de mercado de la IA agéntica es estimado por diversas fuentes entre 4.500 y más de 15.000 millones de dólares en 2025, dependiendo de cómo se defina el segmento.

Para 2026, se estima que el mercado de agentes de IA por sí solo superará los 11.000 millones de dólares, según informes de la industria. Esto subraya por qué los actores luchan tanto por definir quién lidera la ejecución autónoma de tareas: hacia allí es donde fluye el dinero.

¿Qué pasará después?

Claude Sonnet 4.6 está disponible a través de la API de Anthropic a 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida. El modelo representa una elección estratégica clara de Anthropic para diferenciarse en el uso agéntico frente a la pura generación de texto o conversación, una carrera en la que podemos esperar más movimientos importantes de todos los actores a lo largo de 2026.

Claude Sonnet 4.6 arrasa en los benchmarks — Anthropic recupera el trono de la IA

Sólida posición en pruebas de inteligencia

La competencia es reñida — y barata

La velocidad es el talón de Aquiles

Un mercado en crecimiento

¿Qué pasará después?

Artículos Relacionados

Gemini 3.1 Pro setter nye rekorder – igjen

ChatGPT, Claude eller Gemini — hvem vinner egentlig?