Claude Sonnet 5: novedades, ventajas y comparación de precios
Anthropic lanza Claude Sonnet 5: razonamiento adaptativo por defecto, nuevo tokenizador, ventana de contexto de un millón de tokens. Repaso de las ventajas reales y de la tarificación, comparada con Opus 4.8 y Haiku 4.5.
Anthropic acaba de lanzar Claude Sonnet 5, la nueva generación de su modelo de gama media. Es una actualización directa de Sonnet 4.6, al mismo precio por token, con mejoras claras en programación y tareas agénticas. Esto es lo que cambia de verdad, y cuánto cuesta una vez tenidos en cuenta los detalles.
El nuevo modelo en breve
Claude Sonnet 5 (identificador de API claude-sonnet-5) se posiciona como «la mejor combinación de velocidad e inteligencia». Sus características principales:
- Una ventana de contexto de un millón de tokens por defecto, sin variante más pequeña.
- 128k tokens de salida como máximo.
- Razonamiento adaptativo activado por defecto.
- El mismo conjunto de herramientas y funciones que Sonnet 4.6.
Anthropic presenta Sonnet 5 como un salto de capacidad, con los avances más notables en desarrollo y tareas automatizadas (agentes). También es una opción para las cargas que necesitan más que Sonnet 4.6 sin tener que pasar a un modelo de clase Opus, más caro.
Lo que cambia en concreto
El razonamiento adaptativo por defecto
En Sonnet 4.6, una petición sin parámetro de razonamiento se ejecutaba sin razonamiento. En Sonnet 5, la misma petición activa ahora el razonamiento adaptativo, es decir, el modelo ajusta por sí mismo el esfuerzo de razonamiento según la dificultad de la tarea. Para desactivarlo, hay que indicarlo explícitamente.
Punto de atención: como el límite max_tokens cubre el razonamiento más la respuesta, conviene revisar ese valor en los procesos que antes se ejecutaban sin razonamiento, para evitar que la salida quede cortada.
Un nuevo tokenizador
Es el cambio más importante para tu presupuesto. Sonnet 5 usa un nuevo tokenizador: para un mismo texto, produce alrededor de un 30 % más de tokens que Sonnet 4.6.
No es un cambio de API, y no hay que modificar el código. Pero todo lo que se mide en tokens se ve afectado: los contadores de uso, la cantidad de texto que realmente cabe en la ventana de contexto y, sobre todo, el coste de una petición equivalente. Vuelvo sobre ello más abajo, porque ahí se esconde el precio real.
Protecciones de ciberseguridad en tiempo real
Sonnet 5 es el primer modelo de nivel Sonnet con protecciones de ciberseguridad en tiempo real. Las peticiones sobre temas prohibidos o de alto riesgo pueden ser rechazadas. El rechazo no es un error técnico: vuelve como una respuesta correcta con un motivo de parada específico, que se gestiona en el lado de la aplicación.
La tarificación de Sonnet 5
El precio por token no cambia respecto a Sonnet 4.6. Pero Anthropic aplica una tarifa de lanzamiento reducida hasta el 31 de agosto de 2026, antes de volver a la tarifa estándar el 1 de septiembre de 2026.
| Periodo | Entrada (por millón de tokens) | Salida (por millón de tokens) |
|---|---|---|
| Lanzamiento (hasta el 31 de agosto de 2026) | 2 $ | 10 $ |
| Estándar (desde el 1 de septiembre de 2026) | 3 $ | 15 $ |
El almacenamiento en caché de prompts y la API Batch siguen la misma lógica. A la tarifa de lanzamiento, una lectura de caché cuesta 0,20 $ por millón de tokens, y la API Batch (procesamiento asíncrono, descuento del 50 %) baja a 1 $ de entrada y 5 $ de salida.
Sonnet 5 frente a Opus 4.8 y Haiku 4.5
Aquí es donde se decide la elección de verdad. Sonnet 5 se sitúa en el centro de la gama, entre el modelo más rápido y el más potente.
| Modelo | Entrada / Salida (por M tokens) | Contexto | Salida máx. | Posicionamiento |
|---|---|---|---|---|
| Opus 4.8 | 5 $ / 25 $ | 1M | 128k | Razonamiento complejo, programación agéntica |
| Sonnet 5 | 3 $ / 15 $ (2 $ / 10 $ en lanzamiento) | 1M | 128k | Equilibrio entre velocidad e inteligencia |
| Haiku 4.5 | 1 $ / 5 $ | 200k | 64k | El más rápido, tareas simples |
En la práctica: Sonnet 5 cuesta casi la mitad que Opus 4.8 en salida, ofreciendo la misma ventana de contexto de un millón de tokens. Haiku 4.5 sigue siendo la opción económica para tareas simples y de gran volumen, pero se limita a 200k tokens de contexto.
El coste real: no olvides el tokenizador
Aquí está la trampa que hay que evitar. El precio por token es idéntico al de Sonnet 4.6, pero el nuevo tokenizador genera alrededor de un 30 % más de tokens para el mismo texto. Una petición idéntica puede, por tanto, costar más, aunque la tabla de tarifas no haya cambiado.
La tarifa de lanzamiento (2 $ / 10 $) compensa de sobra este efecto hasta el 31 de agosto de 2026. Después de esa fecha, a la tarifa estándar (3 $ / 15 $), hay que incorporar el mayor número de tokens en las estimaciones. El buen reflejo: volver a contar tus prompts con la herramienta de conteo de tokens del modelo en lugar de reutilizar cifras medidas en una versión anterior.
Para desarrolladores: tres puntos de migración
Pasar de Sonnet 4.6 a Sonnet 5 es un reemplazo directo (basta con cambiar el identificador del modelo), pero tres comportamientos han cambiado:
- El razonamiento extendido manual se elimina: ahora devuelve un error. Se usa el razonamiento adaptativo y el parámetro de esfuerzo en su lugar.
- Los parámetros de muestreo (
temperature,top_p,top_k) ya no se pueden cambiar: cualquier valor distinto del predeterminado devuelve un error. Se guía al modelo mediante instrucciones de sistema. - Los presupuestos de tokens deben revisarse, por el nuevo tokenizador.
Qué modelo elegir
La regla sigue siendo simple: Haiku para tareas simples y de gran volumen, Sonnet para la mayoría de las cargas de producción, Opus para el razonamiento más complejo. Sonnet 5 refuerza esa posición central al ofrecer más capacidad al mismo precio, lo que lo convierte en una opción por defecto razonable para la mayoría de las integraciones.
Si estás pensando en integrar un modelo Claude en un producto o en un sitio web, la elección del modelo y el control de los costes en tokens están entre las decisiones que pesan en el presupuesto real. Hablemos: te ayudo a definir la integración y a dimensionar el gasto antes de lanzarte.