Anthropic ha subido el listón con el lanzamiento de Claude Sonnet 4.5, un modelo que la compañía no duda en calificar como “el mejor del mundo en codificación”. Pero este avance no se queda solo en potencia de programación: también viene con mejoras clave en razonamiento, matemáticas, y capacidades para construir agentes inteligentes que interactúan con computadoras de forma más sofisticada que nunca.
Uno de los hitos más destacados: Claude Sonnet 4.5 ha alcanzado una puntuación del 61.4% en OSWorld, una prueba que evalúa cómo los modelos se desempeñan en tareas informáticas reales. Además, encabeza la tabla en SWE-bench Verified, el benchmark de referencia en habilidades de codificación en el mundo real.
Claude: Más que un modelo, una suite de herramientas para desarrolladores
Junto con el nuevo modelo, Anthropic también ha mejorado su ecosistema de productos:
- Claude Code ahora permite guardar puntos de control para volver a estados anteriores del desarrollo.
- La interfaz tipo terminal ha sido rediseñada.
- Una nueva extensión para VS Code lleva el poder de Claude directamente al entorno de desarrollo.
Para quienes usan la API, se ha añadido una función de edición de contexto, que limpia automáticamente información obsoleta, y una herramienta de memoria externa, ideal para tareas largas sin chocar con los límites del contexto.
Además, ya está disponible la extensión de Claude para Chrome, exclusiva para quienes se unieron a la lista de espera, y se ha lanzado el SDK de Claude Agent, que permite a los desarrolladores construir agentes personalizados sobre la misma infraestructura usada por Claude Code.
¿Dónde puedes usar Claude 4.5?
Claude Sonnet 4.5 ya está disponible en:
- Plataforma para Desarrolladores de Claude
- Amazon Bedrock
- Vertex AI de Google Cloud
Con precios que se mantienen igual que su predecesor: $3 (entrada) / $15 (salida) por millón de tokens.
Más inteligente, más ético
Anthropic asegura que este es su modelo “fronterizo más alineado hasta ahora”, con mejoras para reducir comportamientos indeseados como la adulación excesiva, el engaño o el intento de manipulación. El modelo opera bajo las protecciones de Seguridad de IA Nivel 3, con filtros activos para bloquear entradas o salidas peligrosas.
Y como si fuera poco, los suscriptores Max pueden probar la función experimental “Imagine with Claude”, una vista previa de 5 días que demuestra cómo el modelo genera software en tiempo real, combinando creatividad y precisión técnica en una experiencia única.