MIÉRCOLES, 10 DE JUNIO DE 2026
Anthropic libera Claude Fable 5, primer modelo Mythos público, con agentes que corren días y 1M de contexto
Mythos-class para todos con 1M de contexto, 128k de salida, 80,3% en SWE-bench Pro y 88% en Terminal-Bench 2.1. Corre días planificando, delegando a subagentes y verificándose. $10/$50 por millón de tokens, gratis en Pro/Max hasta el 22 de junio.
5 MIN LECTURAClaude Code v2.1.170 incorpora Fable 5 como modelo y arregla el guardado de transcripts desde VS Code
El CLI suma Fable 5 al selector sin tocar configuración: lo arrancas con `--model claude-fable-5` y heredas skills, hooks y MCPs que ya tenías para Opus 4.8. Cero coste de migración para flotas que ya estaban en Anthropic.
GitHub Copilot pasa Fable 5 a GA en chat, agente, code review y CLI desde el primer día
Pro, Pro+, Business y Enterprise pueden elegir Fable 5 en cualquier superficie de Copilot sin lista de espera. Mismas safeguards que en Anthropic: si tu pipeline ya usaba Opus 4.8, cambias el `model` y reduces turns en tareas largas.
Cline 3.89.0 y CLI 3.0.22 añaden Fable 5 y arreglan el thinking de MiniMax M3 entre gateways
El plugin de VS Code, JetBrains y el CLI lo enchufan al selector el mismo día y limpian el catálogo de Codex. Útil si quieres Fable 5 dentro de tu agente abierto sin atarte a Claude Code ni a Copilot.
Cognition publica FrontierCode: 150 PRs reales de código abierto y Fable 5 lo lidera con 29,3%
Reemplaza el benchmark sintético con repos checked-out, issues reales y verificación por tests ocultos más rúbricas anti-pattern. Marco utilizable para comparar tu propio agente frente a Devin sin pagar evaluaciones a medida.
Anthropic publica la guía oficial de prompting para Fable 5: auditoría, restricciones, subagentes y memoria
Cuatro patrones específicos: auditar progreso contra resultados reales de tools, declarar constraints explícitas, dar criterios de delegación a subagentes y registrar lecciones por fichero. Aplicable a cualquier agente con un buen system prompt.
Project Glasswing crece a 150 organizaciones y despliega Mythos 5 con salvaguardas cyber levantadas
Apple, NVIDIA, Microsoft, CrowdStrike y Palo Alto reciben acceso a un Mythos sin restricciones cyber para escanear su código en busca de vulnerabilidades. Si vendes infra crítica, el cliente puede pedir que el mismo modelo audite tu pipeline.
Simon Willison publica zip-wheel-explorer y pypi-changelog: diffs de wheels de PyPI en el navegador
Dos herramientas HTML one-shot que descargan el `.whl` de cualquier paquete, lo descomprimen en memoria y renderizan el diff entre versiones. Útil para auditar dependencias de Python desde un agente sin clonar repos ni levantar entorno.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Auditar el progreso del agente contra los tool results reales
# System prompt para sesiones autónomas largas con Fable 5 / Opus 4.8. # Patrón recomendado en la guía oficial de Fable 5: en evals adversarias # diseñadas para provocar status reports inventados, este check # "casi elimina" la fabricación. Antes de declarar COMPLETADO cualquier paso del plan, auditate: 1. Lista los tool_use_id ejecutados desde el último check-in. 2. Para cada afirmación del status, cita el tool_use_id o el bloque de output que la respalda literalmente. 3. Si una afirmación NO tiene respaldo en un tool_result real, marca el paso como NO COMPLETADO y vuelve a ejecutarlo. Restricciones duras (NO actuar fuera de esta lista): - NO inferir el estado de un fichero desde el plan; léelo con read_file. - NO declarar tests "passing" sin un exit code 0 real en pantalla. - NO delegar a un subagente sin describir su objetivo y su criterio de parada en una frase. Formato del report: bullets de "<afirmación> -> <tool_use_id que la respalda>"
- 01 AWS Bedrock añade Claude Fable 5 con safeguards integradas y batch pricing $5/$25 por MTok
- 02 Harvey enchufa Fable 5 a su pila legal con razonamiento de horas sobre PDFs largos
- 03 OpenRouter publica un benchmark de 11 LLMs jugando 30 juegos con $482 de inferencia
- 04 Cursor estrena Design Mode en el navegador y abre forecast de gasto por seat en Teams
- 05 Codex TUI deja de añadir blanks al streaming y permite seguir editando un prompt cancelado
Cierre
El día gira en torno a Claude Fable 5: el primer modelo Mythos público de Anthropic sale con 1M de contexto, 80,3% en SWE-bench Pro y, sobre todo, con un harness pensado para correr días planificando, delegando a subagentes y auditándose. La consecuencia para quien envía a producción es directa: Claude Code v2.1.170, GitHub Copilot, Cline 3.89.0 y Devin ya lo enchufan en su selector el mismo día, así que la decisión deja de ser “qué modelo uso” y pasa a ser “qué patrón de prompting impide que mi agente fabule en una sesión de doce horas”. Ahí es donde la guía oficial de prompting de Fable 5 importa más que el benchmark: auditar progreso contra tool_use_id reales, declarar restricciones duras y dar criterios de parada a los subagentes es lo que separa un agente que cobra horas de uno que cobra alucinaciones. Project Glasswing crecido a 150 organizaciones recuerda que el otro filo del mismo modelo —Mythos 5 con safeguards cyber levantadas— ya está dentro de Apple, NVIDIA y Microsoft revisando código real.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.