5 minutos de IA

MIÉRCOLES, 20 DE MAYO DE 2026

NOTICIA DESTACADA

Google Antigravity 2.0: CLI, SDK y Managed Agents en la Gemini API para sustituir un harness propio

Antigravity sale del IDE y se convierte en plataforma: una CLI con multi-step reasoning, multi-file edit y tool calling (apta para SSH), un SDK con el mismo harness que Google usa internamente y Managed Agents que arrancan un agente con un único call a la Gemini API dentro de un sandbox Linux efímero (Bash, Python, Node, ficheros persistentes, web). Tienes un runtime alternativo a Claude Code y al Agent SDK de OpenAI sin tener que mantener el bucle de tool-use ni el sandbox tú mismo.

5 MIN LECTURA
NOTICIAS DEL DÍA
HERRAMIENTAS

Cursor Composer 2.5: 79,8% en SWE-Bench Multilingual a 1/10 del coste de Opus 4.7

Disponible en Cursor desde el 18 de mayo a $0,50/$2,50 por millón de tokens (in/out), entrenado sobre Kimi K2.5 con 25x más tareas sintéticas que la 2. Sube a $3/$15 en la variante fast. Misma calidad que Opus 4.7 y GPT-5.5 pero abarata 10x el coste de un agente que itera horas.

Cursor · 3 MIN LEER FUENTE →
HERRAMIENTAS

Managed Agents en Gemini API: un solo call arranca un agente con sandbox Linux

El Antigravity Agent es un managed agent general-purpose: un `POST` a la API y tienes razonamiento, ejecución de código, navegación web y filesystem persistente dentro de un sandbox aislado hosteado por Google. Lo extiendes registrando un `AGENTS.md` y `SKILL.md` propios — te ahorras montar Firecracker o gVisor para ejecutar código de un LLM en prod.

Google Developers Blog · 4 MIN LEER FUENTE →
TÉCNICAS

Anthropic abre cache diagnostics: descubre por qué tu prompt cache rompe

Nuevo beta header `cache-diagnosis-2026-04-07` y campo `diagnostics.previous_message_id` en Messages: la API compara turnos consecutivos y devuelve `cache_miss_reason` explicando dónde divergió el prefijo. Caches mal colocadas se cobraban a precio completo en silencio; ahora lo ves en el response.

Anthropic Docs · 3 MIN LEER FUENTE →
INDIE / COMUNIDAD

OpenGravity: clon BYOK open source de Antigravity en vanilla JS

Show HN del finde: HTML/CSS/JS puros, cero build, terminal xterm.js con sync de filesystem local y agente lateral que ejecuta comandos y edita ficheros. Lo nació la frustración con los rate limits del Antigravity oficial: lo abres en el navegador, metes tu key y trabajas sin telemetría de Google.

Hacker News · 3 MIN LEER FUENTE →
TUTORIALES

Simon Willison resume seis meses de LLMs en cinco minutos

Slides anotadas de su lightning talk en PyCon US 2026: noviembre 2025 como punto de inflexión, coding agents que ya sirven en prod, modelos locales por encima de expectativas y la caja del 'mejor modelo' cambiando de manos cinco veces. Útil para alinear stakeholders sin escribir un deck.

Simon Willison · 5 MIN LEER FUENTE →
OPEN SOURCE

Vercel AI SDK 6: Agent como abstracción de primera clase con ToolLoopAgent

Interface `Agent` con implementación lista (`ToolLoopAgent`), tool approval, DevTools, MCP completo, reranking y edición de imágenes. Defines un agente una vez (modelo, instrucciones, tools) y lo reusas en toda la app con streaming type-safe. Migración desde v5 sin breaking changes mayores.

Vercel · 4 MIN LEER FUENTE →
SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

cache-diagnosis: descubre por qué tu prompt cache se rompe sin avisar

El bug más caro y silencioso de un agente en prod: una `cache_control` mal colocada (o un mensaje del sistema que muta entre turnos) tira el caché y te facturan input completo sin error visible. Con el beta header `cache-diagnosis-2026-04-07` y `diagnostics.previous_message_id`, la API te dice exactamente dónde divergió el prefijo respecto al turno anterior. ```python from anthropic import Anthropic client = Anthropic() BETA = "cache-diagnosis-2026-04-07" SYSTEM = [{ "type": "text", "text": "Eres un asistente de soporte para ACME...", "cache_control": {"type": "ephemeral"}, }] first = client.messages.create( model="claude-opus-4-7", extra_headers={"anthropic-beta": BETA}, system=SYSTEM, messages=[{"role": "user", "content": "Hola"}], max_tokens=512, ) second = client.messages.create( model="claude-opus-4-7", extra_headers={"anthropic-beta": BETA}, diagnostics={"previous_message_id": first.id}, system=SYSTEM, messages=[ {"role": "user", "content": "Hola"}, {"role": "assistant", "content": first.content}, {"role": "user", "content": "¿Cuál es mi último pedido?"}, ], max_tokens=512, ) miss = getattr(second, "diagnostics", None) if miss and miss.cache_miss_reason: # Ej.: "system block changed after position 1024" log.warning("Cache miss: %s", miss.cache_miss_reason) ``` Cablealo en tu logger antes de subir caché de tools o de system. Una sola variable embebida en el system prompt (fecha, user_id, request_id) te tumba el 90% de descuento por token; el `cache_miss_reason` te dice qué quitar y mover fuera del bloque cacheable. Más barato debuggear esto en staging que descubrirlo en la factura.

ANTHROPIC DOCS VER FUENTE →

Cierre

El día gira en torno a la multiplicación de runtimes de agentes: Google estrena Antigravity 2.0 con CLI, SDK y Managed Agents que compiten directamente con Claude Code y el Agent SDK de OpenAI; Cursor publica Composer 2.5 a 1/10 del coste de Opus 4.7; y Vercel convierte el agente en abstracción de primera clase del AI SDK 6. El patrón emergente es claro: el harness se desacopla del modelo, los sandboxes para ejecutar código del LLM se externalizan y SKILL.md queda como capa portable entre proveedores. Encima, Anthropic abre cache diagnostics y deja de ser adivinanza saber por qué pagas precio completo. Lo que deja de ser válido para quien envía a prod: atarte a un solo runtime, mantener tu propio sandbox de ejecución para tareas que ya resuelve una API, y mergear código con prompt cache silenciosamente roto.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.