DOMINGO, 24 DE MAYO DE 2026
LangGraph 1.2: timeouts por nodo, manejadores de error tipo Saga y apagado con checkpoint reanudable
Ataca los fallos reales de un agente en producción: timeouts por nodo (run_timeout/idle_timeout) que cortan las tormentas de reintentos, un error_handler tipado para patrones Saga/compensación que revierte y reencamina tras agotar reintentos, y apagado cooperativo que guarda un checkpoint reanudable. El nuevo DeltaChannel recorta el coste de checkpoint en hilos largos. Lo enchufas a tu grafo sin reescribir la lógica.
4 MIN LECTURAClaude Code 2.1.149: `/usage` por categoría y `/code-review` con comentarios en línea en la PR
`/usage` desglosa el gasto por skills, subagentes, plugins y servidor MCP para ver qué dispara tus límites; `/code-review` deja los hallazgos como comentarios en línea en la PR. Incluye una corrección de un bypass de permisos en PowerShell.
Codex CLI: perfiles de permisos heredables y `requirements.toml` gestionado para gobernar agentes
Los perfiles de permisos ahora se heredan y un `requirements.toml` gestionado deja que la organización fije qué puede tocar el agente en cada repo. Goals queda activo por defecto y el descubrimiento de plugins lee el marketplace.
Gemini CLI 0.43.0: exporta e importa sesiones y estima tokens de forma adaptativa
Exporta una sesión a fichero y la reimportas después: las ejecuciones del agente se vuelven reproducibles y compartibles en el equipo. La estimación adaptativa de tokens y las ediciones quirúrgicas recortan el gasto de contexto y de API.
Capframe: tokens de capacidad revocables y política en runtime para llamadas a herramientas MCP
Tres módulos en Rust que emiten tokens de capacidad revocables y evalúan cada llamada MCP contra una política en microsegundos, sin LLM en la decisión. Cada llamada deja un recibo firmado como evidencia de auditoría (OWASP LLM, NIST AI RMF, MITRE ATLAS).
Curso abierto: monta un RAG agéntico de producción en 7 semanas (OpenSearch + LangGraph)
Currículo en GitHub que construye un asistente sobre arXiv con la progresión real de producción: BM25 → búsqueda híbrida → RAG agéntico, con Docker, FastAPI, observabilidad con Langfuse y caché en Redis. Releases etiquetadas por fase.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Gate de fidelidad RAG en CI con promptfoo
# promptfooconfig.yaml — el CI falla si el RAG alucina. Ejecuta: npx promptfoo@latest eval description: "Gate de faithfulness para RAG" prompts: - "Responde usando SOLO este contexto.\nContexto: {{context}}\nPregunta: {{query}}" providers: - openai:gpt-5.5 # el modelo que sirve tu RAG defaultTest: assert: - type: context-faithfulness # cada afirmación debe apoyarse en el contexto threshold: 0.85 # < 0.85 => job en rojo, no se despliega - type: answer-relevance # la respuesta debe ir a la pregunta threshold: 0.8 tests: - vars: # trampa: el contexto no habla de agua query: "¿La garantía cubre daños por agua?" context: "La garantía cubre defectos de fabricación durante 24 meses." # promptfoo devuelve exit code != 0 -> intégralo como paso de tu pipeline
- 01 Cursor 3.5: automatizaciones multi-repo y sin repositorio en la Agents Window
- 02 Carbon: modelos genómicos de base abiertos de Hugging Face, con demo en Spaces
- 03 vLLM v0.21.0 soporta DeepSeek V4 con ROCm/AMD y descarga de KV
- 04 OpenAI se une a C2PA y marca con SynthID las imágenes de ChatGPT y la API
- 05 Ollama 0.24 integra la app de Codex y worktrees de git para agentes locales
Cierre
El hilo de hoy es que los agentes pasan de “funcionan en la demo” a “aguantan en producción”, y la diferencia ya no está en el modelo sino en lo que lo rodea. LangGraph 1.2 mete timeouts por nodo y recuperación de errores tipo Saga para que un agente deje de tumbarse con tormentas de reintentos; Claude Code, Codex y Gemini CLI convergen el mismo día en gobernanza —coste por categoría, perfiles de permisos heredables, sesiones reproducibles—; y Capframe baja el control hasta cada llamada a herramienta MCP con tokens revocables y recibos auditables. El patrón que emerge: fiabilidad, coste, permisos y evaluación dejan de ser un extra y se vuelven parte del entorno de ejecución. Lo que deja de ser válido para quien envía a producción: lanzar agentes sin condición de parada ni rollback, no saber qué skill o servidor MCP te dispara la factura, y desplegar un RAG sin un gate de fidelidad que falle el CI antes que el cliente.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.