MARTES, 26 DE MAYO DE 2026
Bernstein orquesta 44 agentes de IA en paralelo con una cadena de auditoría firmada (Apache 2.0)
Reparte un objetivo entre Claude Code, Codex, Gemini CLI y 41 agentes más en worktrees git paralelos, con un planificador determinista en Python (cero tokens en la coordinación). Valida con lint, tipos, tests y revisión cruzada antes de fusionar y firma cada paso con cadena HMAC: reproducible y auditable. Lo instalas con pipx.
4 MIN LECTURAGenkit Middleware: reintentos, fallback de modelo y aprobación por herramienta sin tocar el pipeline
Hooks componibles (TS, Go, Dart) sobre Genkit: reintento con backoff, fallback a un modelo más barato cuando el grande agota cuota y aprobación o sandbox por herramienta. Metes fiabilidad y control de coste alrededor de cada llamada sin reescribir el pipeline.
Cordon: gateway de seguridad para llamadas MCP con aprobación humana
Proxy transparente entre tu cliente LLM y los servidores MCP con política por herramienta (permitir, bloquear, aprobar, solo lectura), aprobación humana y log de auditoría: frena las acciones destructivas antes de que pasen, sin tocar el agente.
Future AGI: plataforma autoalojable (Apache 2.0) de evals y observabilidad para agentes
Trazas OpenTelemetry, 50+ métricas de evaluación (alucinación, uso de herramientas), guardrails y un gateway con caché semántica, todo en Docker. Gobiernas calidad y coste de tus agentes sin atarte a un SaaS.
El playbook 2026 para recortar 3-4x el coste en tokens de la memoria de agentes
La clave es trabajar al guardar (organizar, relacionar y comprimir una vez), no al recuperar en cada turno: un caso medido baja de 594 a 166 tokens por llamada (72% menos) con la misma calidad. Con implementación de código abierto en el SDK de Mem0.
Airbyte Agents: capa de datos para agentes vía MCP que recorta hasta 80% de tokens
Un Context Store pre-indexa Salesforce, HubSpot o tus bases de datos y el agente consulta un índice unificado en vez de llamar a la API en vivo. Resultado: ~40% menos llamadas a herramientas y hasta 80% menos tokens, con auth y conectores gestionados.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Subagente con skill precargada, modelo barato y worktree
# .claude/agents/db-migrator.md — subagente acotado, barato y aislado --- name: db-migrator description: Escribe y revisa migraciones SQL. Úsalo al tocar el esquema. tools: Read, Grep, Glob, Edit, Bash # solo lo necesario, nada más model: haiku # tarea acotada -> modelo rápido y barato skills: - postgres-migrations # inyecta la skill ENTERA al arrancar, no su resumen isolation: worktree # copia aislada del repo; se descarta si no hay cambios memory: project # acumula patrones del repo entre sesiones --- Eres un especialista en migraciones de Postgres. Genera siempre migraciones reversibles, valida el rollback y no toques tablas fuera del alcance del ticket.
- 01 Kimi K2.6: MoE de 1T de pesos abiertos con INT4 nativo y Agent Swarm
- 02 Airlock: gateway MCP con permisos y aprobación humana para agentes
- 03 GLM-5: modelo de pesos abiertos (MIT) para ingeniería agéntica
- 04 agno: construye, ejecuta y gestiona plataformas de agentes
- 05 Mem0: el algoritmo de memoria eficiente en tokens, explicado
Cierre
El hilo de hoy: cuando metes agentes en producción, la pieza que importa ya no es el modelo, sino el cinturón de seguridad que lo rodea. Bernstein orquesta una flota de agentes (Claude Code, Codex, Gemini CLI…) con un planificador determinista y una cadena de auditoría firmada; Genkit añade reintentos y fallback de modelo alrededor de cada llamada; y Cordon convierte la seguridad de MCP en una categoría propia —proxy, política por herramienta y aprobación humana antes de cada acción destructiva—. En paralelo, la economía de tokens se vuelve disciplina de ingeniería: Mem0 trabaja al guardar para recortar 3-4x el coste de la memoria, Airbyte pre-indexa los datos para que el agente no llame a la API en vivo, y Future AGI mide alucinación, coste y trazas de forma autoalojada. Lo que deja de ser válido para quien envía a producción: paralelizar agentes sin un registro reproducible y firmado, exponer servidores MCP sin política ni aprobación humana, y pagar tokens por recuperar en cada turno lo que deberías haber comprimido al guardar.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.