JUEVES, 21 DE MAYO DE 2026
Cactus Needle: modelo MIT de 26M para function calling on-device en un binario de 14MB
Distilled de Gemini 3.1, corre a 6000 tok/s prefill y 1200 tok/s decode con footprint INT4 de 14MB en móvil, smartwatch o navegador. Pesos, dataset y playground web en MIT: montas un agente con tool calling sin pagar inferencia ni mandar payloads a un proveedor cerrado, ideal para edge y privacy-first.
5 MIN LECTURAStatewright: state machine guardrails Apache 2.0 para Claude Code, Codex y Cursor
Restringe los tools del agente por fase: planning solo lee, implementación edita, testing corre tests. Engine Apache 2.0 + plugin Claude Code y MCP gateway: bloquea `rm -rf` aunque Bash esté permitido.
Claude Code 2.1.145: `claude agents --json` y trazas OTEL con agent_id por subagent
Subcomando que lista las sesiones vivas como JSON para tmux, status bars o pickers. Las spans `claude_code.tool` añaden `agent_id` y `parent_agent_id`: trazas qué subagente llamó qué tool en una flota multi-agent.
Anthropic compra Stainless por más de 300M y cierra los hosted SDK tools
La startup que compila los SDK oficiales de OpenAI, Google, Cloudflare y la propia Anthropic ahora es suya. Si usabas su MCP server hosted, toca migrar; los rivales quedan obligados a rebuilder su pipeline.
Claude Context: MCP de semantic code search con Milvus que recorta 40% de tokens
Hybrid search BM25 + dense embeddings sobre tu repo, indexado en Milvus o Zilliz Cloud con AST-aware chunking. Cualquier cliente MCP (Claude Code, Cursor, Codex, Cline) deja de grepear: ~40% menos tokens y MIT, sin vendor lock-in.
Simon Willison destripa Antigravity: el SDK es un wrapper Python sobre un binario Go cerrado
Su lectura del I/O 2026: el 'open source' Antigravity SDK es un wrapper Python sobre un binario Go propietario, y Spark corre cada tarea en VM efímera. Útil si integras ese harness y te importa qué piezas controlas.
OpenCode cruza 150K estrellas y supera a Claude Code en GitHub
El runtime MIT de Anomaly suma 6,5M devs activos al mes, 850 contributors, 75+ proveedores y una v2 API para listar modelos. Alternativa real si no quieres atarte a Anthropic ni a OpenAI.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
claude agents --json: status bar de tmux para tu flota de Claude Code
La 2.1.145 añade `claude agents --json` y mete `agent_id` / `parent_agent_id` en las spans OTEL. Con eso ya puedes ver en la status bar de tmux cuántas sesiones de Claude Code corren, cuántas están bloqueadas esperando input tuyo y cuántas son background — antes había que `tab` a ciegas o tirar de un fork community. ```bash #!/usr/bin/env bash # ~/bin/tmux-claude.sh — requiere claude-code >= 2.1.145 y jq set -euo pipefail json=$(claude agents --json 2>/dev/null || echo '[]') total=$(echo "$json" | jq 'length') if [[ $total -eq 0 ]]; then echo "claude: idle" exit 0 fi waiting=$(echo "$json" \ | jq '[.[] | select(.state == "awaiting_input")] | length') running=$(echo "$json" \ | jq '[.[] | select(.state == "running")] | length') bg=$(echo "$json" \ | jq '[.[] | select(.tags // [] | index("bg"))] | length') if [[ $waiting -gt 0 ]]; then echo "claude: ${waiting}⚠ | ${running}▶ | ${bg}bg" else echo "claude: ${running}▶ | ${bg}bg" fi ``` Y en `~/.tmux.conf`: ```tmux set -g status-interval 5 set -g status-right "#(~/bin/tmux-claude.sh) | %H:%M" ``` Es la primera vez que Anthropic da una API estable para enganchar el estado del agente al sistema. Si encima exportas las spans OTEL a tu colector (Honeycomb, Tempo, Datadog), el `parent_agent_id` deja por fin agrupable la traza de un sub-agente bajo su dispatcher en una flota multi-agent — antes los spans aparecían huérfanos y debugger un agente que llama a otros era ejercicio de adivinanza.
- 01 Gemini Spark: agente 24/7 con MCP nativo y VM efímera por tarea, beta US Workspace
- 02 KPMG despliega Claude para 276.000 empleados en su Digital Gateway
- 03 OpenAI lleva Codex a iOS y Android: revisión, aprobación y nuevas tareas desde el móvil
- 04 Cline abre el SDK del runtime y migra sus extensiones de IDE encima
- 05 Cursor 3.4: Microsoft Teams nativo y entornos multi-repo para agentes
Cierre
El día tiene un eje claro: el runtime de agentes se vuelve instrumentable y el tool calling baja a hardware de consumidor. Cactus distila Gemini 3.1 en 26M parámetros MIT y deja las llamadas a herramientas viables en móvil o navegador; Statewright mete state-machine guardrails a Claude Code, Codex y Cursor vía MCP; y Anthropic publica claude agents --json con agent_id/parent_agent_id en OTEL — la flota de subagentes deja de ser una caja negra. El movimiento de fondo: Anthropic se traga Stainless y se queda con la cadena de SDK y MCP servers que usan OpenAI, Google y Cloudflare. Lo que deja de ser válido para quien envía a prod: depender del SDK hosted ajeno, lanzar agentes multi-step sin restricciones por fase, y pagar inferencia cloud para tool calling que ya cabe en 14MB INT4.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.