Needle 26M: function calling MIT para agentes on-device

JUEVES, 21 DE MAYO DE 2026

NOTICIA DESTACADA

Cactus Needle: modelo MIT de 26M para function calling on-device en un binario de 14MB

Distilled de Gemini 3.1, corre a 6000 tok/s prefill y 1200 tok/s decode con footprint INT4 de 14MB en móvil, smartwatch o navegador. Pesos, dataset y playground web en MIT: montas un agente con tool calling sin pagar inferencia ni mandar payloads a un proveedor cerrado, ideal para edge y privacy-first.

5 MIN LECTURA

NOTICIAS DEL DÍA

OPEN SOURCE

Statewright: state machine guardrails Apache 2.0 para Claude Code, Codex y Cursor

Restringe los tools del agente por fase: planning solo lee, implementación edita, testing corre tests. Engine Apache 2.0 + plugin Claude Code y MCP gateway: bloquea `rm -rf` aunque Bash esté permitido.

Hacker News · 4 MIN LEER FUENTE →

HERRAMIENTAS

Claude Code 2.1.145: `claude agents --json` y trazas OTEL con agent_id por subagent

Subcomando que lista las sesiones vivas como JSON para tmux, status bars o pickers. Las spans `claude_code.tool` añaden `agent_id` y `parent_agent_id`: trazas qué subagente llamó qué tool en una flota multi-agent.

Claude Code Docs · 3 MIN LEER FUENTE →

INDUSTRIA

Anthropic compra Stainless por más de 300M y cierra los hosted SDK tools

La startup que compila los SDK oficiales de OpenAI, Google, Cloudflare y la propia Anthropic ahora es suya. Si usabas su MCP server hosted, toca migrar; los rivales quedan obligados a rebuilder su pipeline.

TechCrunch · 3 MIN LEER FUENTE →

OPEN SOURCE

Claude Context: MCP de semantic code search con Milvus que recorta 40% de tokens

Hybrid search BM25 + dense embeddings sobre tu repo, indexado en Milvus o Zilliz Cloud con AST-aware chunking. Cualquier cliente MCP (Claude Code, Cursor, Codex, Cline) deja de grepear: ~40% menos tokens y MIT, sin vendor lock-in.

GitHub · 4 MIN LEER FUENTE →

TUTORIALES

Simon Willison destripa Antigravity: el SDK es un wrapper Python sobre un binario Go cerrado

Su lectura del I/O 2026: el 'open source' Antigravity SDK es un wrapper Python sobre un binario Go propietario, y Spark corre cada tarea en VM efímera. Útil si integras ese harness y te importa qué piezas controlas.

Simon Willison · 4 MIN LEER FUENTE →

INDIE / COMUNIDAD

OpenCode cruza 150K estrellas y supera a Claude Code en GitHub

El runtime MIT de Anomaly suma 6,5M devs activos al mes, 850 contributors, 75+ proveedores y una v2 API para listar modelos. Alternativa real si no quieres atarte a Anthropic ni a OpenAI.

GitHub · 3 MIN LEER FUENTE →

SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

claude agents --json: status bar de tmux para tu flota de Claude Code

La 2.1.145 añade `claude agents --json` y mete `agent_id` / `parent_agent_id` en las spans OTEL. Con eso ya puedes ver en la status bar de tmux cuántas sesiones de Claude Code corren, cuántas están bloqueadas esperando input tuyo y cuántas son background — antes había que `tab` a ciegas o tirar de un fork community. ```bash #!/usr/bin/env bash # ~/bin/tmux-claude.sh — requiere claude-code >= 2.1.145 y jq set -euo pipefail json=$(claude agents --json 2>/dev/null || echo '[]') total=$(echo "$json" | jq 'length') if [[ $total -eq 0 ]]; then echo "claude: idle" exit 0 fi waiting=$(echo "$json" \ | jq '[.[] | select(.state == "awaiting_input")] | length') running=$(echo "$json" \ | jq '[.[] | select(.state == "running")] | length') bg=$(echo "$json" \ | jq '[.[] | select(.tags // [] | index("bg"))] | length') if [[ $waiting -gt 0 ]]; then echo "claude: ${waiting}⚠ | ${running}▶ | ${bg}bg" else echo "claude: ${running}▶ | ${bg}bg" fi ``` Y en `~/.tmux.conf`: ```tmux set -g status-interval 5 set -g status-right "#(~/bin/tmux-claude.sh) | %H:%M" ``` Es la primera vez que Anthropic da una API estable para enganchar el estado del agente al sistema. Si encima exportas las spans OTEL a tu colector (Honeycomb, Tempo, Datadog), el `parent_agent_id` deja por fin agrupable la traza de un sub-agente bajo su dispatcher en una flota multi-agent — antes los spans aparecían huérfanos y debugger un agente que llama a otros era ejercicio de adivinanza.

CLAUDE CODE DOCS VER FUENTE →

LO DEMÁS DE HOY

Cierre

El día tiene un eje claro: el runtime de agentes se vuelve instrumentable y el tool calling baja a hardware de consumidor. Cactus distila Gemini 3.1 en 26M parámetros MIT y deja las llamadas a herramientas viables en móvil o navegador; Statewright mete state-machine guardrails a Claude Code, Codex y Cursor vía MCP; y Anthropic publica claude agents --json con agent_id/parent_agent_id en OTEL — la flota de subagentes deja de ser una caja negra. El movimiento de fondo: Anthropic se traga Stainless y se queda con la cadena de SDK y MCP servers que usan OpenAI, Google y Cloudflare. Lo que deja de ser válido para quien envía a prod: depender del SDK hosted ajeno, lanzar agentes multi-step sin restricciones por fase, y pagar inferencia cloud para tool calling que ya cabe en 14MB INT4.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.

RESERVAR LLAMADA → VER SERVICIOS

VER TODAS LAS EDICIONES