VIERNES, 15 DE MAYO DE 2026
Cline libera @cline/sdk: runtime agéntico que bate a Claude Code en Terminal Bench 2.0
Cline libera @cline/sdk, el runtime que mueve su extensión y CLI (5M+ instalaciones, 61k+ stars). Stack TypeScript modular (@cline/shared, /llms, /agents, /core), CRON nativo, MCP y sesiones persistentes. Cline CLI con claude-opus-4.7 marca 74,2% en Terminal Bench 2.0 contra el 69,4% de Claude Code.
4 MIN LECTURAZyphra publica ZAYA1-8B: MoE de 760M activos entrenado íntegramente en AMD MI300X
MoE Apache 2.0 con 8B totales / ~760M activos por token que supera a Claude 4.5 Sonnet y Gemini-2.5-pro en AIME, HMMT y LiveCodeBench. Pesos en Hugging Face y endpoint serverless gratuito en cloud.zyphra.com.
Superpowers: 191k+ stars al framework de skills SKILL.md para Claude Code, Codex y Cursor
obra/superpowers (MIT) instala skills obligatorios que fuerzan al agente a brainstorm + worktree aislado + plan de micro-tareas antes de tocar código. Compatible con Claude Code, Codex, Cursor, Gemini CLI, OpenCode y Copilot CLI.
agentmemory by rohitg00: memoria persistente vía MCP con 95,2% R@5 y 92% menos tokens
Pipeline de 4 niveles (working/episodic/semantic/procedural) con decay tipo Ebbinghaus. 51 herramientas MCP, compatible con Claude Code, Cursor, Cline, Codex, OpenClaw y cualquier cliente MCP. Arranca con `npx @agentmemory/agentmemory`.
Jordan McCann construye solo otro 'agentmemory' y bate el récord de LongMemEval con 1.000$
96,20% en LongMemEval (481/500), superando el 95,60% de PwC Chronos. Hecho en 16 días en un PC gaming, sin equipo ni grado académico, en 46 ciclos de optimización. Async memory store con BM25 + vector + grafo.
claude-context: el MCP de Zilliz que recorta 39,4% el coste de tokens en Claude Code
Plugin MCP open-source que indexa tu repo con embeddings + Milvus para búsqueda semántica. Reduce 39,4% los tokens y 36,1% las tool calls preservando recall. Instalación: `npx @zilliz/claude-context-mcp@latest`.
Simon Willison: texto ejecutable con shebang `#!/usr/bin/env -S llm -t plantilla`
TIL de Simon Willison: convierte cualquier .sh en script LLM con tools embebidos vía plantillas YAML (prompt + system + funciones). Ejemplo con gpt-5.4-mini que ejecuta `add()` y `multiply()` para evitar alucinaciones aritméticas.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Texto ejecutable: shebang LLM con tool calls
Pones esto en `calc.sh` y se ejecuta con cualquier consulta como argumento: #!/usr/bin/env -S llm -t calc La plantilla `~/.config/llm/templates/calc.yaml`: model: gpt-5.4-mini system: Resuelve la operación usando las funciones disponibles. tools: - def add(a: float, b: float) -> float: return a + b - def multiply(a: float, b: float) -> float: return a * b Ahora `./calc.sh "2344 × 5252 + 134"` devuelve 12.310.822 ejecutando tool calls, no inventando. El mismo patrón sirve para queries a Datasette, scraping con `httpx` o cualquier función Python que metas en `tools:`.
- 01 K-Dense-AI/scientific-agent-skills: 133 SKILL.md MIT escaneados con Cisco AI Defense
- 02 VoltAgent/awesome-agent-skills: 1.000+ skills curados para Claude Code, Codex, Gemini CLI y Cursor
- 03 llm 0.32a2 (Simon Willison): nueva release con tool calls embebidos en plantillas YAML
- 04 Zyphra Cloud abre endpoint serverless gratuito para ZAYA1-8B
- 05 DEV.to: 'How to Build a Strong RAG Agent' — guía paso a paso de David Malick Dieng
Cierre
El día deja claro que el agente prearmado se está abriendo: Cline libera @cline/sdk el mismo día que Zyphra libera ZAYA1-8B bajo Apache 2.0 entrenado en AMD MI300X, y dos developers publican memory stores casi homónimos —rohitg00/agentmemory sobre MCP y JordanMcCann/agentmemory con récord en LongMemEval— que cualquiera puede enchufar a Claude Code o Cursor. La capa de memoria y la de skills dejan de ser secretos del runtime: con un npx y un SKILL.md consigues reducciones del 39% en tokens (claude-context) o 96% en recall (LongMemEval) sin tocar el modelo. Y mientras los frontiers pelean por benchmarks, lo que mueve la productividad esta semana es MIT, instalable con un comando y, en el caso de Willison, cabe en una shebang.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.