5 minutos de IA

DOMINGO, 7 DE JUNIO DE 2026

NOTICIA DESTACADA

Cursor mete custom stores, custom tools, auto-review y subagentes anidados en el SDK del agente

El SDK gana cuatro piezas a la vez: custom stores para persistir metadata y runs donde elijas, exponer tus funciones como tools del agente, revisión automática en cada llamada a tool local y subagentes anidados a cualquier profundidad. Tu orquestador artesanal pasa a ser un entorno de ejecución probado y auditable, sin pegamento manual entre delegaciones.

4 MIN LECTURA
NOTICIAS DEL DÍA
HERRAMIENTAS

Claude Code v2.1.166 estrena `fallbackModel` con cascada de hasta tres modelos y endurece los mensajes entre sesiones

Si Sonnet se cae o se sobrecarga, el CLI prueba tu lista de hasta tres modelos de respaldo antes de fallar, también en sesiones interactivas. Patrones glob en reglas `deny` y mensajes cross-session que ya no llevan autoridad de usuario.

Anthropic GitHub Releases · 3 MIN LEER FUENTE →
INDIE / COMUNIDAD

Open Notebook 1.9: alternativa MIT a NotebookLM 100% local con 18 proveedores y podcasts multi-speaker

PDF, vídeo, audio y web con búsqueda full-text y vectorial, y podcasts de hasta cuatro voces, todo dentro de un Docker. Sustituye NotebookLM con datos sensibles sin pagar tokens externos ni mandar nada a Google.

lfnovo / open-notebook · 4 MIN LEER FUENTE →
TÉCNICAS

Simon Willison libera micropython-wasm: sandbox de Python en WASM para llamadas a herramientas de un LLM

MicroPython compilado a WASI y ejecutado desde Python con Wasmtime: sin acceso al filesystem ni red, con límites configurables de memoria, fuel y reloj. Lo enchufas como herramienta del LLM para ejecutar código generado sin riesgo de fuga del entorno.

Simon Willison's Weblog · 4 MIN LEER FUENTE →
OPEN SOURCE

Mastra mete patrón supervisor de primera clase en stream() y generate() con memoria aislada por subagente

Un supervisor coordina la delegación, cuenta iteraciones, evalúa cuándo parar y mantiene la memoria de cada subagente separada, expuesto con las mismas primitivas de stream() y generate() de un agente solo. Cero pegamento manual de mensajes ni colas.

Mastra AI · 4 MIN LEER FUENTE →
INDUSTRIA

MAI-Code-1-Flash llega a Copilot: el primer modelo de código propio de Microsoft con 60% menos tokens

Disponible en VS Code (CLI y API más tarde) y vía Fireworks, Baseten, OpenRouter y Microsoft Foundry. Microsoft afirma que rinde como Claude Haiku 4.5 con mejor precio por token: te sirve como triage barato si ya estás dentro de Copilot.

GitHub Changelog · 3 MIN LEER FUENTE →
OPEN SOURCE

LangGraph 1.2.4 estrena DeltaChannel y ContextHubBackend: checkpoints incrementales y agent files versionados

DeltaChannel guarda solo el delta de cada paso en lugar del estado completo, así que tu hilo largo deja de hinchar el checkpointer. ContextHubBackend almacena los ficheros del agente como commits versionados del Hub de LangSmith.

LangChain Releases · 3 MIN LEER FUENTE →
SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Truncar embeddings Qwen3 con Matryoshka para cortar 4x el coste de RAG

# Qwen3-Embedding-8B emite vectores de 4096 dimensiones, pero # gracias a Matryoshka Representation Learning puedes guardar solo # las primeras 1024 (o 512) en tu vector store: -75% storage y # ~3x menos latencia con <3% de pérdida en NDCG@10. from sentence_transformers import SentenceTransformer import numpy as np model = SentenceTransformer("Qwen/Qwen3-Embedding-8B") # Trunca a la dim que te interese y RENORMALIZA # (crítico para que el coseno siga siendo comparable) def embed(texts: list[str], dim: int = 1024) -> np.ndarray: vecs = model.encode(texts, normalize_embeddings=False) vecs = vecs[:, :dim] norms = np.linalg.norm(vecs, axis=1, keepdims=True) return vecs / np.clip(norms, 1e-12, None) docs = embed(corpus, dim=1024) # ingesta barata query = embed([user_query], dim=1024) # Recupera top-50 con dim=1024 y rerankea con un cross-encoder pequeño

QWEN TEAM — MATRYOSHKA REPRESENTATION LEARNING VER FUENTE →

Cierre

Hoy el patrón es claro: los SDKs de agente dejan de ser experimentos y empiezan a competir como primitivas estables de producción. Cursor mete custom stores, custom tools, revisión automática y subagentes anidados de cualquier profundidad — el orquestador hecho en casa empieza a oler a deuda técnica. Anthropic suma fallbackModel en Claude Code para que tu sesión no caiga cuando Sonnet se sobrecarga, y Simon Willison libera un sandbox WASM para que el LLM ejecute Python generado sin tocar tu disco. lfnovo sostiene Open Notebook como NotebookLM 100% local con 18 proveedores y podcasts multi-speaker, y LangGraph 1.2.4 corta el overhead de checkpointing con DeltaChannel. Lo que deja de tener sentido en producción: reescribir orquestadores de agente artesanales en cada proyecto, depender de un único modelo en el CLI sin red de seguridad, ejecutar código generado por un LLM en el host directamente, y mandar documentos sensibles a NotebookLM cuando el clon abierto cabe en un solo docker compose up.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.