DOMINGO, 7 DE JUNIO DE 2026
Cursor mete custom stores, custom tools, auto-review y subagentes anidados en el SDK del agente
El SDK gana cuatro piezas a la vez: custom stores para persistir metadata y runs donde elijas, exponer tus funciones como tools del agente, revisión automática en cada llamada a tool local y subagentes anidados a cualquier profundidad. Tu orquestador artesanal pasa a ser un entorno de ejecución probado y auditable, sin pegamento manual entre delegaciones.
4 MIN LECTURAClaude Code v2.1.166 estrena `fallbackModel` con cascada de hasta tres modelos y endurece los mensajes entre sesiones
Si Sonnet se cae o se sobrecarga, el CLI prueba tu lista de hasta tres modelos de respaldo antes de fallar, también en sesiones interactivas. Patrones glob en reglas `deny` y mensajes cross-session que ya no llevan autoridad de usuario.
Open Notebook 1.9: alternativa MIT a NotebookLM 100% local con 18 proveedores y podcasts multi-speaker
PDF, vídeo, audio y web con búsqueda full-text y vectorial, y podcasts de hasta cuatro voces, todo dentro de un Docker. Sustituye NotebookLM con datos sensibles sin pagar tokens externos ni mandar nada a Google.
Simon Willison libera micropython-wasm: sandbox de Python en WASM para llamadas a herramientas de un LLM
MicroPython compilado a WASI y ejecutado desde Python con Wasmtime: sin acceso al filesystem ni red, con límites configurables de memoria, fuel y reloj. Lo enchufas como herramienta del LLM para ejecutar código generado sin riesgo de fuga del entorno.
Mastra mete patrón supervisor de primera clase en stream() y generate() con memoria aislada por subagente
Un supervisor coordina la delegación, cuenta iteraciones, evalúa cuándo parar y mantiene la memoria de cada subagente separada, expuesto con las mismas primitivas de stream() y generate() de un agente solo. Cero pegamento manual de mensajes ni colas.
MAI-Code-1-Flash llega a Copilot: el primer modelo de código propio de Microsoft con 60% menos tokens
Disponible en VS Code (CLI y API más tarde) y vía Fireworks, Baseten, OpenRouter y Microsoft Foundry. Microsoft afirma que rinde como Claude Haiku 4.5 con mejor precio por token: te sirve como triage barato si ya estás dentro de Copilot.
LangGraph 1.2.4 estrena DeltaChannel y ContextHubBackend: checkpoints incrementales y agent files versionados
DeltaChannel guarda solo el delta de cada paso en lugar del estado completo, así que tu hilo largo deja de hinchar el checkpointer. ContextHubBackend almacena los ficheros del agente como commits versionados del Hub de LangSmith.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Truncar embeddings Qwen3 con Matryoshka para cortar 4x el coste de RAG
# Qwen3-Embedding-8B emite vectores de 4096 dimensiones, pero # gracias a Matryoshka Representation Learning puedes guardar solo # las primeras 1024 (o 512) en tu vector store: -75% storage y # ~3x menos latencia con <3% de pérdida en NDCG@10. from sentence_transformers import SentenceTransformer import numpy as np model = SentenceTransformer("Qwen/Qwen3-Embedding-8B") # Trunca a la dim que te interese y RENORMALIZA # (crítico para que el coseno siga siendo comparable) def embed(texts: list[str], dim: int = 1024) -> np.ndarray: vecs = model.encode(texts, normalize_embeddings=False) vecs = vecs[:, :dim] norms = np.linalg.norm(vecs, axis=1, keepdims=True) return vecs / np.clip(norms, 1e-12, None) docs = embed(corpus, dim=1024) # ingesta barata query = embed([user_query], dim=1024) # Recupera top-50 con dim=1024 y rerankea con un cross-encoder pequeño
- 01 Cursor estrena Design Mode en su navegador: editas la UI con click, dibujo o voz y el agente toca el código
- 02 Microsoft publica MAI-Voice-2 y MAI-Transcribe-1.5: voz generativa y transcripción en 43 idiomas integradas en Copilot, Teams y Dynamics 365
- 03 Mistral 3 (3B / 8B / 14B + Large 3 MoE) disponibles bajo Apache 2.0 con variantes base, instruct y reasoning
- 04 Google publica Agent Development Kit para TypeScript con la misma sintaxis code-first del ADK de Python
- 05 Cursor mejora la facturación Teams con Premium seat y forecasting de gasto: espera bajar el coste al 90% de los equipos
Cierre
Hoy el patrón es claro: los SDKs de agente dejan de ser experimentos y empiezan a competir como primitivas estables de producción. Cursor mete custom stores, custom tools, revisión automática y subagentes anidados de cualquier profundidad — el orquestador hecho en casa empieza a oler a deuda técnica. Anthropic suma fallbackModel en Claude Code para que tu sesión no caiga cuando Sonnet se sobrecarga, y Simon Willison libera un sandbox WASM para que el LLM ejecute Python generado sin tocar tu disco. lfnovo sostiene Open Notebook como NotebookLM 100% local con 18 proveedores y podcasts multi-speaker, y LangGraph 1.2.4 corta el overhead de checkpointing con DeltaChannel. Lo que deja de tener sentido en producción: reescribir orquestadores de agente artesanales en cada proyecto, depender de un único modelo en el CLI sin red de seguridad, ejecutar código generado por un LLM en el host directamente, y mandar documentos sensibles a NotebookLM cuando el clon abierto cabe en un solo docker compose up.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.