MIÉRCOLES, 3 DE JUNIO DE 2026
Nemotron 3 Ultra: 550B MoE de pesos abiertos para agentes, vivo en HF y OpenRouter el 4 de junio
MoE con 550B parámetros totales y solo 55B activos optimizado para tareas agénticas de larga duración: 300+ tokens/seg, 5× más rápido y hasta 30% más barato que la familia anterior. En HuggingFace, OpenRouter, ModelScope y build.nvidia.com el 4 de junio sin atarte a un proveedor cerrado: lo enchufas como motor de tu propia plataforma de agentes sin pagar GPT-5.5.
4 MIN LECTURAClaude Code 2.1.161 mete guardarraíles al shell y trocea métricas por equipo y repo
Avisa antes de tocar `.zshenv`, `.bash_login` o `~/.config/git/`, sanea configs de build-tool en acceptEdits y `OTEL_RESOURCE_ATTRIBUTES` aparece como label en cada métrica: cortas el vector típico de persistencia tras prompt injection y trocas coste y latencia por equipo o repo sin parchear el SDK.
GitHub Copilot CLI 1.0.58/59: dictado /voice y prompts programados con /every y /after
Dictado local con modelo STT sin nube y comandos `/every` y `/after` para programar prompts como un cron de agente, más rubber duck por defecto. Pasas del 'lanzo un prompt y miro' al agente desatendido con bucle de control en el terminal.
Cosmos 3 Nano: omnimodelo abierto de 16B que razona vídeo, imagen, audio y acciones
Razonador de 8B + generador de 8B abierto en HuggingFace: texto, imagen, vídeo, audio ambiental y trayectorias de acción en un solo modelo. Corre en una RTX PRO 6000 como cerebro de pipelines multimodales de robótica o vídeo sin pagar por minuto a un proveedor cerrado.
Zot: agent harness ligero en Go con tres modos de ejecución y cuatro herramientas built-in
Cliente unificado para Claude, Codex, Gemini, Kimi, DeepSeek y Bedrock con modos TUI, one-shot y NDJSON para CI, y solo read/write/edit/bash como herramientas. Alternativa minimalista a Claude Code cuando solo necesitas el bucle agéntico sin la opinión de Anthropic.
Trazas + eval gates: pattern de observabilidad de agentes en 2026 sobre OTel v1.41
Guía vendor-neutral que combina trazas en runtime con eval gates que bloquean regresiones en CI y detectan drift en producción, comparada sobre LangSmith, Braintrust y Langfuse usando las nuevas convenciones GenAI de OTel v1.41.
MCP 2026-07-28 Release Candidate: stateless, MCP Apps con UI servidor y extensión Tasks
Mayor revisión del protocolo desde el lanzamiento: elimina el handshake `initialize` para escalar sobre HTTP plano sin sticky sessions, alinea autorización con OAuth 2.0 + OIDC y formaliza MCP Apps (UIs renderizadas en servidor) y Tasks (trabajos largos).
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Trocear coste y latencia de Claude Code por equipo y repo con OTEL_RESOURCE_ATTRIBUTES
# v2.1.161 (2 jun 2026): OTEL_RESOURCE_ATTRIBUTES aparece como labels # en cada datapoint. Ya filtras coste y latencia por team, repo o proyecto # sin parchear el SDK ni levantar un proxy intermedio. # Exporta antes de lanzar claude (o en tu wrapper de shell) export CLAUDE_CODE_ENABLE_TELEMETRY=1 export OTEL_RESOURCE_ATTRIBUTES="team=plataforma,repo=portfolio,env=prod" export OTEL_METRICS_EXPORTER=otlp export OTEL_EXPORTER_OTLP_ENDPOINT=https://otel.tu-empresa.com # PromQL sobre los datapoints exportados (Prometheus / Grafana) sum by (team, repo) (rate(claude_code_token_input_total[1h])) sum by (team, repo) (rate(claude_code_token_output_total[1h])) histogram_quantile(0.95, sum by (team, repo, le) (rate(claude_code_tool_call_duration_seconds_bucket[5m])) )
- 01 NVIDIA Nemotron 3 Nano Omni unifica visión, audio y lenguaje con 9× más eficiencia para agentes
- 02 NVIDIA libera La-Proteina para diseño de proteínas a nivel atómico junto a Isaac GR00T y Alpamayo
- 03 Claude Opus 4.8 ya disponible en AWS Bedrock e integrado con Aurora MySQL Kiro
- 04 Cursor 3.6 abre modo Auto-review para sesiones largas con menos aprobaciones manuales
- 05 LiteParse v2.0 se reescribe en Rust y corre nativo en Rust, JS/TS, Python y WASM
Cierre
La diferenciación del día se mueve a “agente con guardarraíles”. NVIDIA Nemotron 3 Ultra entrega frontier MoE de pesos abiertos optimizado para agentes a una fracción del coste de GPT-5.5, y Cosmos 3 Nano lo lleva al terreno multimodal sin atar el pipeline a un proveedor cerrado. Claude Code 2.1.161 corta la persistencia post-injection en .zshenv y ~/.config/git/ y por fin habilita gobernanza real de coste por equipo y repo vía OTEL, mientras GitHub Copilot CLI suma dictado por voz y /every//after para agentes desatendidos en el terminal. El MCP 2026-07-28 RC elimina el handshake con initialize para escalar sobre HTTP plano sin sticky sessions. Lo que deja de tener sentido para quien envía a producción: pagar frontier cerrado cuando un MoE abierto iguala los workloads agénticos, ejecutar agentes sin labels de equipo en las métricas, mantener servidores MCP con estado pegajoso y dejar al agente escribir en scripts de arranque del shell sin un aviso explícito.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.