5 minutos de IA

MIÉRCOLES, 3 DE JUNIO DE 2026

NOTICIA DESTACADA

Nemotron 3 Ultra: 550B MoE de pesos abiertos para agentes, vivo en HF y OpenRouter el 4 de junio

MoE con 550B parámetros totales y solo 55B activos optimizado para tareas agénticas de larga duración: 300+ tokens/seg, 5× más rápido y hasta 30% más barato que la familia anterior. En HuggingFace, OpenRouter, ModelScope y build.nvidia.com el 4 de junio sin atarte a un proveedor cerrado: lo enchufas como motor de tu propia plataforma de agentes sin pagar GPT-5.5.

4 MIN LECTURA
NOTICIAS DEL DÍA
HERRAMIENTAS

Claude Code 2.1.161 mete guardarraíles al shell y trocea métricas por equipo y repo

Avisa antes de tocar `.zshenv`, `.bash_login` o `~/.config/git/`, sanea configs de build-tool en acceptEdits y `OTEL_RESOURCE_ATTRIBUTES` aparece como label en cada métrica: cortas el vector típico de persistencia tras prompt injection y trocas coste y latencia por equipo o repo sin parchear el SDK.

Anthropic · 3 MIN LEER FUENTE →
HERRAMIENTAS

GitHub Copilot CLI 1.0.58/59: dictado /voice y prompts programados con /every y /after

Dictado local con modelo STT sin nube y comandos `/every` y `/after` para programar prompts como un cron de agente, más rubber duck por defecto. Pasas del 'lanzo un prompt y miro' al agente desatendido con bucle de control en el terminal.

GitHub · 3 MIN LEER FUENTE →
OPEN SOURCE

Cosmos 3 Nano: omnimodelo abierto de 16B que razona vídeo, imagen, audio y acciones

Razonador de 8B + generador de 8B abierto en HuggingFace: texto, imagen, vídeo, audio ambiental y trayectorias de acción en un solo modelo. Corre en una RTX PRO 6000 como cerebro de pipelines multimodales de robótica o vídeo sin pagar por minuto a un proveedor cerrado.

NVIDIA / Hugging Face · 4 MIN LEER FUENTE →
INDIE / COMUNIDAD

Zot: agent harness ligero en Go con tres modos de ejecución y cuatro herramientas built-in

Cliente unificado para Claude, Codex, Gemini, Kimi, DeepSeek y Bedrock con modos TUI, one-shot y NDJSON para CI, y solo read/write/edit/bash como herramientas. Alternativa minimalista a Claude Code cuando solo necesitas el bucle agéntico sin la opinión de Anthropic.

GitHub · 2 MIN LEER FUENTE →
TÉCNICAS

Trazas + eval gates: pattern de observabilidad de agentes en 2026 sobre OTel v1.41

Guía vendor-neutral que combina trazas en runtime con eval gates que bloquean regresiones en CI y detectan drift en producción, comparada sobre LangSmith, Braintrust y Langfuse usando las nuevas convenciones GenAI de OTel v1.41.

Digital Applied · 6 MIN LEER FUENTE →
INDUSTRIA

MCP 2026-07-28 Release Candidate: stateless, MCP Apps con UI servidor y extensión Tasks

Mayor revisión del protocolo desde el lanzamiento: elimina el handshake `initialize` para escalar sobre HTTP plano sin sticky sessions, alinea autorización con OAuth 2.0 + OIDC y formaliza MCP Apps (UIs renderizadas en servidor) y Tasks (trabajos largos).

Model Context Protocol · 5 MIN LEER FUENTE →
SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Trocear coste y latencia de Claude Code por equipo y repo con OTEL_RESOURCE_ATTRIBUTES

# v2.1.161 (2 jun 2026): OTEL_RESOURCE_ATTRIBUTES aparece como labels # en cada datapoint. Ya filtras coste y latencia por team, repo o proyecto # sin parchear el SDK ni levantar un proxy intermedio. # Exporta antes de lanzar claude (o en tu wrapper de shell) export CLAUDE_CODE_ENABLE_TELEMETRY=1 export OTEL_RESOURCE_ATTRIBUTES="team=plataforma,repo=portfolio,env=prod" export OTEL_METRICS_EXPORTER=otlp export OTEL_EXPORTER_OTLP_ENDPOINT=https://otel.tu-empresa.com # PromQL sobre los datapoints exportados (Prometheus / Grafana) sum by (team, repo) (rate(claude_code_token_input_total[1h])) sum by (team, repo) (rate(claude_code_token_output_total[1h])) histogram_quantile(0.95, sum by (team, repo, le) (rate(claude_code_tool_call_duration_seconds_bucket[5m])) )

CLAUDE CODE V2.1.161 VER FUENTE →

Cierre

La diferenciación del día se mueve a “agente con guardarraíles”. NVIDIA Nemotron 3 Ultra entrega frontier MoE de pesos abiertos optimizado para agentes a una fracción del coste de GPT-5.5, y Cosmos 3 Nano lo lleva al terreno multimodal sin atar el pipeline a un proveedor cerrado. Claude Code 2.1.161 corta la persistencia post-injection en .zshenv y ~/.config/git/ y por fin habilita gobernanza real de coste por equipo y repo vía OTEL, mientras GitHub Copilot CLI suma dictado por voz y /every//after para agentes desatendidos en el terminal. El MCP 2026-07-28 RC elimina el handshake con initialize para escalar sobre HTTP plano sin sticky sessions. Lo que deja de tener sentido para quien envía a producción: pagar frontier cerrado cuando un MoE abierto iguala los workloads agénticos, ejecutar agentes sin labels de equipo en las métricas, mantener servidores MCP con estado pegajoso y dejar al agente escribir en scripts de arranque del shell sin un aviso explícito.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.