LUNES, 15 DE JUNIO DE 2026
Anthropic separa el Agent SDK del subscription: crédito mensual a tarifa API plena sin rollover desde hoy
Anthropic mueve Agent SDK, `claude -p`, Claude Code GitHub Actions y agentes de terceros del límite del subscription a un crédito mensual aparte: $20 Pro, $100 Max 5x y $200 Max 20x a tarifa API plena, por usuario, sin rollover ni fallback automático. Reclamas el crédito una vez antes del corte y activas overflow billing o tu pipeline programático se detiene en seco a mediodía.
5 MIN LECTURAClaude Code v2.1.178 estrena dynamic workflows en research preview y el setting ultracode (`/effort xhigh`)
Los workflows dinámicos encadenan tareas paralelas de extremo a extremo y `/effort xhigh` deja que el modelo decida cuándo arrancar uno. Menos código de orquestación a mano, mismo presupuesto si calibras el effort.
MCP 2026-07-28 RC vuelve el protocolo sin estado y retira el header `Mcp-Session-Id`
El estado se mueve al cliente: tu servidor MCP escala horizontal sin sticky sessions ni Redis para mantener contexto entre llamadas. Adoptas el RC en `transport: streamable-http` y el load balancer reparte sin afinidad.
DeepSeek V4.1 Flash llega al top de Hugging Face: 284B Apache 2.0, 1M de contexto a $0.14/$0.28 por MTok
Pesos abiertos bajo MIT con 1M de contexto y precio de gateway plano. Lo enchufas como reemplazo de Haiku en RAG o como segundo asiento del juez calibrado sin atarte a Anthropic.
Voyage 4 comparte espacio vectorial entre `large` y `lite`: indexa con calidad, consulta a coste reducido
Las cuatro tallas del modelo viven en el mismo espacio: embeds tu corpus con `voyage-4-large`, sirves queries con `voyage-4-lite` y no tienes que reindexar. Recortas latencia y coste de query sin tocar el índice de producción.
Codex pasa Computer Use a disponibilidad general en Windows con sandbox elevado
El agente ve, hace clic y teclea en cualquier app Win32 desde el sandbox elevado del Codex App. Pruebas y depuras herramientas internas sin scripts de control auxiliares ni una VM Linux paralela en el pipeline.
Simon Willison publica wheels WASM en PyPI para correr agentes Python dentro de Pyodide en el navegador
Empaquetas un agente Python en un wheel WASM y se ejecuta en el navegador del cliente sin servidor. Ahorras infra de inferencia cuando el agente solo necesita el contexto local de la pestaña y tu LLM externo.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Tope de gasto por sesión antes del corte del Agent SDK
# A partir del 15 de junio, Agent SDK, claude -p, GitHub Actions # y agentes de terceros cobran a tarifa API plena contra el # crédito mensual ($20 Pro / $100 Max5x / $200 Max20x) sin # rollover y sin fallback automático. # # Patrón mínimo: cortar la sesión cuando supere el presupuesto. # Vale para cualquier loop con el SDK de Anthropic (Python). from anthropic import Anthropic PRICE_IN = 15.00 / 1_000_000 # Opus 4.8 input $/token PRICE_OUT = 75.00 / 1_000_000 # Opus 4.8 output $/token BUDGET = 0.50 # USD por sesión client = Anthropic() spent, messages = 0.0, [{"role": "user", "content": initial_task()}] while spent < BUDGET: r = client.messages.create( model="claude-opus-4-8", max_tokens=2048, messages=messages, ) cost = r.usage.input_tokens * PRICE_IN + r.usage.output_tokens * PRICE_OUT spent += cost print(f"turno: ${cost:.4f} | acumulado: ${spent:.4f} / ${BUDGET}") messages.append({"role": "assistant", "content": r.content}) if r.stop_reason == "end_turn": break messages.append({"role": "user", "content": next_tool_result(r)}) if spent >= BUDGET: print(f"sesión cortada: presupuesto agotado a ${spent:.2f}")
- 01 AWS Bedrock añade DeepSeek V4.1 Flash como modelo gestionado con batch pricing
- 02 Cursor activa Auto-review por defecto en Teams con el clasificador contextual
- 03 Letta Code 0.9 sincroniza memoria entre la CLI, VS Code y JetBrains
- 04 Mistral Vibe sube al top mensual de Product Hunt en agentes de tareas largas
- 05 OpenClaw supera los 172k de estrellas y se convierte en el agente open source más estrellado
Cierre
El 15 de junio reordena la economía del agente en producción: Anthropic separa el Agent SDK, claude -p y GitHub Actions del subscription y los manda a un crédito mensual a tarifa API plena sin rollover. Quien envía pipelines a clientes reclama crédito antes del corte, activa overflow billing y empieza a medir gasto por sesión, no por petición. MCP 2026-07-28 RC lleva la misma idea al protocolo: retira Mcp-Session-Id y mueve el estado al cliente, así escalas el servidor horizontal sin Redis ni sticky sessions. Claude Code v2.1.178 estrena workflows dinámicos con /effort xhigh para que el modelo decida cuándo paralelizar, Voyage 4 comparte espacio vectorial entre large y lite para consultar a coste reducido sin reindexar, y DeepSeek V4.1 Flash se queda top de Hugging Face una semana después del release. El patrón del día: el coste del agente deja de ser un efecto colateral del subscription y pasa a ser un presupuesto explícito que cabe en el código.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.