DOMINGO, 14 DE JUNIO DE 2026
Moonshot lanza Kimi K2.7-Code: MoE de 1T con 32B activos, Modified MIT y 30% menos tokens de razonamiento
MoE de 1T con 32B activos, 384 expertos y 256K de contexto bajo Modified MIT. Reporta +21,8% en Kimi Code Bench v2 sobre K2.6 y gasta 30% menos tokens de razonamiento. Pesos en Hugging Face y API compatible con OpenAI en api.moonshot.ai/v1: cambias `base_url` y `model` y enchufas un agente de código sin pagar Claude.
5 MIN LECTURAClaude Code v2.1.176: títulos de sesión por idioma, badges en el pie y allowlist a prueba de variables de entorno
El allowlist deja de eludirse vía `ANTHROPIC_DEFAULT_*_MODEL` y `/fast` rechaza salir de la lista. Las credenciales de Bedrock se cachean hasta su `Expiration` real en vez de la hora fija. Cierra el agujero del bypass por entorno.
Google apaga Gemini CLI el 18 de junio: queda una semana para migrar a Antigravity CLI
Free, Pro y Ultra dejan de servir Gemini CLI y la extensión de Code Assist el 18 de junio; solo Standard y Enterprise sobreviven. Si tu pipeline depende del CLI, migras a Antigravity antes o se queda mudo el jueves.
Codex enchufa Chrome DevTools Protocol al navegador interno y abre la banca de resets de rate-limit a Plus y Pro
Developer mode da al agente control de Chrome por CDP: perfilas páginas con `performance.profile` sin scripts auxiliares dentro de la sesión. Plus y Pro acumulan resets de rate-limit en lugar de perderlos al expirar.
Firecrawl libera Prometheus: agente que escribe collectors TypeScript desde una descripción en lenguaje natural
Describes los datos que quieres y Prometheus experimenta contra el site real, genera un collector TypeScript con el SDK de Firecrawl y lo ejecuta antes de devolvértelo. Lo embebes en tu repo o lo dejas alojado y mantenido por ellos.
Jake Handy explica por qué Kimi K2.7-Code obliga a presupuestar el razonamiento como output en tu factura
`thinking` viene forzado a True y los tokens de razonamiento se facturan como output. Cambia los `max_tokens` que tenías para Opus 4.8 o el coste sube sin que lo veas en el panel. Temperatura recomendada 1.0 y `top_p` 0.95.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Evaluación A/B: comparar Kimi K2.7-Code contra Claude con juez calibrado
# evals/swap_test.py — A/B mínimo antes de cambiar de modelo en producción. # Requiere: pip install openai anthropic, y fixtures.jsonl con {"q":"..."} por línea. import os, json from openai import OpenAI from anthropic import Anthropic kimi = OpenAI(base_url="https://api.moonshot.ai/v1", api_key=os.environ["KIMI_KEY"]) claude = Anthropic() # ANTHROPIC_API_KEY judge = OpenAI() # OPENAI_API_KEY — juez calibrado, distinto de los dos competidores JUDGE = ('Compara dos respuestas a la misma tarea y devuelve SOLO JSON: ' '{"winner":"A"|"B"|"TIE","reason":"<30 palabras>"}. ' 'Criterio: corrección > completitud > brevedad.') def ask_kimi(q): return kimi.chat.completions.create(model="kimi-k2.7-code", messages=[{"role":"user","content":q}]).choices[0].message.content def ask_claude(q): return claude.messages.create(model="claude-opus-4-8", max_tokens=2048, messages=[{"role":"user","content":q}]).content[0].text for line in open("fixtures.jsonl"): q = json.loads(line)["q"] a, b = ask_kimi(q), ask_claude(q) v = judge.chat.completions.create(model="gpt-5-mini", messages=[{"role":"system","content":JUDGE}, {"role":"user","content":f"TAREA:{q}\nA:{a}\nB:{b}"}]) print(json.loads(v.choices[0].message.content))
- 01 Cloudflare Workers AI sirve Kimi K2.7-Code como modelo gestionado sin servidor propio
- 02 AA-AgentPerf publica el primer benchmark agéntico de DeepSeek V4 Pro sobre NVIDIA Blackwell
- 03 transformers v5.10.1 añade Gemma4 Unified, Sapiens2, DeepSeek-OCR-2 y JetBrains Mellum
- 04 Cursor estrena gestión multi-team para Enterprise con presupuesto y políticas por equipo
- 05 Mistral Vibe sube al top mensual de Product Hunt como agente de tareas largas de código
Cierre
El día gira en torno a Kimi K2.7-Code: un MoE de 1T con 32B activos, Modified MIT y 30% menos tokens de razonamiento que enchufas con base_url y model a tu agente sin pagar a Anthropic. El otro extremo del mercado se mueve a la par — Claude Code v2.1.176 cierra el último agujero por el que un modelo prohibido podía colarse vía variables de entorno, y Google anuncia que apaga Gemini CLI el 18 de junio para empujar a todos a Antigravity CLI. Codex suma control de Chrome por CDP para perfilar páginas dentro del agente, Firecrawl convierte la descripción de un dataset en un collector TypeScript versionable, y Cloudflare Workers AI se queda con la inferencia de K2.7-Code para quien no quiera servidor propio. El patrón del día: el coste de inferencia ya no lo decide el benchmark, lo decide quién sabe medir tokens de razonamiento en la factura.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.