Kimi K2.7-Code: 1T de pesos abiertos con 30% menos tokens

DOMINGO, 14 DE JUNIO DE 2026

NOTICIA DESTACADA

Moonshot lanza Kimi K2.7-Code: MoE de 1T con 32B activos, Modified MIT y 30% menos tokens de razonamiento

MoE de 1T con 32B activos, 384 expertos y 256K de contexto bajo Modified MIT. Reporta +21,8% en Kimi Code Bench v2 sobre K2.6 y gasta 30% menos tokens de razonamiento. Pesos en Hugging Face y API compatible con OpenAI en api.moonshot.ai/v1: cambias `base_url` y `model` y enchufas un agente de código sin pagar Claude.

5 MIN LECTURA

NOTICIAS DEL DÍA

HERRAMIENTAS

Claude Code v2.1.176: títulos de sesión por idioma, badges en el pie y allowlist a prueba de variables de entorno

El allowlist deja de eludirse vía `ANTHROPIC_DEFAULT_*_MODEL` y `/fast` rechaza salir de la lista. Las credenciales de Bedrock se cachean hasta su `Expiration` real en vez de la hora fija. Cierra el agujero del bypass por entorno.

Claude Code Changelog · 3 MIN LEER FUENTE →

INDUSTRIA

Google apaga Gemini CLI el 18 de junio: queda una semana para migrar a Antigravity CLI

Free, Pro y Ultra dejan de servir Gemini CLI y la extensión de Code Assist el 18 de junio; solo Standard y Enterprise sobreviven. Si tu pipeline depende del CLI, migras a Antigravity antes o se queda mudo el jueves.

Google Developers Blog · 4 MIN LEER FUENTE →

HERRAMIENTAS

Codex enchufa Chrome DevTools Protocol al navegador interno y abre la banca de resets de rate-limit a Plus y Pro

Developer mode da al agente control de Chrome por CDP: perfilas páginas con `performance.profile` sin scripts auxiliares dentro de la sesión. Plus y Pro acumulan resets de rate-limit en lugar de perderlos al expirar.

OpenAI Codex Changelog · 3 MIN LEER FUENTE →

INDIE / COMUNIDAD

Firecrawl libera Prometheus: agente que escribe collectors TypeScript desde una descripción en lenguaje natural

Describes los datos que quieres y Prometheus experimenta contra el site real, genera un collector TypeScript con el SDK de Firecrawl y lo ejecuta antes de devolvértelo. Lo embebes en tu repo o lo dejas alojado y mantenido por ellos.

Firecrawl · 3 MIN LEER FUENTE →

TUTORIALES

Jake Handy explica por qué Kimi K2.7-Code obliga a presupuestar el razonamiento como output en tu factura

`thinking` viene forzado a True y los tokens de razonamiento se facturan como output. Cambia los `max_tokens` que tenías para Opus 4.8 o el coste sube sin que lo veas en el panel. Temperatura recomendada 1.0 y `top_p` 0.95.

HandyAI Substack · 4 MIN LEER FUENTE →

SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Evaluación A/B: comparar Kimi K2.7-Code contra Claude con juez calibrado

# evals/swap_test.py — A/B mínimo antes de cambiar de modelo en producción. # Requiere: pip install openai anthropic, y fixtures.jsonl con {"q":"..."} por línea. import os, json from openai import OpenAI from anthropic import Anthropic kimi = OpenAI(base_url="https://api.moonshot.ai/v1", api_key=os.environ["KIMI_KEY"]) claude = Anthropic() # ANTHROPIC_API_KEY judge = OpenAI() # OPENAI_API_KEY — juez calibrado, distinto de los dos competidores JUDGE = ('Compara dos respuestas a la misma tarea y devuelve SOLO JSON: ' '{"winner":"A"|"B"|"TIE","reason":"<30 palabras>"}. ' 'Criterio: corrección > completitud > brevedad.') def ask_kimi(q): return kimi.chat.completions.create(model="kimi-k2.7-code", messages=[{"role":"user","content":q}]).choices[0].message.content def ask_claude(q): return claude.messages.create(model="claude-opus-4-8", max_tokens=2048, messages=[{"role":"user","content":q}]).content[0].text for line in open("fixtures.jsonl"): q = json.loads(line)["q"] a, b = ask_kimi(q), ask_claude(q) v = judge.chat.completions.create(model="gpt-5-mini", messages=[{"role":"system","content":JUDGE}, {"role":"user","content":f"TAREA:{q}\nA:{a}\nB:{b}"}]) print(json.loads(v.choices[0].message.content))

HAMEL HUSAIN — LLM EVALS FAQ VER FUENTE →

LO DEMÁS DE HOY

Cierre

El día gira en torno a Kimi K2.7-Code: un MoE de 1T con 32B activos, Modified MIT y 30% menos tokens de razonamiento que enchufas con base_url y model a tu agente sin pagar a Anthropic. El otro extremo del mercado se mueve a la par — Claude Code v2.1.176 cierra el último agujero por el que un modelo prohibido podía colarse vía variables de entorno, y Google anuncia que apaga Gemini CLI el 18 de junio para empujar a todos a Antigravity CLI. Codex suma control de Chrome por CDP para perfilar páginas dentro del agente, Firecrawl convierte la descripción de un dataset en un collector TypeScript versionable, y Cloudflare Workers AI se queda con la inferencia de K2.7-Code para quien no quiera servidor propio. El patrón del día: el coste de inferencia ya no lo decide el benchmark, lo decide quién sabe medir tokens de razonamiento en la factura.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.

RESERVAR LLAMADA → VER SERVICIOS

VER TODAS LAS EDICIONES