5 minutos de IA

SÁBADO, 23 DE MAYO DE 2026

NOTICIA DESTACADA

Cohere publica Command A+: modelo de código abierto de 218B (Apache 2.0) en 2 H100 con citas verificables

Modelo de mezcla de expertos (MoE) de 218B parámetros con 25B activos y cuantización a 4 bits sin pérdida perceptible: lo alojas tú mismo en dos H100 o un B200, sin depender de la nube. Sus referencias nativas enlazan cada afirmación con su fuente, así que montas respuestas con fuentes verificables (RAG) sin procesado posterior. Licencia Apache 2.0 y 128.000 tokens de contexto.

4 MIN LECTURA
NOTICIAS DEL DÍA
OPEN SOURCE

Datasette Agent: asistente de IA conversacional sobre tu SQLite, con cualquier modelo

Primera versión alpha de Simon Willison sobre `llm`: conversas con tus bases de datos SQLite usando OpenAI, Anthropic, Gemini o un modelo local. Lo alojas tú mismo en `/-/agent` y lo amplías con complementos: exploras tus datos sin enviar su estructura a un servicio externo.

Datasette · 4 MIN LEER FUENTE →
HERRAMIENTAS

Codex saca de fase experimental el modo objetivo (Goal Mode): agente autónomo durante horas con condición de parada

El modo objetivo pasa a versión estable en la app, el editor y la línea de comandos: defines una meta y Codex trabaja durante horas hasta cumplirla. Añade Appshots (envías una ventana con doble Cmd) y el uso remoto del equipo tras bloquear el Mac.

OpenAI Codex · 3 MIN LEER FUENTE →
OPEN SOURCE

Memori: capa de memoria compatible con cualquier modelo que guarda decisiones y llamadas a herramientas de tus agentes

Convierte cada turno —llamadas a herramientas, decisiones, resultados— en memoria persistente que recuperas entre sesiones: el agente no vuelve a explorar desde cero y gastas menos tokens. Compatible con cualquier modelo y los datos son tuyos.

GitHub · 3 MIN LEER FUENTE →
INDIE / COMUNIDAD

Emdash: ejecuta Claude Code, Codex y Gemini en paralelo, cada uno en su propio espacio de trabajo de git

App de escritorio con licencia Apache 2.0 (YC W26): ejecuta varios agentes a la vez, cada uno aislado en su propio espacio de trabajo de git (en local o por SSH), con 22 herramientas de línea de comandos. Pegas la tarea de Linear o GitHub y revisas los cambios y la PR sin salir de la app.

GitHub · 3 MIN LEER FUENTE →
TUTORIALES

Los últimos seis meses en modelos de lenguaje (LLM) en cinco minutos, por Simon Willison

Charla relámpago de PyCon US 2026 con diapositivas anotadas: qué se ha convertido en herramienta de uso diario (Codex, Claude Code), el salto de los modelos locales de pesos abiertos y qué conviene adoptar ya. Mapa rápido para tu día a día.

Simon Willison · 2 MIN LEER FUENTE →
SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Extracción de datos estructurados barata con `llm` y gemini-3.5-flash

`gemini-3.5-flash` pasó a disponibilidad general a 1,50 $/9 $ por millón de tokens y va 4 veces más rápido que los modelos punteros: es el caballo de batalla para bucles de agente, subagentes y extracción masiva. Desde la línea de comandos `llm` lo usas sin necesidad de un SDK propio. ```bash # Instalación (una vez) uv tool install llm # o: pipx install llm llm install llm-gemini llm keys set gemini # pega tu clave de API ``` Salida estructurada con JSON garantizado por `--schema`: ```bash llm -m gemini-3.5-flash \ --schema 'titulo, url, resumen, severidad int' \ "Extrae los datos de este error: $(cat bug.txt)" ``` En lote, un objeto por fila con `--schema-multi`: ```bash cat tickets.txt | llm -m gemini-3.5-flash \ --schema-multi 'id int, area, prioridad int' \ 'Clasifica cada ticket' ``` Llamadas a herramientas sin librerías extra: pasas funciones de Python con `--functions` y depuras con `--td`: ```bash llm -m gemini-3.5-flash --td \ --functions 'def tarifa(kwh: float) -> float: return kwh * 0.18' \ 'cuanto cuestan 1234 kWh' ``` Cada llamada queda registrada en SQLite (`llm logs`), así que auditas la petición, los tokens y la respuesta sin instrumentar nada extra. En producción: arranca con flash y solo escala a un modelo caro cuando una evaluación falle, no por defecto.

LLM (SIMON WILLISON) VER FUENTE →

Cierre

El eje de hoy es el código abierto que llega a producción sin peajes. Cohere publica Command A+ bajo licencia Apache 2.0 —un modelo de mezcla de expertos de 218B parámetros que cabe en dos H100 y cita sus fuentes de serie—, Simon Willison lanza un asistente conversacional sobre SQLite con Datasette Agent, y Emdash ejecuta Claude Code, Codex y Gemini en paralelo, cada uno en su propio espacio de trabajo de git. El patrón que se repite: la pieza diferencial deja de ser el modelo y pasa a ser lo que lo rodea —memoria persistente (Memori), autonomía con condición de parada (el modo objetivo de Codex) y respuestas con fuentes verificables de serie—. Lo que deja de tener sentido para quien lleva su producto a producción: atarte a un servicio cerrado para explorar tus propios datos, pagar inferencia en la nube por un modelo de agentes que ya corre en dos tarjetas gráficas, y dejar que el agente vuelva a explorar desde cero en cada sesión por no tener memoria.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.