5 minutos de IA

VIERNES, 8 DE MAYO DE 2026

NOTICIA DESTACADA

OpenAI lanza GPT-Realtime-2: voz con razonamiento GPT-5, traducción en vivo y Whisper streaming

El nuevo trío de modelos de audio en la API añade razonamiento de clase GPT-5 a las conversaciones por voz, traducción en directo desde 70+ idiomas y transcripción streaming. Marca el primer salto serio en voz de OpenAI desde Realtime-1.5.

4 MIN LECTURA
NOTICIAS DEL DÍA
MODELOS

GPT-Realtime-2, Realtime-Translate y Realtime-Whisper aterrizan en la API de OpenAI

Realtime-2 obtiene un 15,2% más en Big Bench Audio que Realtime-1.5, soporta 128k de contexto y se factura a 32$/M tokens de entrada y 64$/M de salida. Translate cubre 70+ idiomas a 0,034$/min y Whisper streaming a 0,017$/min.

OpenAI · 4 MIN LEER FUENTE →
REGULACIÓN

El Consejo y el Parlamento europeos pactan simplificar el AI Act y vetar la nudificación

El acuerdo provisional retrasa los sandboxes regulatorios hasta agosto de 2027, recorta de 6 a 3 meses el plazo de transparencia para contenido sintético y prohíbe sistemas de IA de nudificación o CSAM. Próximo trílogo el 13 de mayo.

Consejo de la UE · 4 MIN LEER FUENTE →
REGULACIÓN

CAISI firma con Google DeepMind, Microsoft y xAI test pre-release de modelos frontier

El centro del Departamento de Comercio de EE.UU. evaluará modelos antes del lanzamiento público con salvaguardas reducidas y entornos clasificados, replicando los acuerdos previos con OpenAI y Anthropic de 2024.

NIST / CAISI · 4 MIN LEER FUENTE →
MODELOS

Google DeepMind toma una participación minoritaria en el estudio de EVE Online

CCP Games se rebautiza como Fenris Creations tras una transacción de 120M$ con Pearl Abyss y firma research partnership con DeepMind para estudiar planificación a largo plazo, memoria y aprendizaje continuo en una versión offline de EVE.

Fenris Creations / CCP · 3 MIN LEER FUENTE →
AGENTES

AWS MCP Server pasa a disponibilidad general con sandbox Python e IAM

Los agentes de coding pueden invocar cualquier API de AWS desde una sola tool, ejecutar Python en sandbox y consumir auditoría vía CloudWatch y CloudTrail. Sin coste por el server, solo por los recursos AWS consumidos.

AWS · 3 MIN LEER FUENTE →
STARTUPS

Snyk integra Claude en su plataforma de AI Security para descubrir y arreglar vulnerabilidades

La integración con Anthropic combina detección y fixes generados automáticamente sobre código, dependencias, contenedores y artefactos generados por IA. Disponible para clientes conjuntos hoy, expansión a lo largo de 2026.

Snyk · 3 MIN LEER FUENTE →

Lo más importante hoy

OpenAI abre el día estrenando un trío de modelos de audio en la API: GPT-Realtime-2 —su primer modelo de voz con razonamiento de clase GPT-5—, GPT-Realtime-Translate (70+ idiomas de entrada, 13 de salida en directo) y GPT-Realtime-Whisper (transcripción streaming). Realtime-2 sube 15,2 puntos en Big Bench Audio sobre Realtime-1.5 y se factura a 32$/64$ por millón de tokens de entrada/salida; el resto, por minuto. En Bruselas, Consejo y Parlamento cierran un acuerdo provisional para simplificar el AI Act: aplazan los sandboxes regulatorios a agosto de 2027, recortan de 6 a 3 meses el plazo para implementar transparencia en contenido sintético y prohíben expresamente los sistemas de nudificación y CSAM. Próximo trílogo el 13 de mayo.

En Washington, el Center for AI Standards and Innovation (CAISI) —dentro del Departamento de Comercio— firma acuerdos con Google DeepMind, Microsoft y xAI para probar sus modelos antes del lanzamiento público, con salvaguardas reducidas y entornos clasificados; OpenAI y Anthropic ya tenían convenios similares desde 2024. Google DeepMind, además, toma participación minoritaria en Fenris Creations (ex CCP Games, 120M$) para usar una versión offline de EVE Online como banco de pruebas de long-horizon planning, memoria y aprendizaje continuo. Y en infraestructura para agentes, AWS mueve su MCP Server a disponibilidad general con sandbox de Python, IAM y telemetría en CloudWatch y CloudTrail; Snyk integra Claude para detectar y arreglar vulnerabilidades sobre código, dependencias, contenedores y artefactos generados por IA.

Por qué importa

La jornada confirma dos vectores de presión sobre el ecosistema. Primero, producto: con GPT-Realtime-2 y un Whisper que transcribe sin pausas, la voz deja de ser un nicho y entra en paridad con el texto para builders de agentes. Segundo, gobernanza: la UE rebaja exigencias para no estrangular a los proveedores europeos, mientras EE.UU. instaura un review pre-deployment que de facto convierte al gobierno en un canal obligado —con salvaguardas desactivadas— para cualquier modelo frontier. Para equipos técnicos, el mensaje práctico es triple: MCP (con AWS en GA y AWS-for-SAP también) ya es la API estándar para conectar agentes a infraestructura empresarial; la voz con razonamiento abre la puerta a UX agéntica fuera del chat; y la presión regulatoria —tanto en Bruselas como en Washington— está acelerando, no frenando, la integración de security tooling (Snyk + Claude, Glasswing) en el pipeline de desarrollo.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.