Computer use local con Holo 3.1: agente open source en 12 GB

MARTES, 16 DE JUNIO DE 2026

NOTICIA DESTACADA

HCompany libera Holo 3.1: familia open-weight de computer use de 0.8B a 35B-A3B con function calling nativo

Familia de pesos abiertos Holo 3.1 (0.8B, 4B, 9B y 35B-A3B) trae computer use con function calling nativo y quants GGUF, FP8 y NVFP4 que corren a 140 ms por paso en 12 GB de VRAM. Sustituyes Browser Use o Skyvern sin servidor externo: el agente ve, hace clic y teclea en web, escritorio y móvil sin coste por token.

5 MIN LECTURA

NOTICIAS DEL DÍA

HERRAMIENTAS

Mastra @mastra/core 1.42.0 ejecuta crons y colas como `actorKind: 'system'` sin JWT humano

Defines `actor: {actorKind: 'system'}` y los crons pasan los checks FGA sin JWT ni miembro humano. Mueves tareas de fondo al runtime de agentes sin duplicar la autorización por encima.

Mastra Blog · 4 MIN LEER FUENTE →

HERRAMIENTAS

Claude Code v2.1.152 estrena `/reload-skills` y hooks SessionStart con `reloadSkills: true`

Rescanea `~/.claude/skills/` sin reiniciar y los hooks SessionStart devuelven `reloadSkills: true` para activar lo que acaban de instalar. Iteras un skill sin perder el contexto de la sesión activa.

Claude Code Changelog · 3 MIN LEER FUENTE →

TUTORIALES

Receta para enchufar Holo 3.1 a OpenClaw vía llama.cpp y mover el agente personal a local

Bajas el quant GGUF, lanzas `llama-server`, apuntas la base URL de OpenClaw 2026.6.2 al puerto local y tu agente procesa WhatsApp, Discord y Slack sin tocar la API de Anthropic ni OpenAI.

knightli.com · 5 MIN LEER FUENTE →

OPEN SOURCE

Hugging Face `transformers` v5.11.0 suma DeepSeek-V3.2 y DiffusionGemma con fusión de kernels

Cargas los nuevos pesos con el `pipeline` estándar y la inferencia se acelera por fusión de kernels y paralelización mejorada sin tocar tu código de RAG ni el wrapper de ajuste fino.

Hugging Face Transformers · 3 MIN LEER FUENTE →

HERRAMIENTAS

HCompany publica HoloTab: el agente Holo se mueve por tu navegador como extensión Chrome

Empaquetan Holo 3.1 detrás de una extensión que actúa en la pestaña activa con la sesión del usuario. Pruebas flujos de soporte o RPA en web sin desplegar Selenium, Playwright ni una VM con escritorio.

The New Stack · 4 MIN LEER FUENTE →

INDUSTRIA

NAVER y NVIDIA construyen 200 MW de fábrica AI en Sejong para HyperCLOVA X sobre DSX

Arrancan en 55 MW en H1 2027 y escalan a 200 MW en 2028 con NVIDIA DSX. Si vendes en Corea o necesitas residencia de datos, en 18 meses tienes un proveedor soberano con HyperCLOVA X ajustado sobre Nemotron 3 Ultra.

NVIDIA Newsroom · 4 MIN LEER FUENTE →

SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Servir Holo 3.1 con llama.cpp y validar function calling

# 1. Bajar el quant Q4_K_M del 0.8B (~600 MB, cabe en cualquier laptop) wget https://huggingface.co/Hcompany/Holo-3.1-0.8B-GGUF/resolve/main/holo-3.1-0.8B-q4_k_m.gguf # 2. Lanzar llama-server como endpoint OpenAI-compatible en :8080 llama-server \ --model holo-3.1-0.8B-q4_k_m.gguf \ --ctx-size 8192 \ --n-gpu-layers 99 \ --jinja \ --port 8080 # 3. Validar function calling con curl (la salida llega como tool_call) curl http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "holo-3.1", "messages": [{"role":"user","content":"haz clic en el botón Aceptar"}], "tools": [{"type":"function","function":{ "name":"click", "parameters":{"type":"object","properties":{ "x":{"type":"number"},"y":{"type":"number"}}}}}] }'

HCOMPANY — HOLO 3.1 VER FUENTE →

LO DEMÁS DE HOY

Cierre

El 16 de junio consolida un patrón: el agente que mira la pantalla deja el SaaS y baja a tu máquina. HCompany abre Holo 3.1 en 0.8B–35B-A3B con function calling nativo y quants GGUF, FP8 y NVFP4 que corren a 140 ms en 12 GB de VRAM, y OpenClaw 2026.6.2 publica la receta para enchufarlo vía llama.cpp sin tocar Anthropic ni OpenAI. Mismo viento de cola en el entorno de ejecución: Mastra 1.42 ejecuta crons como actorKind: 'system' sin JWT humano, y Claude Code v2.1.152 rescanea ~/.claude/skills/ con /reload-skills para que el hook SessionStart active lo recién instalado sin reiniciar la sesión. NAVER y NVIDIA levantan HyperCLOVA X sobre DSX a escala de gigavatio: la inversión cae del lado del fabricante de hardware mientras el dev senior se queda los pesos. El patrón emergente: la inferencia se mueve al cliente y la autorización al runtime; el SaaS de visión queda como un envoltorio caro de algo que ya corre en tu portátil.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.

RESERVAR LLAMADA → VER SERVICIOS

VER TODAS LAS EDICIONES