MARTES, 16 DE JUNIO DE 2026
HCompany libera Holo 3.1: familia open-weight de computer use de 0.8B a 35B-A3B con function calling nativo
Familia de pesos abiertos Holo 3.1 (0.8B, 4B, 9B y 35B-A3B) trae computer use con function calling nativo y quants GGUF, FP8 y NVFP4 que corren a 140 ms por paso en 12 GB de VRAM. Sustituyes Browser Use o Skyvern sin servidor externo: el agente ve, hace clic y teclea en web, escritorio y móvil sin coste por token.
5 MIN LECTURAMastra @mastra/core 1.42.0 ejecuta crons y colas como `actorKind: 'system'` sin JWT humano
Defines `actor: {actorKind: 'system'}` y los crons pasan los checks FGA sin JWT ni miembro humano. Mueves tareas de fondo al runtime de agentes sin duplicar la autorización por encima.
Claude Code v2.1.152 estrena `/reload-skills` y hooks SessionStart con `reloadSkills: true`
Rescanea `~/.claude/skills/` sin reiniciar y los hooks SessionStart devuelven `reloadSkills: true` para activar lo que acaban de instalar. Iteras un skill sin perder el contexto de la sesión activa.
Receta para enchufar Holo 3.1 a OpenClaw vía llama.cpp y mover el agente personal a local
Bajas el quant GGUF, lanzas `llama-server`, apuntas la base URL de OpenClaw 2026.6.2 al puerto local y tu agente procesa WhatsApp, Discord y Slack sin tocar la API de Anthropic ni OpenAI.
Hugging Face `transformers` v5.11.0 suma DeepSeek-V3.2 y DiffusionGemma con fusión de kernels
Cargas los nuevos pesos con el `pipeline` estándar y la inferencia se acelera por fusión de kernels y paralelización mejorada sin tocar tu código de RAG ni el wrapper de ajuste fino.
HCompany publica HoloTab: el agente Holo se mueve por tu navegador como extensión Chrome
Empaquetan Holo 3.1 detrás de una extensión que actúa en la pestaña activa con la sesión del usuario. Pruebas flujos de soporte o RPA en web sin desplegar Selenium, Playwright ni una VM con escritorio.
NAVER y NVIDIA construyen 200 MW de fábrica AI en Sejong para HyperCLOVA X sobre DSX
Arrancan en 55 MW en H1 2027 y escalan a 200 MW en 2028 con NVIDIA DSX. Si vendes en Corea o necesitas residencia de datos, en 18 meses tienes un proveedor soberano con HyperCLOVA X ajustado sobre Nemotron 3 Ultra.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Servir Holo 3.1 con llama.cpp y validar function calling
# 1. Bajar el quant Q4_K_M del 0.8B (~600 MB, cabe en cualquier laptop) wget https://huggingface.co/Hcompany/Holo-3.1-0.8B-GGUF/resolve/main/holo-3.1-0.8B-q4_k_m.gguf # 2. Lanzar llama-server como endpoint OpenAI-compatible en :8080 llama-server \ --model holo-3.1-0.8B-q4_k_m.gguf \ --ctx-size 8192 \ --n-gpu-layers 99 \ --jinja \ --port 8080 # 3. Validar function calling con curl (la salida llega como tool_call) curl http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "holo-3.1", "messages": [{"role":"user","content":"haz clic en el botón Aceptar"}], "tools": [{"type":"function","function":{ "name":"click", "parameters":{"type":"object","properties":{ "x":{"type":"number"},"y":{"type":"number"}}}}}] }'
- 01 Cursor Bugbot baja la revisión a 90 segundos con Composer 2.5
- 02 Anthropic auto-carga skills desde `.claude/skills/` sin marketplace y añade `claude plugin init`
- 03 Mastra abre `@mastra/browser-firecrawl` con sandbox de Chrome alojado
- 04 DSPy 3.x publica sus optimizadores de instrucciones como herramientas de primera clase
- 05 Hugging Face añade cuentas de servicio para automatización y CI/CD en organizaciones
Cierre
El 16 de junio consolida un patrón: el agente que mira la pantalla deja el SaaS y baja a tu máquina. HCompany abre Holo 3.1 en 0.8B–35B-A3B con function calling nativo y quants GGUF, FP8 y NVFP4 que corren a 140 ms en 12 GB de VRAM, y OpenClaw 2026.6.2 publica la receta para enchufarlo vía llama.cpp sin tocar Anthropic ni OpenAI. Mismo viento de cola en el entorno de ejecución: Mastra 1.42 ejecuta crons como actorKind: 'system' sin JWT humano, y Claude Code v2.1.152 rescanea ~/.claude/skills/ con /reload-skills para que el hook SessionStart active lo recién instalado sin reiniciar la sesión. NAVER y NVIDIA levantan HyperCLOVA X sobre DSX a escala de gigavatio: la inversión cae del lado del fabricante de hardware mientras el dev senior se queda los pesos. El patrón emergente: la inferencia se mueve al cliente y la autorización al runtime; el SaaS de visión queda como un envoltorio caro de algo que ya corre en tu portátil.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.