Búsqueda de código para agentes: 98% menos tokens vs grep

LUNES, 1 DE JUNIO DE 2026

NOTICIA DESTACADA

Semble: búsqueda de código para agentes con 98% menos tokens que grep+read

Librería MIT que indexa repos completos en 250 ms (200× más rápido que un transformer especializado) y devuelve solo el snippet exacto. Recortas 98% el coste por consulta y multiplicas por diez la velocidad de búsqueda en Claude Code, Cursor o Codex sin GPU ni claves de API. 19 lenguajes, BM25 + Model2Vec en local.

4 MIN LECTURA

NOTICIAS DEL DÍA

OPEN SOURCE

codesearch: MCP de búsqueda híbrida en Rust, 100% offline y con chunking AST por tree-sitter

Apache 2.0 en Rust con retrieval híbrido vector + BM25 fusionado por Reciprocal Rank Fusion y chunking por función gracias a tree-sitter en 9 lenguajes. Lo conectas a Claude Code, Cursor, OpenCode o cualquier cliente MCP sin sacar el código de tu máquina.

GitHub · 3 MIN LEER FUENTE →

OPEN SOURCE

claude-context 0.6: MCP con Milvus y chunking por Merkle para indexación incremental

MIT con BM25 + denso sobre Milvus o Zilliz Cloud y árbol de Merkle para reindexar solo los cambios. 40% menos tokens manteniendo el recall y soporta 11 clientes (Claude Code, Cursor, Windsurf, Cline, VS Code, Gemini CLI, Qwen Code, Cherry Studio, Augment, Roo Code, Zencoder).

GitHub · 3 MIN LEER FUENTE →

HERRAMIENTAS

Vercel AI SDK canary: @ai-sdk/google estrena gemini-embedding-2 y deep-research-preview

Cambias del embedding viejo a gemini-embedding-2 en una sola línea y abres llamadas a deep-research-preview-04-2026 y deep-research-max-preview-04-2026 con la misma firma que la chat. Mismo SDK para vectorizar tu RAG y disparar investigación profunda sin un servicio aparte.

GitHub · 3 MIN LEER FUENTE →

TUTORIALES

Hamel Husain: empezar por error analysis antes que por prompts (guía eval-first)

La FAQ de evals de Hamel deja un mapa concreto: 100 trazas reales, etiquetado axial, descubrir failure modes y solo entonces redactar prompts o juez. Convierte 'mejorar el prompt' en una decisión basada en datos y deja de regresionar features en cada cambio de modelo.

hamel.dev · 6 MIN LEER FUENTE →

HERRAMIENTAS

Codex CLI lleva Computer Use a Windows con remote control desde iOS, Android o Mac

El agente de OpenAI ya ve, hace clic y escribe sobre apps de escritorio Windows en primer plano, y puedes lanzar y supervisar la sesión desde el móvil o desde Codex en Mac. Cierras automatizaciones legacy sin Selenium y delegas tareas con auditoría desde la app móvil.

OpenAI Developers · 3 MIN LEER FUENTE →

SNIPPET DEL DÍA

Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.

Chunking AST con tree-sitter para no partir funciones en tu RAG de código

# pip install tree-sitter tree-sitter-python # El truco: en código, recursive splitting a 512 tokens parte # funciones por la mitad y arruina el recall. Chunkea por nodo AST. from tree_sitter import Language, Parser import tree_sitter_python as tspython parser = Parser(Language(tspython.language())) def chunk_by_function(src: bytes, max_lines: int = 80) -> list[str]: """Fragmentos a nivel función/clase, nunca cortados a la mitad.""" out, walk = [], parser.parse(src).walk() def visit(): n = walk.node if n.type in ("function_definition", "class_definition"): if n.end_point[0] - n.start_point[0] <= max_lines: out.append(src[n.start_byte:n.end_byte].decode()) return if walk.goto_first_child(): while True: visit() if not walk.goto_next_sibling(): break walk.goto_parent() visit() return out # Úsalo antes del embedding: ningún chunk parte una función # y el reranker baja su trabajo. Resultado típico: +15-25% # de recall con la misma base vectorial.

SEMBLE / CODESEARCH (PATRÓN COMÚN) VER FUENTE →

LO DEMÁS DE HOY

Cierre

El día confirma que la pelea por reducir el coste de inferencia se libra antes del LLM: en la búsqueda. Semble marca el listón con 98% menos tokens que grep+read y codesearch demuestra que puedes correrlo todo en local con Rust y tree-sitter; claude-context suma Merkle para indexación incremental sobre Milvus. Mientras tanto, Vercel AI SDK estandariza gemini-embedding-2 y deep-research-preview bajo la misma firma, y Hamel insiste en que sin error analysis no hay prompt que aguante un cambio de modelo. Lo que deja de ser válido para quien envía a producción: agentes que se comen tokens con grep+read, embeddings atados a una versión, parsers de código sin AST y prompts ajustados a ojo sin trazas etiquetadas.

¿LLEVAS IA A PRODUCCIÓN EN TU EMPRESA?

Iván consulta sobre todo esto

Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.

RESERVAR LLAMADA → VER SERVICIOS

VER TODAS LAS EDICIONES