LUNES, 1 DE JUNIO DE 2026
Semble: búsqueda de código para agentes con 98% menos tokens que grep+read
Librería MIT que indexa repos completos en 250 ms (200× más rápido que un transformer especializado) y devuelve solo el snippet exacto. Recortas 98% el coste por consulta y multiplicas por diez la velocidad de búsqueda en Claude Code, Cursor o Codex sin GPU ni claves de API. 19 lenguajes, BM25 + Model2Vec en local.
4 MIN LECTURAcodesearch: MCP de búsqueda híbrida en Rust, 100% offline y con chunking AST por tree-sitter
Apache 2.0 en Rust con retrieval híbrido vector + BM25 fusionado por Reciprocal Rank Fusion y chunking por función gracias a tree-sitter en 9 lenguajes. Lo conectas a Claude Code, Cursor, OpenCode o cualquier cliente MCP sin sacar el código de tu máquina.
claude-context 0.6: MCP con Milvus y chunking por Merkle para indexación incremental
MIT con BM25 + denso sobre Milvus o Zilliz Cloud y árbol de Merkle para reindexar solo los cambios. 40% menos tokens manteniendo el recall y soporta 11 clientes (Claude Code, Cursor, Windsurf, Cline, VS Code, Gemini CLI, Qwen Code, Cherry Studio, Augment, Roo Code, Zencoder).
Vercel AI SDK canary: @ai-sdk/google estrena gemini-embedding-2 y deep-research-preview
Cambias del embedding viejo a gemini-embedding-2 en una sola línea y abres llamadas a deep-research-preview-04-2026 y deep-research-max-preview-04-2026 con la misma firma que la chat. Mismo SDK para vectorizar tu RAG y disparar investigación profunda sin un servicio aparte.
Hamel Husain: empezar por error analysis antes que por prompts (guía eval-first)
La FAQ de evals de Hamel deja un mapa concreto: 100 trazas reales, etiquetado axial, descubrir failure modes y solo entonces redactar prompts o juez. Convierte 'mejorar el prompt' en una decisión basada en datos y deja de regresionar features en cada cambio de modelo.
Codex CLI lleva Computer Use a Windows con remote control desde iOS, Android o Mac
El agente de OpenAI ya ve, hace clic y escribe sobre apps de escritorio Windows en primer plano, y puedes lanzar y supervisar la sesión desde el móvil o desde Codex en Mac. Cierras automatizaciones legacy sin Selenium y delegas tareas con auditoría desde la app móvil.
Una técnica, prompt o comando aplicable hoy. Cópialo, pruébalo en tu stack en menos de 5 minutos y reenvíalo a un colega si te resulta útil. Ejemplos típicos: un prompt para evals, un patrón de agente, un comando que recorta tokens o un truco de RAG.
Chunking AST con tree-sitter para no partir funciones en tu RAG de código
# pip install tree-sitter tree-sitter-python # El truco: en código, recursive splitting a 512 tokens parte # funciones por la mitad y arruina el recall. Chunkea por nodo AST. from tree_sitter import Language, Parser import tree_sitter_python as tspython parser = Parser(Language(tspython.language())) def chunk_by_function(src: bytes, max_lines: int = 80) -> list[str]: """Fragmentos a nivel función/clase, nunca cortados a la mitad.""" out, walk = [], parser.parse(src).walk() def visit(): n = walk.node if n.type in ("function_definition", "class_definition"): if n.end_point[0] - n.start_point[0] <= max_lines: out.append(src[n.start_byte:n.end_byte].decode()) return if walk.goto_first_child(): while True: visit() if not walk.goto_next_sibling(): break walk.goto_parent() visit() return out # Úsalo antes del embedding: ningún chunk parte una función # y el reranker baja su trabajo. Resultado típico: +15-25% # de recall con la misma base vectorial.
- 01 Cursor 3.6 estrena Auto-review como nuevo run mode con menos prompts de aprobación
- 02 Google Antigravity 2.0 abre Managed Agents API: un agente en Linux aislado por llamada
- 03 Langfuse pasa a formar parte de ClickHouse: continuidad para el almacén de trazas LLM
- 04 Claude Code 2.1.158 estabiliza Auto mode en Bedrock, Vertex y Foundry para Opus 4.7 y 4.8
- 05 xAI deprecia searchParameters en Grok: la búsqueda web pasa a herramientas de agente
Cierre
El día confirma que la pelea por reducir el coste de inferencia se libra antes del LLM: en la búsqueda. Semble marca el listón con 98% menos tokens que grep+read y codesearch demuestra que puedes correrlo todo en local con Rust y tree-sitter; claude-context suma Merkle para indexación incremental sobre Milvus. Mientras tanto, Vercel AI SDK estandariza gemini-embedding-2 y deep-research-preview bajo la misma firma, y Hamel insiste en que sin error analysis no hay prompt que aguante un cambio de modelo. Lo que deja de ser válido para quien envía a producción: agentes que se comen tokens con grep+read, embeddings atados a una versión, parsers de código sin AST y prompts ajustados a ojo sin trazas etiquetadas.
Iván consulta sobre todo esto
Ingeniero IA con 10+ años en Openbank, Inditex e Iberia. Agentes autónomos, integraciones LLM, RAG auditable — del piloto al despliegue real.