Pinecone es vectorial. Drive es la fuente. Si ambos no se sincronizan, Claude responde con info vieja y un KAM le cita un dato incorrecto a Unilever. Acá las 3 formas de mantenerla viva — y cuál es el cocktail recomendado para Seeds.
Las tres funcionan. La diferencia es cuánto humano necesitan y cuánto te cuestan. Para Seeds, n8n es el sweet spot — ya tienen instancia y el workflow se clona en una tarde.
Auto-play para verlo correr. Cada nodo se ilumina a medida que avanza el flujo, y el último notifica al canal de Slack para que alguien sepa qué se actualizó.
Ya Vectorizados.800 tokens con 100 overlap. Conserva título, headings y números de página.doc_type, area, audience, fileId, createdTime.Probadas con clientes que tuvieron drift en producción. Cada una resuelve un fail típico que se ve en la realidad.
Si el archivo cambió, borrá los chunks viejos por fileId antes de meter los nuevos. Sino quedan duplicados y Claude cita versiones que ya no existen.
Filtrar por metadata es más barato y flexible que partir todo en namespaces. Un solo index seeds con metadata buena alcanza.
Cambios legales o de pricing no esperan al cron. El workflow tiene que tener un endpoint manual para forzar re-index al toque.
Alguien tiene que poder responder "¿cuándo se actualizó X?". Sin log no hay forma — y eso te muerde el día que falla.
5 preguntas conocidas con respuesta correcta esperada. Si la vectorial empieza a fallar en 2 de 5, hay drift y hay que actuar.
Empezá clonando el #4552 (es el más cercano al setup Seeds). Ajustá los parámetros de chunking + el schema de metadata + el destino Pinecone.
Más detalle: docs.pinecone.io · docs.n8n.io · Pinecone node