Introducción

Una buena base de conocimiento es esencial para que tus Agentes IA puedan brindar respuestas útiles, precisas y coherentes. Si los documentos que subes están mal estructurados, incompletos o son difíciles de interpretar, el Agente IA puede dar respuestas equivocadas o inventadas. Por el contrario, cuando la información está clara, organizada y escrita con intención, el Agente IA comprende mejor el contexto y mejora la calidad de sus respuestas.

Estructurar una buena base de conocimiento es como entrenar a alguien nuevo en tu equipo: necesitas explicarle claramente, darle documentos bien hechos y asegurarte de que entiende.


Usa formatos legibles por IA

La IA solo puede leer texto digital. Los archivos escaneados o que contienen texto como imagen no son útiles, aunque visualmente se vean bien.

Recomendado: .docx, .txt, .md, .pdf (solo si el texto es seleccionable)

Ejemplos

Correcto: Documento .docx exportado desde Word con estilo de encabezados, párrafos y listas.

Correcto: Archivo .txt plano con secciones separadas por títulos.

⚠️ Aceptable: Un .pdf generado desde Word u otra herramienta digital, siempre que puedas seleccionar el texto con el mouse.

Incorrecto: PDF escaneado desde papel o imagen incrustada (aunque tenga apariencia profesional, la IA no podrá interpretarlo).

¿Cómo saber si tu archivo es válido? Abre el PDF y trata de seleccionar y copiar el texto. Si no puedes, no funcionará para la IA. No uses capturas de pantalla o fotos de documentos como fuente.


Estructura clara y temática

Una base de conocimiento útil está organizada por temas. No mezcles todo en un solo documento largo y ambiguo. Usa títulos, subtítulos y separa la información según su propósito.

Haz esto:

  • Divide tu contenido en archivos distintos por tema o área (ej. “Políticas de facturación”, “FAQs de entregas”, “Ficha técnica de Producto A”).
  • Usa encabezados jerárquicos (Título principal, Subtítulo, Puntos clave).

Ejemplos

Correcto: Documento sobre garantías con secciones como “¿Qué cubre?”, “Duración”, “Cómo hacer válida la garantía”.

Incorrecto: Archivo que mezcla políticas de ventas, contacto, productos y soporte en una sola página continua.

Agrega una tabla de contenidos al inicio si el documento tiene más de 3 secciones. Esto ayuda tanto a los Agentes IA a orientarse rápidamente.


Redacta con contexto completo

Cada fragmento de texto debe tener sentido por sí solo. La IA a veces lee un solo párrafo aislado, por lo que no debe depender del título o del contenido anterior.

Haz esto:

  • Escribe con contexto explícito.
  • Incluye nombres de productos, lugares, fechas o condiciones directamente en la frase.

Ejemplos

Correcto: “La póliza de garantía para autos eléctricos aplica en México y tiene una duración de 24 meses desde la fecha de compra.”

Incorrecto: “Tiene 2 años de cobertura” (¿qué tiene? ¿dónde? ¿desde cuándo?)


Usa lenguaje claro, preciso y consistente

La IA no interpreta ambigüedades, jergas o frases enredadas como un humano. Es importante escribir con claridad, evitar sinónimos innecesarios y definir los términos.

Usa frases cortas y directas.

Mantén el mismo término para cada concepto (ej. no mezcles “cliente” y “usuario”).

Define cualquier acrónimo la primera vez.

Ejemplos

Correcto: “El CRM (Customer Relationship Management) permite gestionar todos los prospectos.”

Incorrecto: “La herramienta para leads o el sistema de usuarios permite…” (confuso e inconsistente)

Haz una búsqueda rápida en tu documento para asegurarte de que siempre usas el mismo término clave. Esto reduce errores semánticos en las respuestas del Agente IA.


Usa plantillas y formatos repetibles

Cuando cargas muchos documentos similares (como fichas de productos, procesos, guías), mantener una estructura repetitiva ayuda al modelo a reconocer patrones.

Haz esto:

  • Usa plantillas fijas para cada tipo de documento.
  • Mantén el mismo orden de secciones en cada archivo.

Ejemplos

Correcto: Cada producto tiene los campos: nombre, descripción, especificaciones, preguntas frecuentes, contacto de soporte.

Incorrecto: Cada ficha de producto tiene estructura distinta, a veces sin descripción o sin secciones separadas.

Crea una plantilla base que puedas duplicar para cada nuevo documento. Esto asegura coherencia sin esfuerzo y acelera el proceso de documentación.


Incluye preguntas y ejemplos

Anticipar las preguntas que puede hacer el usuario ayuda al modelo a entender el lenguaje natural. Incluir ejemplos con preguntas y respuestas bien redactadas mejora mucho la calidad de las respuestas generadas.

Haz esto:

  • Incluye una pequeña sección tipo FAQ (Preguntas Frecuentes).
  • Redacta preguntas reales o representativas y sus respuestas claras.

Ejemplos

Correcto:

P: ¿Hacen envíos internacionales?

R: Actualmente solo enviamos dentro de México. Próximamente incluiremos otros países.

Incorrecto: Solo incluir la frase “no hacemos envíos internacionales” fuera de contexto o en una lista sin encabezado.


Elimina redundancias y contradicciones

Dos archivos con versiones distintas de un dato pueden generar confusiones y respuestas erróneas. La IA no “elige la mejor opción”, mezcla lo que encuentra.

Haz esto:

  • Centraliza datos importantes (precios, fechas, condiciones).
  • Mantén solo la versión más reciente de cada documento.

Ejemplos

Correcto: Un solo documento llamado “Políticas actualizadas de garantía - marzo 2025.pdf”

Incorrecto: Tres archivos distintos diciendo que la garantía es de 6, 12 y 24 meses.


Mantén tu base actualizada

La calidad de tu agente depende también de que la información esté al día. Los documentos deben mantenerse actualizados y relevantes.

Haz esto:

  • Revisa tu base cada mes o trimestre.
  • Revisa tu base cada vez que haya cambios en tus productos o servicios.
  • Elimina versiones antiguas y sube nuevos documentos actualizados con fechas claras.

Ejemplos

Correcto: “Catálogo de productos - actualizado abril 2025”

Incorrecto: Tener documentos mezclados sin saber cuál está vigente.


¿Qué aplicar según tu industria?

Cada industria tiene información clave que no debe faltar en sus documentos. Asegúrate de incluir estos datos para que tus agentes tengan todo el contexto necesario:

SectorInformación esencial que deberías incluir
EducaciónFechas de inscripción, niveles académicos, modalidades
MedicinaProcedimientos, horarios, tipo de atención
Bienes RaícesUbicación, precios, métodos de contacto
FacturaciónMétodos de pago, vigencia de facturas, contacto de soporte
AutosModelos disponibles, garantías, ubicación de agencias
JoyeríaTipos de producto, materiales, políticas de devolución

Ejemplo: En el sector salud, un documento que diga solo “se atiende por la mañana” no es suficiente. Es mejor redactar: “El Dr. Ramírez atiende en la Clínica del Sur de lunes a viernes, de 8:00 AM a 2:00 PM”