Vibe Coding #1 - Agente IA conectado a PDFs en Python | Documentos legislativos del sector energético en España
Construyo desde cero un agente IA que responde preguntas sobre documentos PDF. El ejemplo: normativa energética del BOE. La técnica: sirve para cualquier documentación.
Clips destacados
Recibe actualizaciones semanales
Sesiones de live coding, librerías Python para datos energéticos y tutoriales prácticos. Un email por semana, sin relleno.
Lo que construimos
Un agente de IA conectado a documentos legislativos del BOE que responde preguntas citando los artículos relevantes.
Le preguntas: “¿Cómo se calcula el precio de la banda secundaria?” y te responde con la referencia exacta al artículo correspondiente.
El problema real
¿Cuánto tiempo pierde tu equipo buscando información en cientos de páginas de normativa? En el sector energético, los operadores consultan constantemente programas de red eléctrica, compromisos de generación y regulaciones de curtailment.
Lo que hicimos paso a paso
- Extracción de PDFs — Convertimos el Código de la Energía Eléctrica a Markdown usando PyMuPDF4LLM
- Base de datos vectorial — Indexamos los documentos en ChromaDB para búsqueda semántica
- API en Python — Creamos endpoints REST para consultar la documentación
- Integración MCP — Conectamos la API como servidor MCP para que Claude Code pueda usarla directamente
Descubrimiento importante
Durante el stream descubrimos que el parseador inicial fallaba porque no todos los “artículos” se llaman así. Algunos están escritos como “reglas”, “disposiciones” o “anexos”. Tuvimos que adaptar el sistema para manejar estas variaciones.
“Programar con IA es como conducir: si no la paras cuando debes, te estrellas.”
Stack técnico
- Python — Lenguaje principal
- ChromaDB — Base de datos vectorial
- PyMuPDF4LLM — Extracción de PDFs optimizada para LLMs
- FastMCP — Protocolo de conexión con agentes IA
- Claude Code — Agente de desarrollo
Para quién es
- Developers que quieren conectar agentes IA a sus datos
- Equipos técnicos evaluando soluciones para documentación interna
- Sector energético — el ejemplo es legislación energética, pero la técnica es universal
Recursos
- Código de la Energía Eléctrica (BOE)
- FastMCP — Librería para crear servidores MCP
- PyMuPDF4LLM — Extracción de PDFs para LLMs