Si trabajas con asistentes AI, conoces el problema: cada herramienta, cada API, cada base de conocimiento requiere una integración custom. Los agentes se vuelven frágiles, difíciles de mantener y, peor, difíciles de escalar.
MCP (Model Context Protocol) cambia eso. Desarrollado por Anthropic como estándar abierto, MCP es a los asistentes AI lo que USB fue a los periféricos: un protocolo universal que permite conectar modelos de lenguaje con cualquier fuente de datos o herramienta sin escribir integraciones one-off.
En este artículo exploro cómo uso MCP en arquitecturas de agentes reales — no el demo de "hola mundo", sino patrones de orquestación que funcionan en producción.
¿Qué es MCP y por qué importa?
MCP (Model Context Protocol) define una interfaz estándar entre modelos de lenguaje (hosts) y herramientas/datos externos (servidores MCP). En lugar de que cada asistente tenga que implementar integraciones individuales para cada API, base de datos o servicio, expones servidores MCP que cualquier host MCP-compatible puede consumir.
Arquitectura de orquestación con MCP
En mis implementaciones, la arquitectura sigue estos principios:
1. Bus de herramientas descentralizado
Cada capacidad (búsqueda web, acceso a base de datos, ejecución de código, acceso a sistemas legacy) es un servidor MCP independiente. Estos servidores se registran en un registry central y el agente orquestador los descubre dinámicamente — similar a service discovery en microservicios.
2. Router de intenciones
El agente principal no sabe qué herramienta usar — usa un router de intenciones que analiza el input del usuario, determina qué servidores MCP necesita y delega la subtarea. Esto permite:
- Escalabilidad horizontal: agregas servidores MCP sin modificar el agente principal
- Aislamiento: un servidor MCP caído no tumba todo el sistema
- Seguridad granular: cada servidor MCP puede tener su propia autenticación y límites de rate
3. Context stitching
El mayor desafío de los agentes multi-herramienta es mantener el contexto. MCP maneja esto mediante context stitching — cada llamada a un servidor MCP incluye el contexto relevante del historial, y el servidor responde con datos estructurados que se integran de vuelta al hilo principal.
Ejemplo práctico: Sistema de monitoreo multi-sitio
En OMG administramos 53+ sitios WordPress. Implementé un asistente AI vía MCP que orquesta múltiples herramientas:
Servidores MCP desplegados:
├── mcp-server/uptime → UptimeRobot API (estado de sitios)
├── mcp-server/cloudflare → Cache purging, DNS checks
├── mcp-server/wp-api → Estado de cada sitio WP
├── mcp-server/analytics → Google Analytics data
└── mcp-server/alerts → Slack/Pushover notifications
El operador pregunta: "¿Qué sitios tuvieron downtime ayer?". El router de intenciones identifica que necesita datos de uptime y wp-api, consulta ambos servidores MCP en paralelo, cruza los datos y responde con un reporte.
Patrones de implementación que funcionan
Agent Routing Pattern
Un agente orquestador principal recibe la solicitud y delega a agentes especializados (cada uno con su servidor MCP). Ideal para sistemas con múltiples dominios de conocimiento.
Chain Pattern
El output de un servidor MCP alimenta al siguiente. Útil para pipelines de transformación de datos: extract → transform → load.
Parallel Pattern
Múltiples servidores MCP se consultan en paralelo y los resultados se consolidan. El patrón más usado en dashboards y reportes.
Consideraciones de producción
- Timeouts: Siempre implementa circuit breakers. Un servidor MCP lento no debe bloquear al agente principal.
- Rate limiting: Cada servidor MCP debe tener su propio rate limiter. No quieres que un loop de AI te queme la cuota de API.
- Observabilidad: Logging estructurado en cada servidor MCP. Necesitas saber qué herramientas llamó el agente, con qué parámetros, y cuánto tardó.
- Validación de input: Nunca confíes en el output de un LLM para construir queries SQL o shell commands. Sanitiza siempre en el servidor MCP.
El futuro: agentes como infraestructura
MCP está evolucionando hacia un estándar de facto. Empresas como Cloudflare, Vercel y Netlify ya están explorando soporte nativo para servidores MCP en sus plataformas Edge. La visión: deployar un servidor MCP sea tan simple como deployar un Worker.
El stack de agentes AI va camino a convertirse en un layer más de infraestructura — como DNS, CDN o bases de datos. MCP es el protocolo que lo hará posible.
¿Estás explorando agentes AI para tu organización? La orquestación con MCP cambia las reglas del juego. Hablemos de cómo implementarlo en tu stack.