En este artículo encontrarás un análisis de la transformación de la arquitectura del comercio electrónico hacia sistemas diseñados para agentes inteligentes, lo que requiere alejarse de estructuras construidas únicamente para el frontend. Aprenderá a crear datos de productos "preparados para la IA" y esquemas JSON que minimicen el riesgo de alucinar con los modelos, y a optimizar las API para sistemas RAG. También conocerá el papel de la capa de middleware de Semly, que estandariza los datos y le permite implementar rápidamente funciones de IA a la vez que controla los costes y la seguridad.
¿Por qué cambiar la arquitectura de la tienda online con IA generativa?
La IA generativa está forzando un cambio de mentalidad en el backend del comercio electrónico, que está pasando de un enfoque de "API para el front end" a otro de "API para agentes inteligentes".
Nuevos tipos de consumidores de API
Su API no sólo será consumida por la página de su tienda o aplicación móvil, sino también por:
- chatbots de producto (GAR, agentes de IA),
- una capa de recomendación y personalización (LLM como orquestador),
- canales de generación de contenidos (yobs de IA asíncronos),
- herramientas analíticas con una capa lingüística.
Estos nuevos componentes esperan que los datos sean más semánticos, coherentes desde el punto de vista taxonómico y basados en eventos (secuencias de eventos en lugar de agregados).
El papel de Semly en este cambio
Semly actúa como capa intermedia entre la tienda y los modelos generativos. Estandariza los datos de productos y eventos, gestiona los avisos, el almacenamiento en caché y los costes de los modelos, lo que permite a los desarrolladores centrarse en la lógica de dominio de la tienda en lugar de en los detalles de la integración con LLM.
¿Qué exigencias plantea la IA generativa a la arquitectura del comercio electrónico?
Principales casos de uso AI frente a necesidades de datos
- Chatbot de producto: Necesita datos completos del producto, disponibilidad, precios y contexto del usuario.
- Motor de búsqueda semántico: Requiere descripciones enriquecidas y una API de búsqueda que permita filtrar y ordenar.
- Recomendaciones del LLM: Necesitan eventos de comportamiento estructurados (vista, add_to_cart, compra).
Tipos de datos necesarios para una IA de calidad
- Datos del producto (ID, textos, atributos técnicos, marketing, SEO, multimedia, relaciones).
- Datos del evento (GA4 estándar: view_item, add_to_cart, begin_checkout, purchase).
- Datos contextuales (canal de entrada, ubicación, limitaciones empresariales).
Diseño de API para tiendas con IA generativa
REST frente a GraphQL en el contexto de la IA
Las arquitecturas "preparadas para la IA" suelen combinar ambos enfoques:
- REST: Ideal para exportación de catálogos y lotes (ETL a índice vectorial).
- GraphQL: Le permite descargar exactamente los campos que necesita en el promt a la carta.
Ejemplo de respuesta GET /api/products/{id} pensando en la IA:
{
"@context": "https://schema.org/",
"@type": "Product",
"name": "Zapatillas de running azules",
"brand": {"@type": "Brand", "name": "Acme Sports"},
"offers": {
"@type": "Offer",
"priceCurrency": "EUR",
"price": "69.51"
}
}Datos de productos con IA generativa
Normalización y taxonomías
Para que la IA pueda hacer inferencias significativas, los datos deben ser coherentes. Merece la pena inspirarse en las normas schema.org/Product y la especificación Google Merchant Center.
Un ejemplo de modelo en el espíritu de schema.org:
{
"cart_id": "cart-123",
"items": [{
"product_id": "TRAIL-001",
"quantity": 1,
"unit_price": 92.76
}],
"total": 92.76,
"currency": "EUR"
}Estructuras JSON para el intercambio de datos con modelos de IA
JSON de la cesta de la compra y sesión de usuario
La cesta de la compra proporciona un contexto clave para el chatbot:
{
"id": "product-uuid",
"sku": "TRAIL-001",
"slug": "zapatillas-trail-running",
"title": "Zapatillas Trail Running",
"brand": "Acme Sports",
"attributes": {
"terrain": "trail",
"cushioning": "alto",
"weight_g": 280
},
"price": {"amount": 92.76, "currency": "EUR"},
"availability": "en_stock"
}JSON de eventos de usuario
Siguiendo el modelo del GA4, adopta un formato común:
{
"event_type": "ver_articulo",
"occurred_at": "2026-01-12T10:05:00Z",
"ecommerce": {
"items": [{"item_id": "TRAIL-001", "price": 92.76}],
"currency": "EUR"
}
}Capa de eventos e historial de comportamiento del usuario
Si recopila eventos a través de GA4, Segment o Snowplow, ya tiene una base. En el caso de la IA, los eventos se utilizan para personalizar las respuestas y detectar la intención.
"Convierta los eventos en ciudadanos arquitectónicos de primera clase: guárdelos en un almacén de eventos o en mayoristas como BigQuery o Snowflake"
Integración con la IA generativa en la práctica
Patrones arquitectónicos
- IA de microservicios: Responsable de la integración con LLM y de la preparación de avisos.
- Middleware / BFF: El frontend se comunica con el BFF, que combina los datos de la API de la tienda y la IA.
- Trabajadores de IA basados en eventos: Generación asíncrona de descripciones tras un evento "ProductCreated".
Seguridad y costes
Enmascare los datos personales en las solicitudes y utilice filtros de entrada agresivos para reducir el coste de los tokens.
¿Cómo ayuda Semly a los desarrolladores?
Semly aborda los retos de la integración proporcionando:
- Normalización de datos: Mapeo de estructuras (Shopify, Magento) a un modelo "listo para la IA".
- La capa API terminada: Puntos finales para chatbot y recomendaciones.
- Control de calidad: Mecanismos de caché y supervisión de consultas.
FAQ para desarrolladores
¿Cómo empiezo la implantación en una plataforma SaaS existente (por ejemplo, Shopify, Shopware)?
Deben utilizarse las API existentes (REST o GraphQL) para exportar eficazmente el catálogo de productos y transmitir eventos. Un paso clave es identificar las lagunas en los datos de los productos, como descripciones deficientes o atributos técnicos ausentes, y planificar su subsanación. En lugar de vincular directamente el frontend a los modelos LLM, se recomienda añadir una capa intermedia como Semly
¿Qué hacer en caso de datos incompletos o incoherentes?
La IA puede "rellenar las lagunas" del lenguaje natural, pero no se debe confiar en ella para datos como los parámetros técnicos o la compatibilidad. La estrategia más segura es utilizar la IA sólo para enriquecer descripciones basadas en datos técnicos ya verificados. En las propias indicaciones, el modelo debe tener explícitamente prohibido "adivinar": debe comunicar abiertamente la falta de información si no la encuentra en la fuente. Paralelamente, hay que invertir en la calidad de los datos en la fuente, como en los sistemas PIM.
¿Se necesita un almacén de datos y un almacén de funciones independientes para empezar?
Al principio, esto no es necesario: puede empezar con una simple exportación del catálogo y los eventos directamente a Semly o al servicio de IA de su elección. Sin embargo, el almacén de datos y el almacén de funciones resultan cruciales en la fase de ampliación de la solución, cuando es necesario combinar datos de varias fuentes, crear recomendaciones híbridas avanzadas o prestar servicio a varias marcas y mercados simultáneamente.
¿Cómo abordar la migración de los datos de los productos a la nueva estructura JSON?
Se recomienda crear una capa de correspondencia entre el modelo de datos existente y el esquema estandarizado objetivo "listo para la IA". Este proceso puede llevarse a cabo gradualmente: el mapeo puede ser parcial al principio y los datos pueden enriquecerse sucesivamente mediante procesos diarios de comercialización o procesos automatizados de IA que generen las descripciones que falten basándose en los atributos disponibles.
Resumen
Implantar con éxito la inteligencia artificial generativa en una tienda online es un proceso que va más allá de la simple integración con un chatbot. Requiere una remodelación fundamental de la forma en que el sistema "habla" con los algoritmos, desplazando el foco de atención de la presentación visual a la estructura precisa de los datos.
He aquí los pilares clave de la arquitectura moderna del comercio electrónico:
- API semánticas (REST y GraphQL): La base es alejarse de las interfaces diseñadas únicamente para el frontend. La arquitectura debe ofrecer puntos finales que proporcionen a los modelos LLM un contexto empresarial completo sin ruido de información innecesario. GraphQL se convierte en una herramienta clave aquí, permitiendo que conjuntos precisos de campos (por ejemplo, sólo atributos técnicos y disponibilidad) sean recuperados directamente en el prompt.
- Datos de productos ricos y estandarizados: Los modelos de IA funcionan mejor con datos estructurados que se ajustan a estándares como schema.org o Google Merchant Center. Un modelo de producto completo debe incluir no solo descripciones de marketing, sino sobre todo atributos técnicos tipificados (por ejemplo, peso, potencia, compatibilidad) y una lista de ventajas y usos específicos.
- Eventos estructurados (Events): Los datos de comportamiento del usuario (vista, add_to_cart, compra) dejan de ser solo registros en bruto para la analítica y se convierten en combustible para la personalización. Estos eventos, combinados con el historial de sesiones, permiten a la IA detectar con precisión la intención de compra del cliente.
Fuentes:
- aPI HTTP de commercetools - Productos
- Shopify Storefront API - Producto objeto
- Google Merchant Center - Especificación de los datos del producto
- Google Analytics 4 - Medición del comercio electrónico
- Vertex AI Búsqueda para el comercio - Eventos de usuarios
- GA4 - Acontecimientos recomendados para el comercio minorista
- Quitanieves - Guía de migración GA (diagramas de eventos)
Compartir:
