Dans cet article, vous trouverez une analyse de la transformation de l'architecture du commerce électronique vers des systèmes conçus pour des agents intelligents, ce qui nécessite de s'éloigner des structures construites uniquement pour le front-end. Vous apprendrez comment créer des données produit et des schémas JSON "prêts pour l'IA" qui minimisent le risque d'hallucination des modèles, et comment optimiser les API pour les systèmes RAG. Vous découvrirez également le rôle de la couche middleware de Semly, qui standardise les données et vous permet d'implémenter rapidement des fonctionnalités d'IA tout en contrôlant les coûts et la sécurité.
Pourquoi modifier l'architecture de la boutique en ligne dans le cadre de l'IA générative ?
L'IA générative oblige à penser le back-end du commerce électronique non plus comme une "API pour le front-end", mais comme une "API pour les agents intelligents".
Nouveaux types de consommateurs d'API
Votre API ne sera pas seulement utilisée par votre page de vente ou votre application mobile, mais aussi par.. :
- chatbots de produits (RAG, agents AI),
- une couche de recommandation et de personnalisation (LLM en tant qu'orchestrateur),
- pipelines de génération de contenu (yobs asynchrones de l'IA),
- des outils analytiques avec une couche linguistique.
Ces nouveaux composants s'attendent à ce que les données soient plus sémantiques, plus cohérentes sur le plan taxonomique et plus orientées vers les événements (séquences d'événements au lieu d'agrégats).
Le rôle de Semly dans ce changement
Semly agit comme une couche intermédiaire entre votre boutique et les modèles génératifs. Il standardise les données relatives aux produits et aux événements, gère les invites, la mise en cache et les coûts des modèles, ce qui permet aux développeurs de se concentrer sur la logique du domaine de la boutique plutôt que sur les détails de l'intégration avec LLM.
Quelles sont les exigences de l'IA générative en matière d'architecture du commerce électronique ?
Principaux cas d'utilisation Besoins en IA et en données
- Chatbot de produit : Il a besoin de données complètes sur les produits, leur disponibilité, leur prix et le contexte de l'utilisateur.
- Moteur de recherche sémantique : Elle nécessite des descriptions riches et une API de recherche qui permet de filtrer et de trier.
- Recommandations du LLM : Ils ont besoin d'événements comportementaux structurés (vue, ajout au panier, achat).
Types de données nécessaires à une IA de qualité
- Données du produit (ID, textes, attributs techniques, marketing, SEO, multimédia, relations).
- Données de l'événement (norme GA4 : view_item, add_to_cart, begin_checkout, purchase).
- Données contextuelles (canal d'entrée, localisation, contraintes commerciales).
Conception d'API pour les magasins dans le cadre de l'IA générative
REST vs GraphQL dans le contexte de l'IA
Les architectures "prêtes pour l'IA" combinent souvent les deux approches :
- REST : Idéal pour l'exportation de catalogues et la mise en lots (ETL vers index vectoriel).
- GraphQL : Vous permet de télécharger exactement les champs dont vous avez besoin dans le message à la demande.
Exemple de réponse GET /api/produits/{id} en tenant compte de l'IA :
{
"@context": "https://schema.org/",
"@type": "Product",
"name": "Chaussures de running bleues",
"brand": {"@type": "Brand", "name": "Acme Sports"},
"offers": {
"@type": "Offer",
"priceCurrency": "EUR",
"price": "69.51"
}
}Données sur les produits dans le cadre de l'IA générative
Normalisation et taxonomies
Pour que l'IA puisse faire des déductions significatives, les données doivent être cohérentes. Il est intéressant de s'inspirer des normes schema.org/Product et de la spécification Google Merchant Center.
Un exemple de modèle dans l'esprit de schema.org :
{
"cart_id": "cart-123",
"items": [{
"product_id": "TRAIL-001",
"quantity": 1,
"unit_price": 92.76
}],
"total": 92.76,
"currency": "EUR"
}Structures JSON pour l'échange de données avec les modèles d'IA
JSON du panier d'achat et de la session de l'utilisateur
Le panier d'achat constitue un contexte clé pour le chatbot :
{
"id": "product-uuid",
"sku": "TRAIL-001",
"slug": "chaussures-trail-running",
"title": "Chaussures Trail Running",
"brand": "Acme Sports",
"attributes": {
"terrain": "trail",
"cushioning": "élevé",
"weight_g": 280
},
"price": {"amount": 92.76, "currency": "EUR"},
"availability": "en_stock"
}JSON des événements de l'utilisateur
Sur le modèle de l'AG4, adopter un format commun :
{
"event_type": "voir_article",
"occurred_at": "2026-01-12T10:05:00Z",
"ecommerce": {
"items": [{"item_id": "TRAIL-001", "price": 92.76}],
"currency": "EUR"
}
}Couche d'historique des événements et du comportement des utilisateurs
Si vous collectez des événements par le biais de GA4, Segment ou Snowplow, vous disposez déjà d'une base. Pour l'IA, les événements sont utilisés pour personnaliser les réponses et détecter les intentions.
"Faites des événements un citoyen architectural de première classe - enregistrez-les dans un magasin d'événements ou dans des grossistes tels que BigQuery ou Snowflake."
Intégration de l'IA générative dans la pratique
Modèles architecturaux
- Microservice AI : Responsable de l'intégration avec le LLM et de la préparation des messages-guides.
- Middleware / BFF : Le frontend communique avec le BFF, qui combine les données de l'API du magasin et de l'IA.
- Travailleurs de l'IA pilotés par les événements : Génération asynchrone de descriptions après un événement "ProductCreated".
Sécurité et coûts
Masquer les données personnelles dans les invites et utiliser un filtrage agressif des entrées pour réduire les coûts des jetons.
Comment Semly soutient-elle les développeurs ?
Semly relève les défis de l'intégration en fournissant :
- Normalisation des données : Cartographie des structures (Shopify, Magento) vers un modèle "prêt pour l'IA".
- La couche API terminée : Points finaux pour le chatbot et les recommandations.
- Contrôle de la qualité : Mécanismes de mise en cache et de surveillance des requêtes.
FAQ pour les développeurs
Comment puis-je commencer à mettre en œuvre une plateforme SaaS existante (par exemple Shopify, Shopware) ?
Les API existantes (REST ou GraphQL) doivent être utilisées pour exporter efficacement le catalogue de produits et les événements en flux continu. Une étape clé consiste à identifier les lacunes dans les données relatives aux produits, telles que des descriptions médiocres ou des attributs techniques manquants, et à prévoir de les combler. Au lieu de relier directement le frontend aux modèles LLM, il est recommandé d'ajouter une couche intermédiaire telle que Semly
Que faire en cas de données incomplètes ou incohérentes ?
L'IA peut "combler les lacunes" du langage naturel, mais il ne faut pas s'y fier pour des faits tels que les paramètres techniques ou la compatibilité. La stratégie la plus sûre consiste à n'utiliser l'IA que pour enrichir les descriptions basées sur des données techniques déjà vérifiées. Dans les messages-guides eux-mêmes, il doit être explicitement interdit au modèle de "deviner" - il doit communiquer ouvertement le manque d'informations s'il ne les trouve pas dans la source. Parallèlement, il faut investir dans la qualité des données à la source, par exemple dans les systèmes PIM.
Un entrepôt de données et un feature store distincts sont-ils nécessaires pour commencer ?
Au tout début, ce n'est pas nécessaire - vous pouvez commencer par une simple exportation du catalogue et des événements directement vers Semly ou le service d'IA de votre choix. Cependant, l'entrepôt de données et le magasin de fonctionnalités deviennent cruciaux lors de la phase de mise à l'échelle de la solution, lorsqu'il est nécessaire de combiner des données provenant de sources multiples, de construire des recommandations hybrides avancées ou de servir plusieurs marques et marchés simultanément.
Comment aborder la migration des données de produits vers la nouvelle structure JSON ?
Il est recommandé de créer une couche de mise en correspondance entre le modèle de données existant et le schéma standardisé cible "prêt pour l'IA". Ce processus peut se dérouler progressivement - la mise en correspondance peut être partielle au début et les données peuvent être successivement enrichies par des processus de merchandising quotidiens ou des processus d'IA automatisés générant des descriptions manquantes sur la base des attributs disponibles.
Résumé
La mise en œuvre réussie de l'intelligence artificielle générative dans une boutique en ligne est un processus qui va au-delà de la simple intégration avec un chatbot. Elle nécessite une refonte fondamentale de la manière dont le système "parle" aux algorithmes, en mettant l'accent non plus sur la présentation visuelle, mais sur la structure précise des données.
Voici les principaux piliers de l'architecture moderne du commerce électronique :
- API sémantiques (REST et GraphQL) : Il s'agit de s'éloigner des interfaces conçues uniquement pour le frontend. L'architecture doit offrir des points de terminaison qui fournissent aux modèles LLM un contexte commercial complet sans bruit d'information inutile. GraphQL devient un outil clé ici, permettant de récupérer des ensembles précis de champs (par exemple, uniquement les attributs techniques et la disponibilité) directement dans l'invite.
- Des données produits riches et standardisées : Les modèles d'IA fonctionnent mieux sur des données structurées conformes à des normes telles que schema.org ou Google Merchant Center. Un modèle de produit complet doit comprendre non seulement des descriptions marketing, mais surtout des attributs techniques typés (par exemple, le poids, la puissance, la compatibilité) et une liste d'avantages et d'utilisations spécifiques.
- Événements structurés (Events) : Les données relatives au comportement de l'utilisateur (consultation, ajout au panier, achat) cessent d'être de simples journaux bruts pour l'analyse et deviennent un carburant pour la personnalisation. Ces événements, combinés à l'historique des sessions, permettent à l'intelligence artificielle de détecter avec précision les intentions d'achat des clients.
Sources :
- commercetools HTTP API - Produits
- Shopify Storefront API - Objet du produit
- Google Merchant Center - Spécification des données du produit
- Google Analytics 4 - Mesure du commerce électronique
- Vertex AI Search for Commerce - Evénements pour les utilisateurs
- GA4 - Événements recommandés pour le commerce de détail et de détail
- Chasse-neige - Guide de migration de l'AG (diagrammes d'événements)
Partager :
