In diesem Artikel finden Sie eine Analyse des Wandels der E-Commerce-Architektur hin zu Systemen, die für intelligente Agenten konzipiert sind, was eine Abkehr von Strukturen erfordert, die ausschließlich für das Frontend entwickelt wurden. Sie erfahren, wie Sie "KI-fähige" Produktdaten und JSON-Schemata erstellen, die das Risiko halluzinierender Modelle minimieren, und wie Sie APIs für RAG-Systeme optimieren können. Sie lernen auch die Rolle der Semly-Middleware-Schicht kennen, die Daten standardisiert und es Ihnen ermöglicht, KI-Funktionen schnell zu implementieren und gleichzeitig Kosten und Sicherheit zu kontrollieren.
Warum sollte die Architektur des Online-Shops im Rahmen der generativen KI geändert werden?
Generative KI erzwingt ein Umdenken im E-Commerce-Backend von einem "API für das Frontend" zu einem "API für intelligente Agenten"-Ansatz.
Neue Arten von API-Kunden
Ihre API wird nicht nur von Ihrer Shop-Seite oder mobilen App genutzt, sondern auch von anderen:
- produkt-Chatbots (RAG, KI-Agenten),
- eine Empfehlungs- und Personalisierungsebene (LLM als Orchestrator),
- pipelines für die Inhaltserstellung (asynchrone KI-Jobber),
- analysetools mit einer Sprachschicht.
Diese neuen Komponenten erwarten, dass die Daten semantischer, taxonomisch konsistent und ereignisorientiert sind (Sequenzen von Ereignissen anstelle von Aggregaten).
Die Rolle von Semly bei diesem Wandel
Semly fungiert als Zwischenschicht zwischen Ihrem Shop und generativen Modellen. Es standardisiert Produkt- und Ereignisdaten, verwaltet Prompts, Caching und Modellkosten und ermöglicht es Entwicklern, sich auf die Domänenlogik des Shops zu konzentrieren, anstatt sich mit den Details der Integration mit LLM zu beschäftigen.
Welche Anforderungen stellt die generative KI an die E-Commerce-Architektur?
Wichtige Anwendungsfälle KI vs. Datenbedarf
- Produkt-Chatbot: Sie benötigt vollständige Produktdaten, Verfügbarkeit, Preise und Benutzerkontext.
- Semantische Suchmaschine: Sie erfordert umfangreiche Beschreibungen und eine Such-API, die das Filtern und Sortieren ermöglicht.
- Empfehlungen des LLM: Sie benötigen strukturierte Verhaltensereignisse (view, add_to_cart, purchase).
Arten von Daten, die für hochwertige AI erforderlich sind
- Produktdaten (ID, Texte, technische Eigenschaften, Marketing, SEO, Multimedia, Beziehungen).
- Daten zum Ereignis (GA4-Standard: view_item, add_to_cart, begin_checkout, purchase).
- Kontextbezogene Daten (Eintrittskanal, Standort, geschäftliche Zwänge).
Shop-API-Design unter generativer KI
REST vs. GraphQL im Kontext der KI
KI-fähige" Architekturen kombinieren häufig beide Ansätze:
- REST: Ideal für Katalogexport und Batching (ETL zu Vektorindex).
- GraphQL: Ermöglicht es Ihnen, genau die Felder herunterzuladen, die Sie in der On-Demand-Promotion benötigen.
Beispiel für eine GET-Antwort /api/products/{id} unter Berücksichtigung der KI:
{
"@context": "https://schema.org/",
"@type": "Product",
"name": "Laufschuhe Blau",
"brand": {"@type": "Brand", "name": "Acme Sports"},
"offers": {
"@type": "Offer",
"priceCurrency": "EUR",
"price": "69.51"
}
}Produktdaten unter generativer AI
Standardisierung und Taxonomien
Damit KI sinnvolle Schlüsse ziehen kann, müssen die Daten konsistent sein. Es lohnt sich, sich von den schema.org/Product-Standards und der Spezifikation des Google Merchant Center inspirieren zu lassen.
Ein Beispiel für ein Modell im Geiste von schema.org:
{
"cart_id": "cart-123",
"items": [{
"product_id": "TRAIL-001",
"quantity": 1,
"unit_price": 92.76
}],
"total": 92.76,
"currency": "EUR"
}JSON-Strukturen für den Datenaustausch mit KI-Modellen
JSON des Warenkorbs und der Benutzersitzung
Der Einkaufswagen stellt einen wichtigen Kontext für den Chatbot dar:
{
"id": "product-uuid",
"sku": "TRAIL-001",
"slug": "trail-running-schuh",
"title": "Trail Running Schuhe",
"brand": "Acme Sports",
"attributes": {
"terrain": "trail",
"cushioning": "hoch",
"weight_g": 280
},
"price": {"amount": 92.76, "currency": "EUR"},
"availability": "auf_lager"
}JSON der Benutzerereignisse
Nach dem Vorbild von GA4 wird ein gemeinsames Format angenommen:
{
"event_type": "artikel_angesehen",
"occurred_at": "2026-01-12T10:05:00Z",
"ecommerce": {
"items": [{"item_id": "TRAIL-001", "price": 92.76}],
"currency": "EUR"
}
}Ereignisse und Historie des Nutzerverhaltens
Wenn Sie Ereignisse über GA4, Segment oder Snowplow sammeln, haben Sie bereits eine Basis. Für KI werden Ereignisse verwendet, um Antworten zu personalisieren und Absichten zu erkennen.
"Machen Sie Ereignisse zu architektonischen Bürgern erster Klasse - speichern Sie sie in einem Ereignisspeicher oder in Wholesalern wie BigQuery oder Snowflake."
Integration mit generativer KI in der Praxis
Architektonische Muster
- Microservice-KI: Verantwortlich für die Integration mit LLM und die Vorbereitung von Prompts.
- Middleware / BFF: Das Frontend kommuniziert mit der BFF, die Daten aus der Shop-API und KI kombiniert.
- Ereignisgesteuerte KI-Arbeiter: Asynchrone Erzeugung von Beschreibungen nach einem "ProductCreated"-Ereignis.
Sicherheit und Kosten
Maskieren Sie persönliche Daten in Eingabeaufforderungen und verwenden Sie aggressive Eingabefilter, um Token-Kosten zu reduzieren.
Wie unterstützt Semly Entwickler?
Semly stellt sich den Herausforderungen der Integration, indem es Folgendes bietet:
- Standardisierung der Daten: Abbildung von Strukturen (Shopify, Magento) auf ein "KI-fähiges" Modell.
- Die fertige API-Schicht: Endpunkte für Chatbot und Empfehlungen.
- Qualitätskontrolle: Mechanismen zur Zwischenspeicherung und Überwachung von Abfragen.
FAQ für Entwickler
Wie beginne ich mit der Implementierung auf einer bestehenden SaaS-Plattform (z. B. Shopify, Shopware)?
Vorhandene APIs (REST oder GraphQL) sollten genutzt werden, um den Produktkatalog effizient zu exportieren und Ereignisse zu streamen. Ein wichtiger Schritt ist die Identifizierung von Lücken in den Produktdaten, wie z. B. unzureichende Beschreibungen oder fehlende technische Attribute, und die Planung, diese zu schließen. Anstatt das Frontend direkt mit LLM-Modellen zu verknüpfen, empfiehlt es sich, eine Zwischenschicht wie Semly
Was ist im Falle unvollständiger oder inkonsistenter Daten zu tun?
KI kann die "Lücken" in der natürlichen Sprache füllen, darf aber nicht für Fakten wie technische Parameter oder Kompatibilität herangezogen werden. Die sicherste Strategie besteht darin, KI nur zur Anreicherung von Beschreibungen zu verwenden, die auf bereits verifizierten technischen Daten basieren. In den Eingabeaufforderungen selbst muss dem Modell ausdrücklich untersagt werden, "zu raten" - es muss offen kommunizieren, dass Informationen fehlen, wenn es sie in der Quelle nicht findet. Parallel dazu muss in die Datenqualität an der Quelle investiert werden, z. B. in PIM-Systeme.
Ist ein separates Data Warehouse und ein Feature Store erforderlich, um mit der Arbeit zu beginnen?
Zu Beginn ist dies nicht notwendig - Sie können mit einem einfachen Export des Katalogs und der Ereignisse direkt zu Semly oder dem KI-Dienst Ihrer Wahl beginnen. Das Data Warehouse und der Feature Store werden jedoch in der Skalierungsphase der Lösung entscheidend, wenn Daten aus mehreren Quellen kombiniert, fortschrittliche hybride Empfehlungen erstellt oder mehrere Marken und Märkte gleichzeitig bedient werden müssen.
Wie soll die Migration von Produktdaten in die neue JSON-Struktur erfolgen?
Es wird empfohlen, eine Mapping-Ebene zwischen dem bestehenden Datenmodell und dem angestrebten standardisierten "KI-fähigen" Schema zu erstellen. Dieser Prozess kann schrittweise erfolgen - das Mapping kann zu Beginn partiell sein und die Daten können sukzessive durch tägliche Merchandising-Prozesse oder automatisierte KI-Prozesse, die fehlende Beschreibungen auf der Grundlage verfügbarer Attribute generieren, angereichert werden.
Zusammenfassung
Die erfolgreiche Implementierung generativer künstlicher Intelligenz in einem Online-Shop ist ein Prozess, der über die einfache Integration mit einem Chatbot hinausgeht. Es erfordert eine grundlegende Umgestaltung der Art und Weise, wie das System mit den Algorithmen "spricht", wobei sich der Schwerpunkt von der visuellen Darstellung auf eine präzise Datenstruktur verlagert.
Hier sind die wichtigsten Säulen einer modernen E-Commerce-Architektur:
- Semantische APIs (REST & GraphQL): Die Grundlage ist die Abkehr von Schnittstellen, die ausschließlich für das Frontend konzipiert sind. Die Architektur muss Endpunkte bieten, die LLM-Modelle mit vollständigem Geschäftskontext ohne unnötiges Informationsrauschen bereitstellen. GraphQL wird hier zu einem Schlüsselinstrument, das es ermöglicht, präzise Feldgruppen (z. B. nur technische Attribute und Verfügbarkeit) direkt in der Eingabeaufforderung abzurufen.
- Umfangreiche und standardisierte Produktdaten: KI-Modelle funktionieren am besten mit strukturierten Daten, die mit Standards wie schema.org oder Google Merchant Center übereinstimmen. Ein vollständiges Produktmodell muss nicht nur Marketingbeschreibungen, sondern vor allem typisierte technische Attribute (z. B. Gewicht, Leistung, Kompatibilität) und eine Liste mit spezifischen Vorteilen und Verwendungszwecken enthalten.
- Strukturierte Ereignisse (Events): Daten zum Nutzerverhalten (Ansicht, Einkaufswagen, Kauf) sind nicht mehr nur rohe Protokolle für die Analyse, sondern dienen als Grundlage für die Personalisierung. Diese Ereignisse, kombiniert mit dem Sitzungsverlauf, ermöglichen es der KI, die Kaufabsicht des Kunden genau zu erkennen.
Quellen:
- commercetools HTTP API - Produkte
- Shopify Schaufenster API - Erzeugnisobjekt
- Google Merchant Center - Spezifikation der Produktdaten
- Google Analytics 4 - Messung des elektronischen Handels
- Vertex AI Search für den Handel - Benutzer-Ereignisse
- GA4 - Empfohlene Veranstaltungen für Einzelhandel/Ecommerce
- Schneepflug - GA-Migrationsleitfaden (Ereignisdiagramme)
Teilen:
