Multi-Tenant
Mandantenfähige SaaS-Chatbot-Plattform – ein Server, beliebig viele Kunden-Domains via tenant-basiertem Routing
RAG + LLM
Retrieval-Augmented Generation mit OpenAI GPT-4o-mini, Fuse.js Fuzzy-Search und Live-Streaming der Antworten
SaaS-Modelle
Basic / Plus / Pro / Ultimate – Analytics-Dashboard mit 8 Chart-Typen, GeoIP-Heatmap und Themen-Forecast
Kontext
Produkt & Eigenentwicklung
Im Rahmen von Management Consulting Mayr und x25lab.com konzipiert und entwickelt Roman Mayr eine vollständig eigenständige, mandantenfähige KI-Chatbot-Plattform. Die Plattform wird als SaaS-Produkt für Unternehmenskunden betrieben und ermöglicht es, domänenspezifische KI-Assistenten auf jeder beliebigen Website einzubinden – ohne Datenweitergabe an Drittplattformen.
Die technische Basis bildet ein Node.js/Express-Backend mit Cluster-Betrieb, MariaDB-Persistenz, OpenAI-Integration und einem vollständig selbst entwickelten RAG-System (Retrieval-Augmented Generation). Ergänzt wird die Plattform durch einen eigenen Analytics-Server mit JWT-gesicherten SaaS-Dashboards sowie ein separates BPMN-Bot-Modul für Prozessmodellierung.
Node.js / Express
OpenAI GPT-5
RAG & LLM
WebSocket
Multi-Tenant
SaaS
MariaDB
JWT Auth
GeoIP / MaxMind
Stripe / PayPal
Microsoft Graph API
BPMN / Camunda
Cluster
tiktoken
Verlauf
Phase 1 – Chatbot-Core & RAG
Mandantenfähiger KI-Chatbot mit RAG-System
Aufbau der Kernarchitektur: Express-Server mit Node.js Cluster-Betrieb (automatisches CPU-Balancing), tenant-basiertes Routing über data-tenant-Attribut im Script-Tag. RAG-System mit automatischem Sitemap-Crawler, Dokument-Chunking, Fuse.js Fuzzy-Search und deutschen Sprachvarianten (Umlaute, Stämme, PMI-basierte Compound-Analyse). OpenAI GPT-4o-mini Integration mit Retry-Logik und API-Key-Rotation (automatischer Failover bei 401/429). Coverage-Scoring der Antworten über Quellen-Matching.
Phase 2 – Frontend & UX
Streaming-Interface, Voice & Fullscreen
Frontend-Chatbot (chatbot.js) als selbst-initialisierende IIFE mit eigenem MicroQueue-System für Antwort-Batching. Live-Streaming der GPT-Antworten mit visuellem Token-by-Token-Rendering. Warteschlangen-Anzeige bei mehreren gleichzeitigen Fragen. Spracheingabe via Web Speech API (Mikrofon-Button). Vollbild-Modus für Desktop. Suggest-Buttons (KI-generierte Folgefragen nach jeder Antwort). Coverage-Badge mit Quellen-Transparenz. BPMN-Bot-Modus für Prozessmodellierung via Camunda.
Phase 3 – Backend-Infrastruktur
GeoIP, E-Mail-Digest & Cron-Automatisierung
GeoIP-Enrichment via MaxMind GeoLite2 + geoip-lite mit automatischem Nominatim-Fallback für länderbezogene Nutzungsstatistiken. Digest-Queue-System für gebündelte E-Mail-Benachrichtigungen an Mandanten (konfigurierbare Intervalle, vollständiger Chatverlauf in HTML-Tabelle). Mailversand via Microsoft Graph API (OAuth 2.0, MSAL). Cron-Jobs für nächtlichen OpenAI-Cache-Cleanup (30-Tage-TTL), stündliche Index-Synchronisation und Weekly Heavy Crawl. Rate-Limiting pro Endpunkt.
Phase 4 – SaaS-Analytics-Dashboard
4 Pläne, 8 Chart-Typen, JWT-Portal
Separater Analytics-Server (server-charts.js) mit JWT-gesichertem Nutzerportal. Vier Abo-Stufen: Basic (Basis-Statistik), Plus (Top-Themen + Pipeline), Pro (GeoIP-Heatmap, Trendverlauf, Themen-Historie), Ultimate (alle Charts + Custom Reports + Themen-Forecast). Stripe und PayPal Zahlungsintegration. 8 Chart-Typen inkl. interaktiver Geo-Map, Prompt-Pipeline-Analyse, Themen-Trendverlauf und konfigurierbarer Custom Reports.
Phase 5 – Legal & Compliance
Rechtlicher Chatbot & Datenschutz-Modus
Separater API-Pfad /api/legal/ für rechtlich sensible Chatbot-Deployments (Anwaltskanzleien, Behörden) mit eigenem UI-Flag-System, Disclaimer-Slider und Datenschutzerklärung-Integration. Opt-in-Pflicht vor jeder Anfrage. Separate Kontakt-Mail-Route mit mandantenspezifischer Empfängerkonfiguration. sanitize-html für alle Nutzereingaben. Linkify-Endpunkt für sichere URL-Einbettung in Chatbot-Antworten.
Kernergebnisse
RAG-Engine mit deutschsprachiger Fuzzy-Suche
Vollständig eigenentwickeltes Retrieval-Augmented Generation System ohne externe Vektor-Datenbank. Sitemap-Crawler indexiert automatisch alle HTML-Seiten und Dokumente (PDF, DOCX, XLSX, PPTX, CSV) eines Mandanten.
- Fuse.js Fuzzy-Search mit Umlaut-Varianten (ae/ä, ss/ß), Stemming und PMI-basierter Compound-Analyse
- Kontext-Suchquery aus Chat-Verlauf: kurze oder referenzielle Folgefragen werden automatisch angereichert
- Coverage-Score je Antwort mit transparenter Quellenangabe für den Nutzer
- Automatische Cron-Indexierung – kein manuelles Deployment nötig
Multi-Tenant SaaS-Architektur
Ein einziger Server bedient beliebig viele Kunden-Domains. Mandanten-Identifikation über data-tenant-Attribut im eingebetteten Script-Tag – keine Code-Änderung beim Kunden nötig.
- Pro Mandant: eigene Kontaktkonfiguration, Assistenten-Label, E-Mail-Empfänger und Dateiverzeichnis
- Vollständige Isolation der RAG-Indizes je Mandant
- Stündliche Silent-Sync-Cron-Jobs pro Mandant (shuffled, fehlertolerante Ausführung)
- Mandanten-spezifische Digest-E-Mails mit vollständigem Chatverlauf in HTML
OpenAI Streaming & API-Key-Management
Token-by-Token Streaming via Server-Sent Events (SSE) für sofortige Antwort-Darstellung. Eigenes API-Key-Rotation-System mit automatischem Failover bei erschöpften oder gesperrten Keys.
- tiktoken-basierte Token-Zählung (o200k_base / cl100k_base) für präzise Cost-Kontrolle
- Rotation nach last_used / usage_count – Round-Robin mit DB-Persistenz
- Automatische Key-Deaktivierung bei 401-Response, reaktivierbar über Admin-Endpoint
- 30-Tage-Cache für OpenAI-Antworten in MariaDB (nächtliche Bereinigung per Cron)
Analytics-Dashboard mit GeoIP & SaaS-Plänen
Separater Analytics-Server mit JWT-gesichertem Nutzerportal. Vier Abo-Stufen mit plangrenzbezogenem Chart-Zugang. Vollständige Nutzungsstatistiken inklusive geografischer Heatmap.
- Free: Basis-Statistik | Plus: Top-Themen + Pipeline-Monatsvergleich
- Pro: GeoIP-Karte, Geo-Ranking, Trendverlauf, Prompts-Historie | Ultimate: + Forecast & Custom Reports
- MaxMind GeoLite2 + geoip-lite Dual-Stack mit Nominatim-Fallback für Ländernamen auf Deutsch
- Stripe + PayPal Zahlungsintegration für Self-Service-Upgrades
Technische Highlights
Backend-Architektur
- Node.js Cluster-Betrieb: Worker 1 übernimmt alle Cron-Jobs (Silent Sync, Heavy Crawl, Cache-Cleanup)
- Express mit Rate-Limiting, CORS, Compression, Session, JWT und bcrypt-Passwort-Hashing
- MariaDB Connection Pool mit supportBigNumbers, dateStrings und konfigurierbarem Connection Limit
- Multer File-Upload für Indexierung: PDF, DOCX, XLSX, PPTX, CSV, RTF, ODF, TXT
- WebSocket-Server (ws) parallel zum HTTP-Server für Echtzeit-Chatbot-Verbindungen
- Microsoft Graph API (MSAL OAuth 2.0) für Mailversand – kein SMTP, kein Drittanbieter
Frontend & UX-Engineering
- Chatbot als self-contained IIFE – ein Script-Tag genügt, kein Framework, kein Build-Step beim Kunden
- MicroQueue-System für Antwort-Batching: mehrere Fragen werden sequenziell abgearbeitet mit Queue-Anzeige
- Spracheingabe via Web Speech API mit Push-to-Talk-Button und Transkript-Übernahme ins Textfeld
- Suggest-System: KI-generierte Folgefragen nach jeder Antwort als klickbare Chips (core / related)
- BPMN-Bot-Modus: Chat + Camunda Modeler in einer Split-View, Export als .bpmn XML
- Disclaimer-Slider mit Opt-in-Pflicht – Senden-Button bleibt disabled bis Zustimmung erteilt
Sicherheit & Compliance
- sanitize-html für alle Nutzereingaben – XSS-Schutz auf Server- und Clientseite
- JWT-Authentifizierung für das Analytics-Portal mit Bearer-Token und DB-Verifikation
- Separater
/api/legal/-Pfad mit eigenem UI-Flag-System für rechtssensible Deployments
- GeoIP-Logging mit ISO2-Ländercode, Deutsch-Namen und Koordinaten für DSGVO-Auswertung
- Rate-Limiter pro Endpunkt mit express-rate-limit (konfigurierbar nach Mandant)
Bewiesene Kompetenzen
KI-Architektur & Produktentwicklung
- Konzeption und Umsetzung einer produktionsreifen RAG-Plattform ohne externe Vektor-Datenbank
- End-to-End-Verantwortung: Architektur, Entwicklung, Deployment, Betrieb und Weiterentwicklung
- SaaS-Produktmanagement mit Pricing-Strategie (4 Pläne), Feature-Gating und Self-Service-Onboarding
Full-Stack-Entwicklung
- Node.js Backend: Cluster, Cron, WebSocket, REST, MariaDB, JWT, bcrypt, Multer, Sharp
- Frontend: Vanilla JS IIFE, Web Speech API, SSE-Reader, MicroQueue, Suggest-UI, BPMN-Integration
- Integrationen: OpenAI API, Microsoft Graph, Stripe, PayPal, MaxMind, Nominatim, GeoNames