x25lab.com
Profil Login
  • x25lab.com
  • Home
  • Blog Wissen
  • Experte buchen DACH-Region
    • Business Analyse – Business Analyst Belastbare Entscheide: Prozesse, Anforderungen, Nutzen
    • GenAI – Agentic KI Solutions Architect Use-Case-Analyse, Architektur und Rollout – messbarer Nutzen
    • Projektleitung – Project Management Klassisch geführt: Setup, Turnaround, Reporting
  • Experte buchen DACH-Region
    • Business Analyse – Business Analyst
    • GenAI – Agentic KI Solutions Architect
    • Projektleitung – Project Management
  • Success Stories Referenzen
      Management Consulting Mayr – GenAI Solutions Architect GenAI & SaaS Betriebsmodelle · 2025 – aktuell

    • Ironforge Consulting – Senior Project Manager ICT-Beratung, Kanton Zürich · CH · 2024–2025
    • adesso Schweiz – Expert Consultant IT-Consulting, eCommerce Turnaround · Zürich · 2022–2023
    • Advellence Solutions – Senior Consultant PIM/MDM SAP / Microsoft Partner, Syndigo MDM · CH · 2022
    • Lobster PRO – Principal Project Manager IT-Integration, >2 Mio. € Projektvolumen · CH & DE · 2019–2021
    • evia consulting – Senior Consultant & techn. PL Audi SAFe / DevOps · DE · 2018–2019
    • Interone – Senior Technical Project Manager BMW.digital & BMW.retail, Jira/Confluence · DE · 2017–2018
    • Namics – Application Engineer DevOps eCommerce & PIM, Enterprise-Kunden · CH · 2014–2015
    • ITSDONE – Service Delivery Manager Service Management & IT-Koordination · AT · 2013
    • Forever Living Products – Head of IT Department IT-Leitung D-A-CH, Infrastruktur & Projekte · DE · 2009–2013
  • Success Stories Referenzen
    • Management Consulting Mayr · GenAI & SaaS Betriebsmodelle · 2025 – aktuell
    • Ironforge Consulting – Senior Project Manager ICT-Beratung, Kanton Zürich · CH · 2024–2025
    • adesso Schweiz – Expert Consultant IT-Consulting, eCommerce Turnaround · Zürich · 2022–2023
    • Advellence Solutions – Senior Consultant PIM/MDM SAP / Microsoft Partner, Syndigo MDM · CH · 2022
    • Lobster PRO – Principal Project Manager IT-Integration, >2 Mio. € Projektvolumen · CH & DE · 2019–2021
    • evia consulting – Senior Consultant & techn. PL Audi SAFe / DevOps · DE · 2018–2019
    • Interone – Senior Technical Project Manager BMW.digital & BMW.retail · DE · 2017–2018
    • Namics – Application Engineer DevOps eCommerce & PIM · CH · 2014–2015
    • ITSDONE – Service Delivery Manager Service Management · AT · 2013
    • Forever Living Products – Head of IT Department IT-Leitung D-A-CH · DE · 2009–2013
  • Tools Online
    • Assessment – Plattform-Transition
    • Gantt Chart – Projektplan auf einen Blick
    • Karriere – Job Matching Analyse
    • Radar – Quality Management (EFQM)
  • Tools Online
    • Assessment – Plattform-Transition
    • Gantt Chart – Projektplan auf einen Blick
    • Karriere – Job Matching
    • Radar – Quality Management
  • Webinare Remote
  • Zertifizierungen Zertifikate
  • Home
  • /
  • Success Stories

Success Story – GenAI & SaaS Betriebsmodelle

Roman Mayr · KI-Architekt & Entwickler · 2025 – aktuell
Management Consulting Mayr x25lab.com · Wil SG, Schweiz 2025 – aktuell
Multi-Tenant
Mandantenfähige SaaS-Chatbot-Plattform – ein Server, beliebig viele Kunden-Domains via tenant-basiertem Routing
RAG + LLM
Retrieval-Augmented Generation mit OpenAI GPT-4o-mini, Fuse.js Fuzzy-Search und Live-Streaming der Antworten
SaaS-Modelle
Basic / Plus / Pro / Ultimate – Analytics-Dashboard mit 8 Chart-Typen, GeoIP-Heatmap und Themen-Forecast

Kontext

Produkt & Eigenentwicklung

Im Rahmen von Management Consulting Mayr und x25lab.com konzipiert und entwickelt Roman Mayr eine vollständig eigenständige, mandantenfähige KI-Chatbot-Plattform. Die Plattform wird als SaaS-Produkt für Unternehmenskunden betrieben und ermöglicht es, domänenspezifische KI-Assistenten auf jeder beliebigen Website einzubinden – ohne Datenweitergabe an Drittplattformen.

Die technische Basis bildet ein Node.js/Express-Backend mit Cluster-Betrieb, MariaDB-Persistenz, OpenAI-Integration und einem vollständig selbst entwickelten RAG-System (Retrieval-Augmented Generation). Ergänzt wird die Plattform durch einen eigenen Analytics-Server mit JWT-gesicherten SaaS-Dashboards sowie ein separates BPMN-Bot-Modul für Prozessmodellierung.

Node.js / Express OpenAI GPT-5 RAG & LLM WebSocket Multi-Tenant SaaS MariaDB JWT Auth GeoIP / MaxMind Stripe / PayPal Microsoft Graph API BPMN / Camunda Cluster tiktoken

Verlauf

Phase 1 – Chatbot-Core & RAG
Mandantenfähiger KI-Chatbot mit RAG-System
Aufbau der Kernarchitektur: Express-Server mit Node.js Cluster-Betrieb (automatisches CPU-Balancing), tenant-basiertes Routing über data-tenant-Attribut im Script-Tag. RAG-System mit automatischem Sitemap-Crawler, Dokument-Chunking, Fuse.js Fuzzy-Search und deutschen Sprachvarianten (Umlaute, Stämme, PMI-basierte Compound-Analyse). OpenAI GPT-4o-mini Integration mit Retry-Logik und API-Key-Rotation (automatischer Failover bei 401/429). Coverage-Scoring der Antworten über Quellen-Matching.
Phase 2 – Frontend & UX
Streaming-Interface, Voice & Fullscreen
Frontend-Chatbot (chatbot.js) als selbst-initialisierende IIFE mit eigenem MicroQueue-System für Antwort-Batching. Live-Streaming der GPT-Antworten mit visuellem Token-by-Token-Rendering. Warteschlangen-Anzeige bei mehreren gleichzeitigen Fragen. Spracheingabe via Web Speech API (Mikrofon-Button). Vollbild-Modus für Desktop. Suggest-Buttons (KI-generierte Folgefragen nach jeder Antwort). Coverage-Badge mit Quellen-Transparenz. BPMN-Bot-Modus für Prozessmodellierung via Camunda.
Phase 3 – Backend-Infrastruktur
GeoIP, E-Mail-Digest & Cron-Automatisierung
GeoIP-Enrichment via MaxMind GeoLite2 + geoip-lite mit automatischem Nominatim-Fallback für länderbezogene Nutzungsstatistiken. Digest-Queue-System für gebündelte E-Mail-Benachrichtigungen an Mandanten (konfigurierbare Intervalle, vollständiger Chatverlauf in HTML-Tabelle). Mailversand via Microsoft Graph API (OAuth 2.0, MSAL). Cron-Jobs für nächtlichen OpenAI-Cache-Cleanup (30-Tage-TTL), stündliche Index-Synchronisation und Weekly Heavy Crawl. Rate-Limiting pro Endpunkt.
Phase 4 – SaaS-Analytics-Dashboard
4 Pläne, 8 Chart-Typen, JWT-Portal
Separater Analytics-Server (server-charts.js) mit JWT-gesichertem Nutzerportal. Vier Abo-Stufen: Basic (Basis-Statistik), Plus (Top-Themen + Pipeline), Pro (GeoIP-Heatmap, Trendverlauf, Themen-Historie), Ultimate (alle Charts + Custom Reports + Themen-Forecast). Stripe und PayPal Zahlungsintegration. 8 Chart-Typen inkl. interaktiver Geo-Map, Prompt-Pipeline-Analyse, Themen-Trendverlauf und konfigurierbarer Custom Reports.
Phase 5 – Legal & Compliance
Rechtlicher Chatbot & Datenschutz-Modus
Separater API-Pfad /api/legal/ für rechtlich sensible Chatbot-Deployments (Anwaltskanzleien, Behörden) mit eigenem UI-Flag-System, Disclaimer-Slider und Datenschutzerklärung-Integration. Opt-in-Pflicht vor jeder Anfrage. Separate Kontakt-Mail-Route mit mandantenspezifischer Empfängerkonfiguration. sanitize-html für alle Nutzereingaben. Linkify-Endpunkt für sichere URL-Einbettung in Chatbot-Antworten.

Kernergebnisse

RAG-Engine mit deutschsprachiger Fuzzy-Suche

Vollständig eigenentwickeltes Retrieval-Augmented Generation System ohne externe Vektor-Datenbank. Sitemap-Crawler indexiert automatisch alle HTML-Seiten und Dokumente (PDF, DOCX, XLSX, PPTX, CSV) eines Mandanten.

  • Fuse.js Fuzzy-Search mit Umlaut-Varianten (ae/ä, ss/ß), Stemming und PMI-basierter Compound-Analyse
  • Kontext-Suchquery aus Chat-Verlauf: kurze oder referenzielle Folgefragen werden automatisch angereichert
  • Coverage-Score je Antwort mit transparenter Quellenangabe für den Nutzer
  • Automatische Cron-Indexierung – kein manuelles Deployment nötig

Multi-Tenant SaaS-Architektur

Ein einziger Server bedient beliebig viele Kunden-Domains. Mandanten-Identifikation über data-tenant-Attribut im eingebetteten Script-Tag – keine Code-Änderung beim Kunden nötig.

  • Pro Mandant: eigene Kontaktkonfiguration, Assistenten-Label, E-Mail-Empfänger und Dateiverzeichnis
  • Vollständige Isolation der RAG-Indizes je Mandant
  • Stündliche Silent-Sync-Cron-Jobs pro Mandant (shuffled, fehlertolerante Ausführung)
  • Mandanten-spezifische Digest-E-Mails mit vollständigem Chatverlauf in HTML

OpenAI Streaming & API-Key-Management

Token-by-Token Streaming via Server-Sent Events (SSE) für sofortige Antwort-Darstellung. Eigenes API-Key-Rotation-System mit automatischem Failover bei erschöpften oder gesperrten Keys.

  • tiktoken-basierte Token-Zählung (o200k_base / cl100k_base) für präzise Cost-Kontrolle
  • Rotation nach last_used / usage_count – Round-Robin mit DB-Persistenz
  • Automatische Key-Deaktivierung bei 401-Response, reaktivierbar über Admin-Endpoint
  • 30-Tage-Cache für OpenAI-Antworten in MariaDB (nächtliche Bereinigung per Cron)

Analytics-Dashboard mit GeoIP & SaaS-Plänen

Separater Analytics-Server mit JWT-gesichertem Nutzerportal. Vier Abo-Stufen mit plangrenzbezogenem Chart-Zugang. Vollständige Nutzungsstatistiken inklusive geografischer Heatmap.

  • Free: Basis-Statistik | Plus: Top-Themen + Pipeline-Monatsvergleich
  • Pro: GeoIP-Karte, Geo-Ranking, Trendverlauf, Prompts-Historie | Ultimate: + Forecast & Custom Reports
  • MaxMind GeoLite2 + geoip-lite Dual-Stack mit Nominatim-Fallback für Ländernamen auf Deutsch
  • Stripe + PayPal Zahlungsintegration für Self-Service-Upgrades

Technische Highlights

Backend-Architektur

  • Node.js Cluster-Betrieb: Worker 1 übernimmt alle Cron-Jobs (Silent Sync, Heavy Crawl, Cache-Cleanup)
  • Express mit Rate-Limiting, CORS, Compression, Session, JWT und bcrypt-Passwort-Hashing
  • MariaDB Connection Pool mit supportBigNumbers, dateStrings und konfigurierbarem Connection Limit
  • Multer File-Upload für Indexierung: PDF, DOCX, XLSX, PPTX, CSV, RTF, ODF, TXT
  • WebSocket-Server (ws) parallel zum HTTP-Server für Echtzeit-Chatbot-Verbindungen
  • Microsoft Graph API (MSAL OAuth 2.0) für Mailversand – kein SMTP, kein Drittanbieter

Frontend & UX-Engineering

  • Chatbot als self-contained IIFE – ein Script-Tag genügt, kein Framework, kein Build-Step beim Kunden
  • MicroQueue-System für Antwort-Batching: mehrere Fragen werden sequenziell abgearbeitet mit Queue-Anzeige
  • Spracheingabe via Web Speech API mit Push-to-Talk-Button und Transkript-Übernahme ins Textfeld
  • Suggest-System: KI-generierte Folgefragen nach jeder Antwort als klickbare Chips (core / related)
  • BPMN-Bot-Modus: Chat + Camunda Modeler in einer Split-View, Export als .bpmn XML
  • Disclaimer-Slider mit Opt-in-Pflicht – Senden-Button bleibt disabled bis Zustimmung erteilt

Sicherheit & Compliance

  • sanitize-html für alle Nutzereingaben – XSS-Schutz auf Server- und Clientseite
  • JWT-Authentifizierung für das Analytics-Portal mit Bearer-Token und DB-Verifikation
  • Separater /api/legal/-Pfad mit eigenem UI-Flag-System für rechtssensible Deployments
  • GeoIP-Logging mit ISO2-Ländercode, Deutsch-Namen und Koordinaten für DSGVO-Auswertung
  • Rate-Limiter pro Endpunkt mit express-rate-limit (konfigurierbar nach Mandant)

Bewiesene Kompetenzen

KI-Architektur & Produktentwicklung

  • Konzeption und Umsetzung einer produktionsreifen RAG-Plattform ohne externe Vektor-Datenbank
  • End-to-End-Verantwortung: Architektur, Entwicklung, Deployment, Betrieb und Weiterentwicklung
  • SaaS-Produktmanagement mit Pricing-Strategie (4 Pläne), Feature-Gating und Self-Service-Onboarding

Full-Stack-Entwicklung

  • Node.js Backend: Cluster, Cron, WebSocket, REST, MariaDB, JWT, bcrypt, Multer, Sharp
  • Frontend: Vanilla JS IIFE, Web Speech API, SSE-Reader, MicroQueue, Suggest-UI, BPMN-Integration
  • Integrationen: OpenAI API, Microsoft Graph, Stripe, PayPal, MaxMind, Nominatim, GeoNames
Kontakt
Roman Mayr
Name Roman Mayr
Telefon +41 71 554 72 93
E-Mail roman@x25lab.com
Standort Wil SG, Schweiz
Projekt-Details
Von2025
Bisaktuell
RolleKI-Architekt & Entwickler
TypSaaS-Eigenentwicklung
StackNode.js, OpenAI, MariaDB
MandantenMulti-Tenant (skalierbar)
StandortWil SG CH (remote)
Tech-Stack
AIOpenAI GPT-4o-mini, tiktoken
SearchFuse.js, RAG, Chunking
BackendNode.js, Express, Cluster
DBMariaDB, memory-cache
AuthJWT, bcrypt, MSAL OAuth
MailMicrosoft Graph API
GeoMaxMind GeoLite2, geoip-lite
PaymentStripe, PayPal
ProcessBPMN / Camunda Modeler
Zertifizierungen
AI Automation Explorer Artificial Intelligence Fundamentals (IBM) Make Basics Make Foundation Make Advanced Datenschutz (DS-GVO) Datenschutz Kommunalverwaltung (DS-GVO-KV) HERMES Foundation Projektleiter IHK Führungskraft IHK ICO ISMS 27001:2013 Foundation ISO 22301 BCM Systems Fundamentals ISO 22301 BCM Internal Auditor ISO 22301 BCM Lead Auditor ISO 22301 BCM Lead Implementor ISO 22301 BCM Risk Manager ISO 9001 QMS Associate ISO 9001 QMS Internal Auditor ISO 9001 QMS Quality Manager ISO 9001 QMS Lead Auditor ISO 9001 QMS Lead Implementor Microsoft SC-900 Microsoft PL-900 Microsoft DP-900 Microsoft AZ-900 Microsoft AI-900 PMP® PMI-ACP® PMI-PBA® SAFe Agilist 6.0 PSM I PSM II PSPO I PSPO II PAL I PAL-EBM PSPBM PSD I Professional Scrum Facilitation Skills PSK I PSU I SPS Change Management ICPM Certified Supervisor APGM™
KI-Chatbot – Ihr digitaler Assistent
Bitte aktivieren
Mit der Nutzung und Verarbeitung des Chatbots stimmen Sie der Datenschutzerklärung Chatbot (ChatGPT OpenAI) vollständig zu.
BPMN Bot – Prozess-Assistent
Beispiel-Prompt
Bitte aktivieren

Login

Passwort vergessen?
Noch kein Konto? Registrieren

Passwort vergessen

Zurück zum Login

Neues Passwort setzen

Registrieren

Zurück zum Login

Aktivierung erfolgreich!

Ihr Konto wurde aktiviert. Sie können sich jetzt anmelden.

Konto bereits aktiviert

Ihr Konto ist bereits aktiviert.

Aktivierung fehlgeschlagen

Ungültiger oder fehlender Aktivierungstoken.

Unternehmen

  • Management Consulting Mayr
  • Waldaustrasse 2
  • 9500 Wil SG
  • Schweiz
  • +41 71 554 72 93
  • info@x25lab.com
  • UID (MWST): CHE-367.978.722 MWST

Rechtliches

  • Cookie Policy
  • Datenschutzerklärung
  • Datenschutzerklärung Chatbot
  • Impressum

Experte buchen

  • Business Analyse – Business Analyst
  • GenAI – Agentic KI Solutions Architect
  • Projektleitung – Project Management

Success Stories

  • Ironforge – Senior Project Manager
  • adesso Schweiz – Expert Consultant
  • Advellence – Senior Consultant
  • Lobster PRO – Principal Project Manager
  • evia – Senior Consultant
  • Interone – Senior Technical Project Manager
  • Namics – Application Engineer DevOps
  • ITSDONE – Service Delivery Manager
  • Forever Living Products – Head of IT Department

Tools

  • Assessment – Plattform-Transition
  • Gantt Chart – Projektplan auf einen Blick
  • Karriere – Job Matching Analyse
  • Radar Bewertung – Quality Management

Wissen

  • Blog
  • Webinare
  • Zertifizierungen

Wir verwenden technisch notwendige Cookies und optional eine datensparsame Nutzungsanalyse für exzellente Inhalte. Weitere Infos finden Sie in der Cookie-Richtlinie und in der Datenschutzerklärung.