1. AI-Strategie & Prinzipien

AI ist kein Add-On, sondern das zentrale Nervensystem des Portals. Jede Interaktion wird durch AI angereichert, beschleunigt oder automatisiert.

PrinzipBeschreibung
Human-in-the-LoopAI unterstützt, der Mensch entscheidet bei kritischen Aktionen
TransparentAI-Entscheidungen sind nachvollziehbar und erklärbar
DatensouveränAlle Daten bleiben On-Premises, nur bereinigte Anfragen gehen an Claude API
LernendFeedback-Loops verbessern die AI kontinuierlich
SicherPII-Filterung vor jeder API-Anfrage, keine sensiblen Daten an externe Services
KontextbewusstAI kennt den Benutzer, seine Rolle und seinen Kontext

2. AI-Komponenten-Übersicht

AI Service Layer Architecture
  ┌─────────────────────────────────────────────────────────────────┐
  │                      AI SERVICE LAYER                            │
  │                                                                  │
  │  ┌─────────────────────────────────────────────────────────┐     │
  │  │                    AI GATEWAY                            │     │
  │  │  (Rate Limiting, Routing, Caching, Logging, Guardrails) │     │
  │  │  PII-Filter │ Prompt Sanitization │ Response Validation  │     │
  │  └────────────────────────┬────────────────────────────────┘     │
  │                           │                                      │
  │  ┌────────────┬───────────┼───────────┬────────────────┐        │
  │  │            │           │           │                │        │
  │  ▼            ▼           ▼           ▼                ▼        │
  │ ┌──────┐  ┌──────┐  ┌──────┐  ┌──────────┐  ┌──────────────┐  │
  │ │ Self │  │Agent │  │Auto  │  │Knowledge │  │ Predictive   │  │
  │ │ Help │  │Copi- │  │Triage│  │   AI     │  │ Analytics    │  │
  │ │ Chat │  │lot   │  │      │  │          │  │              │  │
  │ │ Bot  │  │      │  │      │  │          │  │              │  │
  │ └──┬───┘  └──┬───┘  └──┬───┘  └────┬─────┘  └──────┬───────┘  │
  │    │         │         │           │                │           │
  │    └─────────┴─────────┴───────────┴────────────────┘           │
  │                           │                                      │
  │              ┌────────────▼────────────────┐                     │
  │              │      SHARED AI SERVICES     │                     │
  │              │                              │                     │
  │              │  • RAG Engine               │                     │
  │              │  • Embedding Service        │                     │
  │              │  • NLP Pipeline             │                     │
  │              │  • Sentiment Analysis       │                     │
  │              │  • Entity Extraction        │                     │
  │              │  • Intent Classification    │                     │
  │              │  • Guardrails & Safety      │                     │
  │              └──────────────┬──────────────┘                     │
  │                              │                                   │
  │              ┌───────────────▼───────────────┐                   │
  │              │    EXTERNE LLM-ANBINDUNG      │                   │
  │              │                                │                   │
  │              │  Anthropic Claude API          │                   │
  │              │  (via HTTPS, PII-gefiltert)    │                   │
  │              │                                │                   │
  │              │  + Elasticsearch (On-Prem)     │                   │
  │              │    für Vector Search / RAG     │                   │
  │              └────────────────────────────────┘                   │
  └─────────────────────────────────────────────────────────────────┘

3. Self-Help Chatbot

Der Self-Help Chatbot ist der erste Kontaktpunkt für alle Mitarbeiter. Er ist über das Web-Portal und Microsoft Teams erreichbar.

Chatbot Conversation Flow
  Benutzer: "Mein VPN funktioniert nicht"
                  │
                  ▼
          ┌───────────────┐
          │ Intent Engine │──► Intent: vpn_problem
          └───────┬───────┘    Confidence: 0.94
                  │
                  ▼
          ┌───────────────┐
          │ Context       │──► User: Max Müller
          │ Enrichment    │    Abteilung: Fund Operations
          │               │    Letzte Tickets: VPN (vor 3 Mo.)
          │               │    Assets: Laptop HP-4521
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────┐
          │ RAG Search    │──► KB-Artikel: "VPN Troubleshooting"
          │ (Elasticsearch│    Lösung-Score: 0.87
          │  Vector)      │
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────┐
          │ Claude API    │──► "Hallo Max, ich helfe dir mit
          │ Response      │    deinem VPN-Problem. Lass uns
          │ Generation    │    zuerst folgendes prüfen:
          │               │    1. VPN-Client neu starten
          │               │    2. Netzwerkverbindung prüfen
          │               │    3. ..."
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────────────┐
          │ Follow-Up:            │
          │ "Hat das geholfen?"   │
          │                       │
          │ [Ja, danke!]          │──► Ticket vermieden ✓
          │ [Nein, weiter helfen] │──► Weitere Diagnose
          │ [Ticket erstellen]    │──► Ticket mit Kontext
          └───────────────────────┘

3.1 Chatbot-Features

FeatureBeschreibung
Multi-Turn ConversationsMehrstufige Dialoge mit Kontextverständnis
Guided TroubleshootingSchritt-für-Schritt Fehlerbehebung
Quick ActionsDirekte Aktionen: Passwort-Reset, Software-Install, Berechtigungen
Ticket CreationNahtloser Übergang zum Ticket (alle Infos übernommen)
Proaktive Vorschläge„Ich sehe, dass es aktuell VPN-Störungen gibt…“
MehrsprachigDeutsch, Englisch (weitere konfigurierbar)
Rich ResponsesBilder, Videos, Step-by-Step Anleitungen, Buttons
Feedback ButtonsDaumen hoch/runter für kontinuierliche Verbesserung
Eskalation„Ich verbinde dich mit einem IT-Mitarbeiter“
Öffnungszeiten-AwareUnterschiedliches Verhalten innerhalb/außerhalb Servicezeiten

3.2 Conversation Guardrails

GuardrailBeschreibung
Topic BoundaryBot antwortet nur auf IT-bezogene Fragen
Data Leakage PreventionKeine sensitiven Daten in Antworten
Hallucination DetectionConfidence-Threshold, bei Unsicherheit → Ticket
Prompt Injection ProtectionSchutz vor manipulativen Eingaben
PII HandlingAutomatische Maskierung persönlicher Daten vor API-Aufruf
Audit TrailAlle Konversationen werden lokal protokolliert
Content SafetyAnthropic Claude Built-in Safety + eigene Filter
portal.hafs.de/chat
HAFS Unternehmens-Assistent ● Online · Claude Sonnet · Zentrale Knowledge Base
Neuer Chat 🔔 JF
AI
Hallo Julia! Willkommen im HAFS Self-Help Portal. Ich bin Ihr zentraler Ansprechpartner für alle Unternehmensanliegen – von IT über HR bis Compliance.

Ich greife auf die zentrale HAFS Knowledge Base zu und kann Ihnen bei über 200 Themen direkt helfen. Was ich nicht sofort lösen kann, leite ich als Ticket automatisch an das richtige Team weiter.
💻 IT-Problem melden 🔒 Berechtigung anfordern 📋 Policy nachschlagen 🌴 Urlaub & Abwesenheit 💰 Reisekosten 🏢 Raumbuchung 📄 Ticket-Status prüfen
JF
Ich kann mich nicht mehr per VPN verbinden. Bekomme Fehler GP-TIMEOUT-443.
AI
Ich sehe, dass Sie ein VPN-Problem mit GlobalProtect haben. Lassen Sie mich ein paar Dinge prüfen:

🔬 Automatische Diagnose:
✓ Ihr Gerät: HAFS-NB-0342
✓ Letztes Windows-Update: KB5034441 (vor 2 Tagen)
Bekanntes Problem: Dieses Update kann VPN-Timeouts verursachen.

💡 Lösung: Ich kann ein Repair-Script auf Ihrem Gerät ausführen, das die MTU-Einstellungen korrigiert. Das dauert ca. 2 Minuten.
✅ Repair-Script starten 📄 KB-Artikel lesen 🎫 Ticket erstellen
JF
Ja bitte, Script starten.
AI
Repair-Script wird ausgeführt…
✓ MTU-Wert angepasst · ✓ Netzwerkadapter zurückgesetzt · ✓ VPN-Client neu gestartet

Bitte versuchen Sie jetzt die VPN-Verbindung erneut. Hat es funktioniert?
👍 Ja, funktioniert! 👎 Nein, immer noch Fehler
Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…
Unternehmensweiter Self-Help Chatbot – IT-Diagnose mit Auto-Resolve und Repair-Script-Ausführung
portal.hafs.de/chat
HAFS Unternehmens-Assistent ● Online · Zentrale Knowledge Base (1.247 Dokumente)
TM
TM
Wie ist die Regelung für Sonderurlaub bei Hochzeit?
AI
Gemäß der HAFS Urlaubsrichtlinie (POL-HR-004, Version 3.2) gilt für Sonderurlaub bei Hochzeit:

💍 Eigene Hochzeit: 2 Arbeitstage bezahlter Sonderurlaub
💍 Hochzeit von Kindern: 1 Arbeitstag
💍 Hochzeit von Geschwistern: 1 Arbeitstag

📄 Quelle: POL-HR-004 §4.2 Sonderurlaub · Gültig ab: 01.01.2025 · Nächste Review: 31.12.2026

Der Sonderurlaub muss mindestens 2 Wochen im Voraus beim Vorgesetzten beantragt werden. Die Heiratsurkunde ist nachzureichen.
📄 Policy öffnen 🌴 Sonderurlaub beantragen 💬 Weitere Fragen
TM
Und wie ist die Clean-Desk-Policy? Muss ich meinen Schreibtisch jeden Abend komplett leer räumen?
AI
Die HAFS Clean Desk & Clear Screen Policy (POL-SEC-012) schreibt Folgendes vor:

Bei Verlassen des Arbeitsplatzes (> 15 min):
✓ Bildschirm sperren (Win+L)
✓ Vertrauliche Dokumente in Schrank/Schublade
✓ Keine Passwörter/PINs sichtbar

Bei Feierabend:
✓ Alle Papierdokumente in abschließbaren Schrank
✓ Keine losen USB-Sticks/Datenträger
✓ Persönliche Gegenstände dürfen auf dem Tisch bleiben

🔒 Regulatorischer Hintergrund: BaFin MaRisk AT 7.2, ISO 27001 A.11.2.9 · 📄 POL-SEC-012 v2.1

💡 Zusammengefasst: Sie müssen nicht alles wegräumen – nur vertrauliche Unterlagen und Datenträger. Persönliche Gegenstände dürfen bleiben.
📄 Policy öffnen 🔒 Alle Security-Policies 📚 Sicherheitsschulung buchen
Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…
Zentrale Knowledge Base – Chatbot beantwortet Fragen zu Urlaubsrichtlinien, Sicherheitspolicies und Compliance-Vorgaben mit Quellenangaben
portal.hafs.de/chat
HAFS Unternehmens-Assistent ● Online · 6 Prozess-Module aktiv · Erweiterbar
SK
SK
Die Klimaanlage im Besprechungsraum 4.OG funktioniert nicht. Es sind 28 Grad und wir haben in 30 Minuten ein Kunden-Meeting.
AI
Ich verstehe – das ist dringend, besonders vor einem Kunden-Meeting. Lassen Sie mich das sofort in die Wege leiten.

🔬 Automatische Prüfung:
✓ Raum: Besprechungsraum „Frankfurt“, 4. OG
✓ Gebäudetechnik-Status: Klimaanlage offline seit 09:15
✓ Bekanntes Problem: Nein (kein offenes Ticket)

⚠ Da die Knowledge Base keine Self-Help-Lösung für Klimaanlagen bietet, erstelle ich direkt ein Ticket.
AI
✓ Ticket erstellt: HAFS-2026-00156

Kategorie:Facilities > Gebäudetechnik > Klimaanlage Priorität:P2 – High (Kunden-Meeting in 30 min) Zugewiesen an:Gruppe: Facility Management SLA Response:30 Minuten Standort:4. OG, Besprechungsraum „Frankfurt“
💌 Das Facility-Management-Team wurde per Push-Benachrichtigung und Teams-Nachricht informiert. Aufgrund der Dringlichkeit (Kunden-Meeting) wurde die Priorität automatisch auf P2 gesetzt.
📄 Ticket öffnen 🏢 Ausweichraum suchen 💬 Weitere Probleme melden
SK
Super, danke! Gibt es einen freien Besprechungsraum mit Klima als Backup?
AI
🏢 Verfügbare Räume (nächste 2 Stunden):

Besprechungsraum „München“ · 3. OG · 12 Plätze
Frei Klima ✓
Besprechungsraum „Berlin“ · 5. OG · 8 Plätze
Frei Klima ✓
✅ „München“ buchen ✅ „Berlin“ buchen
Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…
Prozessübergreifender Chatbot – Facilities-Anfrage mit automatischer Ticket-Erstellung, Gruppen-Assignment an Facility Management und Raumbuchungs-Integration. Das Portal ist modular erweiterbar für beliebige Unternehmensprozesse.
portal.hafs.de/chat
HAFS Unternehmens-Assistent ● Online · 8 Prozess-Module aktiv · Plug-in-Architektur
LB
LB
Ich möchte meinen Resturlaub vom letzten Jahr nehmen. Wie lange habe ich noch Zeit?
AI
Ich habe Ihre Urlaubsdaten geprüft, Lisa:

Resturlaub 2025:4 Tage Verfall gem. POL-HR-004:31. März 2026 Urlaubskonto 2026:30 Tage (28 genommen, 2 genehmigt)

⚠ Sie haben noch 49 Tage Zeit, den Resturlaub zu nehmen. Laut HAFS Urlaubsrichtlinie §3.4 verfällt Übertrag-Urlaub am 31.03. des Folgejahres. Eine Verlängerung ist nur mit Genehmigung der Geschäftsführung möglich.
🌴 Urlaub beantragen 📄 Urlaubsrichtlinie öffnen 💬 Verlängerung beantragen
LB
Noch eine Frage: Darf ich meinen privaten USB-Stick an den Firmenrechner anschließen?
AI
⛔ Nein – das ist nicht erlaubt.

HAFS IT-Sicherheitsrichtlinie (POL-SEC-001 §6.3):

Die Nutzung privater Wechseldatenträger (USB-Sticks, externe Festplatten, SD-Karten) an HAFS-Endgeräten ist untersagt.

Hintergrund:
🔒 Schutz vor Malware-Einschleusung
🔒 Verhinderung unkontrollierter Datenabflüsse
🔒 BaFin MaRisk AT 7.2 Anforderung

Alternative:
✓ Nutzen Sie das HAFS FileShare (SharePoint) für Dateitransfers
✓ Für Ausnahmen: Antrag über IT-Security mit Begründung

📄 POL-SEC-001 v4.0 · Freigabe: CISO · Letzte Review: 15.01.2026
📄 Security-Policy öffnen 🎫 Ausnahme beantragen 🔍 FileShare öffnen
LB
Ich brauche aber dringend Daten von einem externen Dienstleister per USB. Bitte Ausnahme beantragen.
AI
✓ Ticket erstellt: HAFS-2026-00158

Typ:Security Exception Request Kategorie:Security > Policy Exception > Wechselmedien Zugewiesen an:Gruppe: IT-Security Team Genehmiger:CISO (Dr. A. Winkler) Priorität:P3 – Medium
💌 Das IT-Security-Team und der CISO wurden benachrichtigt. Erwartete Bearbeitungszeit: 4 Stunden (gem. SLA).
📄 Ticket verfolgen 💬 Weiteres Anliegen
Fragen zu IT, HR, Security, Compliance, Facilities, Finance, Schulungen, Beschaffung…
Erweiterbare Plug-in-Architektur – HR-Urlaubsauskunft, Sicherheitsrichtlinien mit regulatorischem Kontext, und automatische Ticket-Erstellung mit Gruppen-Assignment an IT-Security. Neue Prozessmodule (Schulungen, Einkauf etc.) können jederzeit hinzugefügt werden.

4. Agent Copilot

Der Agent Copilot unterstützt IT-Support-Mitarbeiter direkt in ihrem Arbeitsablauf.

Agent Copilot Panel
  ┌─────────────────────────────────────────────────────────────┐
  │                   AGENT COPILOT PANEL                        │
  │                                                              │
  │  ┌───────────────────────────────────────────────────────┐   │
  │  │  Ticket: HAFS-2026-01234                              │   │
  │  │  "Exchange Postfach - kein Zugriff mehr"              │   │
  │  └───────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── AI Analyse (Claude) ─────────────────────────────┐    │
  │  │                                                       │   │
  │  │  Kategorie: Applications > M365 > Exchange            │   │
  │  │  Priorität: P2 (High) – Arbeitsfähigkeit betroffen    │   │
  │  │  Sentiment: Frustriert (Score: 0.72)                  │   │
  │  │  Betroffene: 1 (keine weiteren Meldungen)             │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Lösungsvorschlag ─────────────────────────────────┐    │
  │  │                                                       │   │
  │  │  Basierend auf 47 ähnlichen Tickets (89% Match):      │   │
  │  │                                                       │   │
  │  │  1. Exchange Online Connectivity prüfen               │   │
  │  │  2. Postfach-Berechtigung in Admin Center verifizieren│   │
  │  │  3. Outlook Profil neu einrichten                     │   │
  │  │                                                       │   │
  │  │  Geschätzte Lösungszeit: 15-30 min                    │   │
  │  │                                                       │   │
  │  │  [Lösung übernehmen] [Anpassen] [Andere Lösung]       │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Antwort-Draft ────────────────────────────────────┐    │
  │  │                                                       │   │
  │  │  "Hallo Herr Müller,                                  │   │
  │  │                                                       │   │
  │  │  vielen Dank für Ihre Meldung. Ich kümmere mich       │   │
  │  │  um Ihr Exchange-Postfach. Bitte versuchen Sie        │   │
  │  │  zunächst folgendes:                                  │   │
  │  │  ..."                                                 │   │
  │  │                                                       │   │
  │  │  [Senden] [Bearbeiten] [Neu generieren]               │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Kontext ──────────────────────────────────────────┐    │
  │  │  User: Max Müller | Fund Operations | Seit 2019       │   │
  │  │  Letzte 5 Tickets: 2x Exchange, 1x VPN, 2x Pwd       │   │
  │  │  Assets: HP EliteBook 840 | Windows 11 | Office365    │   │
  │  │  Relevante KB: KB-0234, KB-0567                       │   │
  │  └────────────────────────────────────────────────────────┘   │
  └─────────────────────────────────────────────────────────────┘

4.1 Copilot-Aktionen

AktionBeschreibungTrigger
Auto-ClassifyTicket automatisch klassifizierenBei Ticket-Eingang
Suggest SolutionLösungsvorschlag generierenBei Ticket-Öffnung
Draft ResponseAntwort-Entwurf erstellenAuf Knopfdruck
Summarize ThreadTicket-Verlauf zusammenfassenBei langen Threads
Find SimilarÄhnliche Tickets und Lösungen findenAuf Knopfdruck
Escalation AdviceEskalationsempfehlungBei SLA-Risiko
Knowledge SuggestKB-Artikel vorschlagen oder erstellenBei Ticket-Lösung
Impact AssessAuswirkungsanalyseBei P1/P2 Tickets
portal.hafs.de/agent/ticket/HAFS-2026-00139?copilot=true
HAFS-2026-00139 · Firewall-Regel Trading-App
P1 Critical ⚠ SLA BREACH – 00:12:33
Beschreibung: Trading-Applikation kann keine Verbindung zu Bloomberg-Feed aufbauen. Firewall blockiert Port 8294. Betrifft gesamten Trading-Floor – seit 08:30 kein Live-Daten-Feed.
Kommentare Timeline Verknüpft (2)
System 08:30
Ticket automatisch erstellt aus Monitoring-Alert: Bloomberg-Feed Connectivity Failure
AI-Triage 08:30
Klassifiziert als P1 · Security > Firewall · Confidence: 98% · Eskalation an Network-Security-Team ausgelöst
★ AI Copilot
⚠ Dringende Empfehlung
Firewall-Regel für Port 8294 wurde bei letztem Change (CHG-0045) versehentlich entfernt. Emergency-Rollback empfohlen.
● 92% Confidence · Basierend auf Change-Log
⚠ Emergency Change einleiten 📄 Antwort-Draft generieren 🙋 War Room eröffnen
IMPACT
👤 Betroffene User: ~25 (Trading)
💰 Business Impact: Kritisch
🕑 Ausfall seit: 47 min
Agent-Copilot Split-View: Ticket-Details links, AI-Empfehlungen rechts mit Emergency-Actions

5. Auto-Triage Engine

Klassifizierungs-Pipeline
  Eingehende Anfrage
         │
         ▼
  ┌──────────────────┐
  │ NLP Pre-Process  │
  │ • Tokenization   │
  │ • Language Detect │
  │ • PII Masking    │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Intent           │──► Primary Intent + Confidence
  │ Classification   │    z.B. "access_request" (0.92)
  │ (Claude Haiku)   │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Entity           │──► Entities: System("Exchange"),
  │ Extraction       │    Action("Zugriff"), User("Max Müller")
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Priority         │──► P2 (High)
  │ Scoring          │    Faktoren: Arbeitsfähigkeit betroffen,
  │                  │    keine Workaround erwähnt
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Category         │──► Applications > M365 > Exchange
  │ Mapping          │    Team: M365 Support
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Routing          │──► Zuweisung basierend auf:
  │ Decision         │    • Team-Kapazität
  │                  │    • Agent-Expertise
  │                  │    • Aktuelle Auslastung
  │                  │    • Schichtplan
  └──────────────────┘

5.1 Priority Scoring

Die Priorität wird durch einen Multi-Faktor-Score berechnet:

FaktorGewichtBeschreibung
Business Impact30%Wie viele Nutzer/Prozesse betroffen?
User Role15%C-Level, Manager, Standard?
Urgency Keywords20%„dringend“, „blockiert“, „kritisch“
System Criticality20%Wie geschäftskritisch ist das betroffene System?
Sentiment Score10%Wie frustriert/verärgert ist der Nutzer?
Historical Data5%Wiederkehrendes Problem? Bekannter Bug?
portal.hafs.de/admin/ai/triage-monitor
AI Auto-Triage Monitor — Live
● Active Letzte 24h: 127 Tickets klassifiziert
94.2%
Triage-Genauigkeit
+1.3%
1.2s
Avg. Triage-Zeit
34%
Auto-Resolved
+5%
127
Tickets (24h)
🔬 LIVE TRIAGE-STREAM
ZeitTicketInputAI-KategorieAI-PrioritätConfidenceAktion
11:42:03 HAFS-00143 „Kann nicht drucken“ Infra > Drucker P4
96%
Auto-Resolve
11:41:47 HAFS-00142 „VPN bricht ab“ Infra > Network P2
94%
Assign: Network
11:40:12 HAFS-00141 „Neuer MA Compliance“ Onboarding P3
91%
Workflow: JML
11:38:55 HAFS-00140 „SharePoint Zugriff“ IAM > Access P4
72%
Auto-Provision
Auto-Triage Monitor: Echtzeit-Klassifikation eingehender Tickets mit Confidence-Scores

6. RAG-Architektur (Retrieval-Augmented Generation)

6.1 Datenquellen

RAG Data Sources & Embedding Pipeline
  ┌─────────────────────────────────────────────────────────┐
  │                    RAG DATA SOURCES                      │
  │                                                          │
  │  ┌──────────┐  ┌──────────┐  ┌──────────────────────┐   │
  │  │ Knowledge│  │ Gelöste  │  │ SharePoint Docs      │   │
  │  │ Base     │  │ Tickets  │  │ (via Graph API)      │   │
  │  │ Artikel  │  │ (Top     │  │                      │   │
  │  │          │  │  Rated)  │  │                      │   │
  │  └────┬─────┘  └────┬─────┘  └──────────┬───────────┘   │
  │       │              │                    │               │
  │       └──────────────┼────────────────────┘               │
  │                      ▼                                    │
  │            ┌──────────────────┐                           │
  │            │ Embedding Engine │                           │
  │            │ (On-Prem oder    │                           │
  │            │  Claude Embed.)  │                           │
  │            └────────┬─────────┘                           │
  │                     ▼                                     │
  │            ┌──────────────────┐                           │
  │            │ Elasticsearch    │                           │
  │            │ (Vector +        │                           │
  │            │  Semantic Index) │                           │
  │            │ On-Premises      │                           │
  │            └──────────────────┘                           │
  └─────────────────────────────────────────────────────────┘

6.2 RAG Pipeline

Retrieval-Augmented Generation Pipeline
  User Query: "Outlook stürzt ab beim Öffnen von Anhängen"
         │
         ▼
  ┌──────────────────┐
  │ Query Processing │
  │ • Reformulation  │──► "Outlook crash open attachment"
  │ • Expansion      │    + "Outlook Absturz Anhang"
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Hybrid Search    │
  │ (Elasticsearch)  │
  │ • Vector Search  │──► Top-K relevante Dokumente
  │ • Keyword Search │    Reranking nach Relevanz
  │ • Semantic Search│
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Context Assembly │
  │ • Top 5 Results  │──► Zusammengestellter Kontext
  │ • User Context   │    mit Quellenangaben
  │ • System Prompt  │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ PII Filter       │
  │ • Persönliche    │──► Bereinigte Anfrage
  │   Daten entfernen│
  │ • Nur relevanter │
  │   Kontext        │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Anthropic Claude │
  │ API (Sonnet 4.5) │──► Strukturierte Antwort
  │                  │    mit Quellenverweis
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Output Guardrails│
  │ • Factuality     │──► Geprüfte, sichere Antwort
  │ • Safety Check   │
  │ • PII Filter     │
  └──────────────────┘
portal.hafs.de/knowledge/search?q=vpn+timeout+globalprotect
Knowledge Base — AI-Suche
+ Artikel erstellen
4 Ergebnisse in 0.3s · RAG-Suche über 1.247 Dokumente · Embedding-Model: text-embedding-3-large
KB-0234: VPN-Troubleshooting nach Windows Updates
Zuletzt aktualisiert: vor 3 Tagen · Autor: Network-Team
94%
RELEVANZ
GlobalProtect VPN-Verbindung bricht ab nach Windows Update. Lösung: MTU-Anpassung und Registry-Fix…
VPNGlobalProtectWindows UpdateMTU
KB-0189: GlobalProtect Client – Allgemeines Troubleshooting
Zuletzt aktualisiert: vor 2 Wochen · Autor: Network-Team
78%
RELEVANZ
Allgemeine Fehlerbehebung für GlobalProtect VPN-Client: Verbindungsprobleme, Authentifizierung, Timeout-Fehler…
VPNGlobalProtectTroubleshooting
KB-0156: Netzwerk-Konnektivität – Diagnose-Leitfaden
Zuletzt aktualisiert: vor 1 Monat
45%
RELEVANZ
RAG-basierte Knowledge-Base-Suche mit Relevanz-Scores und Keyword-Highlighting

7. Knowledge AI

7.1 Automatische Artikelgenerierung

Automatische Artikelgenerierung
  Ticket gelöst (CSAT ≥ 4/5)
         │
         ▼
  ┌──────────────────┐
  │ AI: Artikel-     │
  │ Kandidat?        │──► Kriterien:
  │ (Claude Haiku)   │    • Neues Thema (kein bestehender KB-Artikel)
  │                  │    • ≥ 3 ähnliche Tickets im letzten Monat
  │                  │    • Wiederverwendbare Lösung
  └──────┬───────────┘
         │ Ja
         ▼
  ┌──────────────────┐
  │ Draft Generation │
  │ (Claude Sonnet)  │──► AI generiert:
  │                  │    • Titel
  │                  │    • Symptom-Beschreibung
  │                  │    • Schritt-für-Schritt Lösung
  │                  │    • Kategorie/Tags
  │                  │    • Verknüpfte Tickets
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Review Queue     │──► IT-Experte reviewed und
  │                  │    genehmigt/korrigiert
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Publish          │──► Artikel live in Knowledge Base
  │                  │    Elasticsearch-Index aktualisiert
  └──────────────────┘

7.2 Artikel-Lifecycle

PhaseAI-Unterstützung
ErstellungAuto-Draft aus gelösten Tickets
OptimierungAI schlägt Verbesserungen vor basierend auf Nutzerfeedback
Veraltet-ErkennungAI erkennt wenn Artikel nicht mehr zutreffen
KonsolidierungAI erkennt Duplikate und schlägt Zusammenführung vor
ÜbersetzungAutomatische Übersetzung DE ↔ EN

8. Predictive Analytics

8.1 Vorhersagemodelle

ModellInputOutputNutzen
Incident PredictorMonitoring-Daten, PatternsWahrscheinliche IncidentsProaktive Prävention
Load PredictorHistorische TicketdatenErwartetes TicketvolumenKapazitätsplanung
SLA RiskTicket-Alter, KomplexitätSLA-Verletzungs-RisikoFrühzeitige Eskalation
User ChurnNutzungsverhaltenAdoptions-RisikoProaktive Kommunikation
Trend DetectionTicket-ClusterEmerging IssuesFrühwarnung

8.2 Proaktive Benachrichtigungen

Proaktive AI-Alerts
  ┌─────────────────────────────────────────────────────────┐
  │  PROAKTIVE AI-ALERTS                                     │
  │                                                          │
  │  "In den letzten 2 Stunden wurden 12 Tickets zum        │
  │   Thema 'Teams Audio-Probleme' erstellt. Möglicher      │
  │   Major Incident. Empfehlung: Incident eröffnen."       │
  │                                                          │
  │  "Nächste Woche werden voraussichtlich 15% mehr          │
  │   Tickets erwartet (Quarter-End). Empfehlung:            │
  │   Zusätzliche Kapazität einplanen."                      │
  │                                                          │
  │  "KB-Artikel 'VPN Setup' wurde 50x aufgerufen aber      │
  │   nur 30% bewerten ihn positiv. Review empfohlen."       │
  └─────────────────────────────────────────────────────────┘

9. Anthropic Claude – Modell-Einsatz

ModellEinsatzgebietKosten-Effizienz
Claude Sonnet 4.5Chatbot, Copilot, komplexe Analyse, RAG-AntwortenHoch (für komplexe Tasks)
Claude Haiku 4.5Klassifizierung, einfache Antworten, TriageSehr hoch (Batch-Tasks)
Embedding ModelRAG Embeddings, Similarity Search (On-Prem oder API)Standard

9.1 API-Anbindung & Datenschutz

Claude API Integration
  ┌─────────────────────────────────────────────────────────┐
  │              CLAUDE API INTEGRATION                      │
  │                                                          │
  │  On-Premises AI Gateway                                  │
  │  ┌─────────────────────────────────────────────────┐     │
  │  │                                                  │     │
  │  │  1. Anfrage von Portal-Service empfangen         │     │
  │  │  2. PII-Filter: Personendaten entfernen/masken   │     │
  │  │  3. Prompt Assembly: System-Prompt + Kontext      │     │
  │  │  4. Rate Limiting & Token Budget prüfen           │     │
  │  │  5. Request an Anthropic Claude API senden        │     │
  │  │     (HTTPS, via Proxy/Firewall)                   │     │
  │  │  6. Response empfangen & validieren               │     │
  │  │  7. Output Guardrails anwenden                    │     │
  │  │  8. Response cachen (Redis, wenn sinnvoll)        │     │
  │  │  9. Audit-Log schreiben (lokal)                   │     │
  │  │                                                  │     │
  │  └─────────────────────────────────────────────────┘     │
  │                                                          │
  │  Datenschutz-Garantien:                                  │
  │  • Keine personenbezogenen Daten an Claude API           │
  │  • Alle Logs verbleiben On-Premises                      │
  │  • API-Key in HashiCorp Vault gespeichert                │
  │  • Verschlüsselte Verbindung (TLS 1.3)                   │
  │  • Anthropic speichert keine Anfragen (API ToS)          │
  └─────────────────────────────────────────────────────────┘

9.2 Cost Management

MaßnahmeBeschreibung
Prompt CachingWiederverwendung häufiger System-Prompts (Anthropic Prompt Caching)
Response CachingCache für identische/ähnliche Anfragen (Redis On-Prem)
Model RoutingEinfache Anfragen → Haiku 4.5, Komplexe → Sonnet 4.5
Token BudgetsMaximale Token-Budgets pro Anfrage und pro Monat
Batch ProcessingNicht-zeitkritische AI-Tasks im Batch (Anthropic Batch API)
Local ProcessingEinfache NLP-Tasks (Sentiment, Entity Extraction) lokal ohne API

10. AI Governance & Ethics

AspektMaßnahme
Bias DetectionRegelmäßige Prüfung auf Verzerrungen in AI-Entscheidungen
ExplainabilityJede AI-Entscheidung kann begründet werden
Human OverrideJede AI-Aktion kann von Menschen übersteuert werden
Data PrivacyPII-Filterung vor jeder API-Anfrage, keine personenbezogenen Daten im AI-Training
MonitoringContinuous Monitoring von AI-Qualität und -Fairness (Prometheus-Metriken)
Feedback LoopNutzerfeedback fließt in Prompt-Optimierung und RAG-Verbesserung ein
Audit TrailAlle AI-Entscheidungen sind nachvollziehbar protokolliert (On-Prem)
Responsible AIEinhaltung der Anthropic Usage Policies und interner AI-Richtlinien