05 – AI Services | HAFS Service Portal

Inhaltsverzeichnis

AI-Strategie & Prinzipien
AI-Komponenten-Übersicht
Self-Help Chatbot
Agent Copilot
Auto-Triage Engine
RAG-Architektur
Knowledge AI
Predictive Analytics
Anthropic Claude – Modell-Einsatz
AI Governance & Ethics

1. AI-Strategie & Prinzipien

AI ist kein Add-On, sondern das zentrale Nervensystem des Portals. Jede Interaktion wird durch AI angereichert, beschleunigt oder automatisiert.

Prinzip	Beschreibung
Human-in-the-Loop	AI unterstützt, der Mensch entscheidet bei kritischen Aktionen
Transparent	AI-Entscheidungen sind nachvollziehbar und erklärbar
Datensouverän	Alle Daten bleiben On-Premises, nur bereinigte Anfragen gehen an Claude API
Lernend	Feedback-Loops verbessern die AI kontinuierlich
Sicher	PII-Filterung vor jeder API-Anfrage, keine sensiblen Daten an externe Services
Kontextbewusst	AI kennt den Benutzer, seine Rolle und seinen Kontext

2. AI-Komponenten-Übersicht

AI Service Layer Architecture

  ┌─────────────────────────────────────────────────────────────────┐
  │                      AI SERVICE LAYER                            │
  │                                                                  │
  │  ┌─────────────────────────────────────────────────────────┐     │
  │  │                    AI GATEWAY                            │     │
  │  │  (Rate Limiting, Routing, Caching, Logging, Guardrails) │     │
  │  │  PII-Filter │ Prompt Sanitization │ Response Validation  │     │
  │  └────────────────────────┬────────────────────────────────┘     │
  │                           │                                      │
  │  ┌────────────┬───────────┼───────────┬────────────────┐        │
  │  │            │           │           │                │        │
  │  ▼            ▼           ▼           ▼                ▼        │
  │ ┌──────┐  ┌──────┐  ┌──────┐  ┌──────────┐  ┌──────────────┐  │
  │ │ Self │  │Agent │  │Auto  │  │Knowledge │  │ Predictive   │  │
  │ │ Help │  │Copi- │  │Triage│  │   AI     │  │ Analytics    │  │
  │ │ Chat │  │lot   │  │      │  │          │  │              │  │
  │ │ Bot  │  │      │  │      │  │          │  │              │  │
  │ └──┬───┘  └──┬───┘  └──┬───┘  └────┬─────┘  └──────┬───────┘  │
  │    │         │         │           │                │           │
  │    └─────────┴─────────┴───────────┴────────────────┘           │
  │                           │                                      │
  │              ┌────────────▼────────────────┐                     │
  │              │      SHARED AI SERVICES     │                     │
  │              │                              │                     │
  │              │  • RAG Engine               │                     │
  │              │  • Embedding Service        │                     │
  │              │  • NLP Pipeline             │                     │
  │              │  • Sentiment Analysis       │                     │
  │              │  • Entity Extraction        │                     │
  │              │  • Intent Classification    │                     │
  │              │  • Guardrails & Safety      │                     │
  │              └──────────────┬──────────────┘                     │
  │                              │                                   │
  │              ┌───────────────▼───────────────┐                   │
  │              │    EXTERNE LLM-ANBINDUNG      │                   │
  │              │                                │                   │
  │              │  Anthropic Claude API          │                   │
  │              │  (via HTTPS, PII-gefiltert)    │                   │
  │              │                                │                   │
  │              │  + Elasticsearch (On-Prem)     │                   │
  │              │    für Vector Search / RAG     │                   │
  │              └────────────────────────────────┘                   │
  └─────────────────────────────────────────────────────────────────┘

3. Self-Help Chatbot

Der Self-Help Chatbot ist der erste Kontaktpunkt für alle Mitarbeiter. Er ist über das Web-Portal und Microsoft Teams erreichbar.

Chatbot Conversation Flow

  Benutzer: "Mein VPN funktioniert nicht"
                  │
                  ▼
          ┌───────────────┐
          │ Intent Engine │──► Intent: vpn_problem
          └───────┬───────┘    Confidence: 0.94
                  │
                  ▼
          ┌───────────────┐
          │ Context       │──► User: Max Müller
          │ Enrichment    │    Abteilung: Fund Operations
          │               │    Letzte Tickets: VPN (vor 3 Mo.)
          │               │    Assets: Laptop HP-4521
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────┐
          │ RAG Search    │──► KB-Artikel: "VPN Troubleshooting"
          │ (Elasticsearch│    Lösung-Score: 0.87
          │  Vector)      │
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────┐
          │ Claude API    │──► "Hallo Max, ich helfe dir mit
          │ Response      │    deinem VPN-Problem. Lass uns
          │ Generation    │    zuerst folgendes prüfen:
          │               │    1. VPN-Client neu starten
          │               │    2. Netzwerkverbindung prüfen
          │               │    3. ..."
          └───────┬───────┘
                  │
                  ▼
          ┌───────────────────────┐
          │ Follow-Up:            │
          │ "Hat das geholfen?"   │
          │                       │
          │ [Ja, danke!]          │──► Ticket vermieden ✓
          │ [Nein, weiter helfen] │──► Weitere Diagnose
          │ [Ticket erstellen]    │──► Ticket mit Kontext
          └───────────────────────┘

3.1 Chatbot-Features

Feature	Beschreibung
Multi-Turn Conversations	Mehrstufige Dialoge mit Kontextverständnis
Guided Troubleshooting	Schritt-für-Schritt Fehlerbehebung
Quick Actions	Direkte Aktionen: Passwort-Reset, Software-Install, Berechtigungen
Ticket Creation	Nahtloser Übergang zum Ticket (alle Infos übernommen)
Proaktive Vorschläge	„Ich sehe, dass es aktuell VPN-Störungen gibt…“
Mehrsprachig	Deutsch, Englisch (weitere konfigurierbar)
Rich Responses	Bilder, Videos, Step-by-Step Anleitungen, Buttons
Feedback Buttons	Daumen hoch/runter für kontinuierliche Verbesserung
Eskalation	„Ich verbinde dich mit einem IT-Mitarbeiter“
Öffnungszeiten-Aware	Unterschiedliches Verhalten innerhalb/außerhalb Servicezeiten

3.2 Conversation Guardrails

Guardrail	Beschreibung
Topic Boundary	Bot antwortet nur auf IT-bezogene Fragen
Data Leakage Prevention	Keine sensitiven Daten in Antworten
Hallucination Detection	Confidence-Threshold, bei Unsicherheit → Ticket
Prompt Injection Protection	Schutz vor manipulativen Eingaben
PII Handling	Automatische Maskierung persönlicher Daten vor API-Aufruf
Audit Trail	Alle Konversationen werden lokal protokolliert
Content Safety	Anthropic Claude Built-in Safety + eigene Filter

portal.hafs.de/chat

Self-Service

💬 Chat-Assistent

☰ Meine Tickets

🔍 Knowledge Base

👤 Mein Profil

Themen

💻 IT & Technik

🔒 Security & Zugriff

💼 HR & Personal

📋 Policies & Compliance

🏢 Facilities & Office

💰 Finance & Travel

Letzte Chats

VPN-Problem · gestern

Urlaubsantrag · Mo.

Clean Desk Policy · Fr.

Hallo Julia! Willkommen im HAFS Self-Help Portal. Ich bin Ihr zentraler Ansprechpartner für alle Unternehmensanliegen – von IT über HR bis Compliance.

Ich greife auf die zentrale HAFS Knowledge Base zu und kann Ihnen bei über 200 Themen direkt helfen. Was ich nicht sofort lösen kann, leite ich als Ticket automatisch an das richtige Team weiter.

💻 IT-Problem melden 🔒 Berechtigung anfordern 📋 Policy nachschlagen 🌴 Urlaub & Abwesenheit 💰 Reisekosten 🏢 Raumbuchung 📄 Ticket-Status prüfen

Ich kann mich nicht mehr per VPN verbinden. Bekomme Fehler GP-TIMEOUT-443.

Ich sehe, dass Sie ein VPN-Problem mit GlobalProtect haben. Lassen Sie mich ein paar Dinge prüfen:

🔬 Automatische Diagnose:
✓ Ihr Gerät: HAFS-NB-0342
✓ Letztes Windows-Update: KB5034441 (vor 2 Tagen)
⚠ Bekanntes Problem: Dieses Update kann VPN-Timeouts verursachen.

💡 Lösung: Ich kann ein Repair-Script auf Ihrem Gerät ausführen, das die MTU-Einstellungen korrigiert. Das dauert ca. 2 Minuten.

✅ Repair-Script starten 📄 KB-Artikel lesen 🎫 Ticket erstellen

Ja bitte, Script starten.

⚙ Repair-Script wird ausgeführt…

✓ MTU-Wert angepasst · ✓ Netzwerkadapter zurückgesetzt · ✓ VPN-Client neu gestartet

Bitte versuchen Sie jetzt die VPN-Verbindung erneut. Hat es funktioniert?

👍 Ja, funktioniert! 👎 Nein, immer noch Fehler

Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…

➤

Unternehmensweiter Self-Help Chatbot – IT-Diagnose mit Auto-Resolve und Repair-Script-Ausführung

portal.hafs.de/chat

Wie ist die Regelung für Sonderurlaub bei Hochzeit?

Gemäß der HAFS Urlaubsrichtlinie (POL-HR-004, Version 3.2) gilt für Sonderurlaub bei Hochzeit:

💍 Eigene Hochzeit: 2 Arbeitstage bezahlter Sonderurlaub
💍 Hochzeit von Kindern: 1 Arbeitstag
💍 Hochzeit von Geschwistern: 1 Arbeitstag

📄 Quelle: POL-HR-004 §4.2 Sonderurlaub · Gültig ab: 01.01.2025 · Nächste Review: 31.12.2026

Der Sonderurlaub muss mindestens 2 Wochen im Voraus beim Vorgesetzten beantragt werden. Die Heiratsurkunde ist nachzureichen.

📄 Policy öffnen 🌴 Sonderurlaub beantragen 💬 Weitere Fragen

Und wie ist die Clean-Desk-Policy? Muss ich meinen Schreibtisch jeden Abend komplett leer räumen?

Die HAFS Clean Desk & Clear Screen Policy (POL-SEC-012) schreibt Folgendes vor:

Bei Verlassen des Arbeitsplatzes (> 15 min):
✓ Bildschirm sperren (Win+L)
✓ Vertrauliche Dokumente in Schrank/Schublade
✓ Keine Passwörter/PINs sichtbar

Bei Feierabend:
✓ Alle Papierdokumente in abschließbaren Schrank
✓ Keine losen USB-Sticks/Datenträger
✓ Persönliche Gegenstände dürfen auf dem Tisch bleiben

🔒 Regulatorischer Hintergrund: BaFin MaRisk AT 7.2, ISO 27001 A.11.2.9 · 📄 POL-SEC-012 v2.1

💡 Zusammengefasst: Sie müssen nicht alles wegräumen – nur vertrauliche Unterlagen und Datenträger. Persönliche Gegenstände dürfen bleiben.

📄 Policy öffnen 🔒 Alle Security-Policies 📚 Sicherheitsschulung buchen

Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…

➤

Zentrale Knowledge Base – Chatbot beantwortet Fragen zu Urlaubsrichtlinien, Sicherheitspolicies und Compliance-Vorgaben mit Quellenangaben

portal.hafs.de/chat

Die Klimaanlage im Besprechungsraum 4.OG funktioniert nicht. Es sind 28 Grad und wir haben in 30 Minuten ein Kunden-Meeting.

Ich verstehe – das ist dringend, besonders vor einem Kunden-Meeting. Lassen Sie mich das sofort in die Wege leiten.

🔬 Automatische Prüfung:
✓ Raum: Besprechungsraum „Frankfurt“, 4. OG
✓ Gebäudetechnik-Status: Klimaanlage offline seit 09:15
✓ Bekanntes Problem: Nein (kein offenes Ticket)

⚠ Da die Knowledge Base keine Self-Help-Lösung für Klimaanlagen bietet, erstelle ich direkt ein Ticket.

✓ Ticket erstellt: HAFS-2026-00156

Kategorie:Facilities > Gebäudetechnik > Klimaanlage Priorität:P2 – High (Kunden-Meeting in 30 min) Zugewiesen an:Gruppe: Facility Management SLA Response:30 Minuten Standort:4. OG, Besprechungsraum „Frankfurt“

💌 Das Facility-Management-Team wurde per Push-Benachrichtigung und Teams-Nachricht informiert. Aufgrund der Dringlichkeit (Kunden-Meeting) wurde die Priorität automatisch auf P2 gesetzt.

📄 Ticket öffnen 🏢 Ausweichraum suchen 💬 Weitere Probleme melden

Super, danke! Gibt es einen freien Besprechungsraum mit Klima als Backup?

🏢 Verfügbare Räume (nächste 2 Stunden):

Besprechungsraum „München“ · 3. OG · 12 Plätze

Frei Klima ✓

Besprechungsraum „Berlin“ · 5. OG · 8 Plätze

Frei Klima ✓

✅ „München“ buchen ✅ „Berlin“ buchen

Fragen Sie mich zu IT, HR, Policies, Compliance, Facilities…

➤

Prozessübergreifender Chatbot – Facilities-Anfrage mit automatischer Ticket-Erstellung, Gruppen-Assignment an Facility Management und Raumbuchungs-Integration. Das Portal ist modular erweiterbar für beliebige Unternehmensprozesse.

portal.hafs.de/chat

Self-Service

💬 Chat-Assistent

☰ Meine Tickets

🔍 Knowledge Base

Alle Prozess-Module

💻 IT & Technik

🔒 Security & Zugriff

💼 HR & Personal

📋 Policies & Compliance

🏢 Facilities & Office

💰 Finance & Travel

📚 Schulungen

📦 Einkauf & Beschaffung

⚙ Module konfigurieren…

Ich möchte meinen Resturlaub vom letzten Jahr nehmen. Wie lange habe ich noch Zeit?

Ich habe Ihre Urlaubsdaten geprüft, Lisa:

Resturlaub 2025:4 Tage Verfall gem. POL-HR-004:31. März 2026 Urlaubskonto 2026:30 Tage (28 genommen, 2 genehmigt)

⚠ Sie haben noch 49 Tage Zeit, den Resturlaub zu nehmen. Laut HAFS Urlaubsrichtlinie §3.4 verfällt Übertrag-Urlaub am 31.03. des Folgejahres. Eine Verlängerung ist nur mit Genehmigung der Geschäftsführung möglich.

🌴 Urlaub beantragen 📄 Urlaubsrichtlinie öffnen 💬 Verlängerung beantragen

Noch eine Frage: Darf ich meinen privaten USB-Stick an den Firmenrechner anschließen?

⛔ Nein – das ist nicht erlaubt.

HAFS IT-Sicherheitsrichtlinie (POL-SEC-001 §6.3):

Die Nutzung privater Wechseldatenträger (USB-Sticks, externe Festplatten, SD-Karten) an HAFS-Endgeräten ist untersagt.

Hintergrund:
🔒 Schutz vor Malware-Einschleusung
🔒 Verhinderung unkontrollierter Datenabflüsse
🔒 BaFin MaRisk AT 7.2 Anforderung

Alternative:
✓ Nutzen Sie das HAFS FileShare (SharePoint) für Dateitransfers
✓ Für Ausnahmen: Antrag über IT-Security mit Begründung

📄 POL-SEC-001 v4.0 · Freigabe: CISO · Letzte Review: 15.01.2026

📄 Security-Policy öffnen 🎫 Ausnahme beantragen 🔍 FileShare öffnen

Ich brauche aber dringend Daten von einem externen Dienstleister per USB. Bitte Ausnahme beantragen.

✓ Ticket erstellt: HAFS-2026-00158

Typ:Security Exception Request Kategorie:Security > Policy Exception > Wechselmedien Zugewiesen an:Gruppe: IT-Security Team Genehmiger:CISO (Dr. A. Winkler) Priorität:P3 – Medium

💌 Das IT-Security-Team und der CISO wurden benachrichtigt. Erwartete Bearbeitungszeit: 4 Stunden (gem. SLA).

📄 Ticket verfolgen 💬 Weiteres Anliegen

Fragen zu IT, HR, Security, Compliance, Facilities, Finance, Schulungen, Beschaffung…

➤

Erweiterbare Plug-in-Architektur – HR-Urlaubsauskunft, Sicherheitsrichtlinien mit regulatorischem Kontext, und automatische Ticket-Erstellung mit Gruppen-Assignment an IT-Security. Neue Prozessmodule (Schulungen, Einkauf etc.) können jederzeit hinzugefügt werden.

4. Agent Copilot

Der Agent Copilot unterstützt IT-Support-Mitarbeiter direkt in ihrem Arbeitsablauf.

Agent Copilot Panel

  ┌─────────────────────────────────────────────────────────────┐
  │                   AGENT COPILOT PANEL                        │
  │                                                              │
  │  ┌───────────────────────────────────────────────────────┐   │
  │  │  Ticket: HAFS-2026-01234                              │   │
  │  │  "Exchange Postfach - kein Zugriff mehr"              │   │
  │  └───────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── AI Analyse (Claude) ─────────────────────────────┐    │
  │  │                                                       │   │
  │  │  Kategorie: Applications > M365 > Exchange            │   │
  │  │  Priorität: P2 (High) – Arbeitsfähigkeit betroffen    │   │
  │  │  Sentiment: Frustriert (Score: 0.72)                  │   │
  │  │  Betroffene: 1 (keine weiteren Meldungen)             │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Lösungsvorschlag ─────────────────────────────────┐    │
  │  │                                                       │   │
  │  │  Basierend auf 47 ähnlichen Tickets (89% Match):      │   │
  │  │                                                       │   │
  │  │  1. Exchange Online Connectivity prüfen               │   │
  │  │  2. Postfach-Berechtigung in Admin Center verifizieren│   │
  │  │  3. Outlook Profil neu einrichten                     │   │
  │  │                                                       │   │
  │  │  Geschätzte Lösungszeit: 15-30 min                    │   │
  │  │                                                       │   │
  │  │  [Lösung übernehmen] [Anpassen] [Andere Lösung]       │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Antwort-Draft ────────────────────────────────────┐    │
  │  │                                                       │   │
  │  │  "Hallo Herr Müller,                                  │   │
  │  │                                                       │   │
  │  │  vielen Dank für Ihre Meldung. Ich kümmere mich       │   │
  │  │  um Ihr Exchange-Postfach. Bitte versuchen Sie        │   │
  │  │  zunächst folgendes:                                  │   │
  │  │  ..."                                                 │   │
  │  │                                                       │   │
  │  │  [Senden] [Bearbeiten] [Neu generieren]               │   │
  │  └────────────────────────────────────────────────────────┘   │
  │                                                              │
  │  ┌─── Kontext ──────────────────────────────────────────┐    │
  │  │  User: Max Müller | Fund Operations | Seit 2019       │   │
  │  │  Letzte 5 Tickets: 2x Exchange, 1x VPN, 2x Pwd       │   │
  │  │  Assets: HP EliteBook 840 | Windows 11 | Office365    │   │
  │  │  Relevante KB: KB-0234, KB-0567                       │   │
  │  └────────────────────────────────────────────────────────┘   │
  └─────────────────────────────────────────────────────────────┘

4.1 Copilot-Aktionen

Aktion	Beschreibung	Trigger
Auto-Classify	Ticket automatisch klassifizieren	Bei Ticket-Eingang
Suggest Solution	Lösungsvorschlag generieren	Bei Ticket-Öffnung
Draft Response	Antwort-Entwurf erstellen	Auf Knopfdruck
Summarize Thread	Ticket-Verlauf zusammenfassen	Bei langen Threads
Find Similar	Ähnliche Tickets und Lösungen finden	Auf Knopfdruck
Escalation Advice	Eskalationsempfehlung	Bei SLA-Risiko
Knowledge Suggest	KB-Artikel vorschlagen oder erstellen	Bei Ticket-Lösung
Impact Assess	Auswirkungsanalyse	Bei P1/P2 Tickets

portal.hafs.de/agent/ticket/HAFS-2026-00139?copilot=true

Beschreibung: Trading-Applikation kann keine Verbindung zu Bloomberg-Feed aufbauen. Firewall blockiert Port 8294. Betrifft gesamten Trading-Floor – seit 08:30 kein Live-Daten-Feed.

Kommentare Timeline Verknüpft (2)

System 08:30

Ticket automatisch erstellt aus Monitoring-Alert: Bloomberg-Feed Connectivity Failure

AI-Triage 08:30

Klassifiziert als P1 · Security > Firewall · Confidence: 98% · Eskalation an Network-Security-Team ausgelöst

★ AI Copilot

⚠ Dringende Empfehlung

Firewall-Regel für Port 8294 wurde bei letztem Change (CHG-0045) versehentlich entfernt. Emergency-Rollback empfohlen.

● 92% Confidence · Basierend auf Change-Log

⚠ Emergency Change einleiten 📄 Antwort-Draft generieren 🙋 War Room eröffnen

IMPACT

👤 Betroffene User: ~25 (Trading)

💰 Business Impact: Kritisch

🕑 Ausfall seit: 47 min

Agent-Copilot Split-View: Ticket-Details links, AI-Empfehlungen rechts mit Emergency-Actions

5. Auto-Triage Engine

Klassifizierungs-Pipeline

  Eingehende Anfrage
         │
         ▼
  ┌──────────────────┐
  │ NLP Pre-Process  │
  │ • Tokenization   │
  │ • Language Detect │
  │ • PII Masking    │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Intent           │──► Primary Intent + Confidence
  │ Classification   │    z.B. "access_request" (0.92)
  │ (Claude Haiku)   │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Entity           │──► Entities: System("Exchange"),
  │ Extraction       │    Action("Zugriff"), User("Max Müller")
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Priority         │──► P2 (High)
  │ Scoring          │    Faktoren: Arbeitsfähigkeit betroffen,
  │                  │    keine Workaround erwähnt
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Category         │──► Applications > M365 > Exchange
  │ Mapping          │    Team: M365 Support
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Routing          │──► Zuweisung basierend auf:
  │ Decision         │    • Team-Kapazität
  │                  │    • Agent-Expertise
  │                  │    • Aktuelle Auslastung
  │                  │    • Schichtplan
  └──────────────────┘

5.1 Priority Scoring

Die Priorität wird durch einen Multi-Faktor-Score berechnet:

Faktor	Gewicht	Beschreibung
Business Impact	30%	Wie viele Nutzer/Prozesse betroffen?
User Role	15%	C-Level, Manager, Standard?
Urgency Keywords	20%	„dringend“, „blockiert“, „kritisch“
System Criticality	20%	Wie geschäftskritisch ist das betroffene System?
Sentiment Score	10%	Wie frustriert/verärgert ist der Nutzer?
Historical Data	5%	Wiederkehrendes Problem? Bekannter Bug?

portal.hafs.de/admin/ai/triage-monitor

94.2%

Triage-Genauigkeit

+1.3%

1.2s

Avg. Triage-Zeit

34%

Auto-Resolved

+5%

127

Tickets (24h)

🔬 LIVE TRIAGE-STREAM

Zeit	Ticket	Input	AI-Kategorie	AI-Priorität	Confidence	Aktion
11:42:03	HAFS-00143	„Kann nicht drucken“	Infra > Drucker	P4	96%	Auto-Resolve
11:41:47	HAFS-00142	„VPN bricht ab“	Infra > Network	P2	94%	Assign: Network
11:40:12	HAFS-00141	„Neuer MA Compliance“	Onboarding	P3	91%	Workflow: JML
11:38:55	HAFS-00140	„SharePoint Zugriff“	IAM > Access	P4	72%	Auto-Provision

Auto-Triage Monitor: Echtzeit-Klassifikation eingehender Tickets mit Confidence-Scores

6. RAG-Architektur (Retrieval-Augmented Generation)

6.1 Datenquellen

RAG Data Sources & Embedding Pipeline

  ┌─────────────────────────────────────────────────────────┐
  │                    RAG DATA SOURCES                      │
  │                                                          │
  │  ┌──────────┐  ┌──────────┐  ┌──────────────────────┐   │
  │  │ Knowledge│  │ Gelöste  │  │ SharePoint Docs      │   │
  │  │ Base     │  │ Tickets  │  │ (via Graph API)      │   │
  │  │ Artikel  │  │ (Top     │  │                      │   │
  │  │          │  │  Rated)  │  │                      │   │
  │  └────┬─────┘  └────┬─────┘  └──────────┬───────────┘   │
  │       │              │                    │               │
  │       └──────────────┼────────────────────┘               │
  │                      ▼                                    │
  │            ┌──────────────────┐                           │
  │            │ Embedding Engine │                           │
  │            │ (On-Prem oder    │                           │
  │            │  Claude Embed.)  │                           │
  │            └────────┬─────────┘                           │
  │                     ▼                                     │
  │            ┌──────────────────┐                           │
  │            │ Elasticsearch    │                           │
  │            │ (Vector +        │                           │
  │            │  Semantic Index) │                           │
  │            │ On-Premises      │                           │
  │            └──────────────────┘                           │
  └─────────────────────────────────────────────────────────┘

6.2 RAG Pipeline

Retrieval-Augmented Generation Pipeline

  User Query: "Outlook stürzt ab beim Öffnen von Anhängen"
         │
         ▼
  ┌──────────────────┐
  │ Query Processing │
  │ • Reformulation  │──► "Outlook crash open attachment"
  │ • Expansion      │    + "Outlook Absturz Anhang"
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Hybrid Search    │
  │ (Elasticsearch)  │
  │ • Vector Search  │──► Top-K relevante Dokumente
  │ • Keyword Search │    Reranking nach Relevanz
  │ • Semantic Search│
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Context Assembly │
  │ • Top 5 Results  │──► Zusammengestellter Kontext
  │ • User Context   │    mit Quellenangaben
  │ • System Prompt  │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ PII Filter       │
  │ • Persönliche    │──► Bereinigte Anfrage
  │   Daten entfernen│
  │ • Nur relevanter │
  │   Kontext        │
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Anthropic Claude │
  │ API (Sonnet 4.5) │──► Strukturierte Antwort
  │                  │    mit Quellenverweis
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Output Guardrails│
  │ • Factuality     │──► Geprüfte, sichere Antwort
  │ • Safety Check   │
  │ • PII Filter     │
  └──────────────────┘

portal.hafs.de/knowledge/search?q=vpn+timeout+globalprotect

4 Ergebnisse in 0.3s · RAG-Suche über 1.247 Dokumente · Embedding-Model: text-embedding-3-large

KB-0234: VPN-Troubleshooting nach Windows Updates

Zuletzt aktualisiert: vor 3 Tagen · Autor: Network-Team

94%

RELEVANZ

GlobalProtect VPN-Verbindung bricht ab nach Windows Update. Lösung: MTU-Anpassung und Registry-Fix…

VPNGlobalProtectWindows UpdateMTU

KB-0189: GlobalProtect Client – Allgemeines Troubleshooting

Zuletzt aktualisiert: vor 2 Wochen · Autor: Network-Team

78%

RELEVANZ

Allgemeine Fehlerbehebung für GlobalProtect VPN-Client: Verbindungsprobleme, Authentifizierung, Timeout-Fehler…

VPNGlobalProtectTroubleshooting

KB-0156: Netzwerk-Konnektivität – Diagnose-Leitfaden

Zuletzt aktualisiert: vor 1 Monat

45%

RELEVANZ

RAG-basierte Knowledge-Base-Suche mit Relevanz-Scores und Keyword-Highlighting

7. Knowledge AI

7.1 Automatische Artikelgenerierung

Automatische Artikelgenerierung

  Ticket gelöst (CSAT ≥ 4/5)
         │
         ▼
  ┌──────────────────┐
  │ AI: Artikel-     │
  │ Kandidat?        │──► Kriterien:
  │ (Claude Haiku)   │    • Neues Thema (kein bestehender KB-Artikel)
  │                  │    • ≥ 3 ähnliche Tickets im letzten Monat
  │                  │    • Wiederverwendbare Lösung
  └──────┬───────────┘
         │ Ja
         ▼
  ┌──────────────────┐
  │ Draft Generation │
  │ (Claude Sonnet)  │──► AI generiert:
  │                  │    • Titel
  │                  │    • Symptom-Beschreibung
  │                  │    • Schritt-für-Schritt Lösung
  │                  │    • Kategorie/Tags
  │                  │    • Verknüpfte Tickets
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Review Queue     │──► IT-Experte reviewed und
  │                  │    genehmigt/korrigiert
  └──────┬───────────┘
         │
         ▼
  ┌──────────────────┐
  │ Publish          │──► Artikel live in Knowledge Base
  │                  │    Elasticsearch-Index aktualisiert
  └──────────────────┘

7.2 Artikel-Lifecycle

Phase	AI-Unterstützung
Erstellung	Auto-Draft aus gelösten Tickets
Optimierung	AI schlägt Verbesserungen vor basierend auf Nutzerfeedback
Veraltet-Erkennung	AI erkennt wenn Artikel nicht mehr zutreffen
Konsolidierung	AI erkennt Duplikate und schlägt Zusammenführung vor
Übersetzung	Automatische Übersetzung DE ↔ EN

8. Predictive Analytics

8.1 Vorhersagemodelle

Modell	Input	Output	Nutzen
Incident Predictor	Monitoring-Daten, Patterns	Wahrscheinliche Incidents	Proaktive Prävention
Load Predictor	Historische Ticketdaten	Erwartetes Ticketvolumen	Kapazitätsplanung
SLA Risk	Ticket-Alter, Komplexität	SLA-Verletzungs-Risiko	Frühzeitige Eskalation
User Churn	Nutzungsverhalten	Adoptions-Risiko	Proaktive Kommunikation
Trend Detection	Ticket-Cluster	Emerging Issues	Frühwarnung

8.2 Proaktive Benachrichtigungen

Proaktive AI-Alerts

  ┌─────────────────────────────────────────────────────────┐
  │  PROAKTIVE AI-ALERTS                                     │
  │                                                          │
  │  "In den letzten 2 Stunden wurden 12 Tickets zum        │
  │   Thema 'Teams Audio-Probleme' erstellt. Möglicher      │
  │   Major Incident. Empfehlung: Incident eröffnen."       │
  │                                                          │
  │  "Nächste Woche werden voraussichtlich 15% mehr          │
  │   Tickets erwartet (Quarter-End). Empfehlung:            │
  │   Zusätzliche Kapazität einplanen."                      │
  │                                                          │
  │  "KB-Artikel 'VPN Setup' wurde 50x aufgerufen aber      │
  │   nur 30% bewerten ihn positiv. Review empfohlen."       │
  └─────────────────────────────────────────────────────────┘

9. Anthropic Claude – Modell-Einsatz

Modell	Einsatzgebiet	Kosten-Effizienz
Claude Sonnet 4.5	Chatbot, Copilot, komplexe Analyse, RAG-Antworten	Hoch (für komplexe Tasks)
Claude Haiku 4.5	Klassifizierung, einfache Antworten, Triage	Sehr hoch (Batch-Tasks)
Embedding Model	RAG Embeddings, Similarity Search (On-Prem oder API)	Standard

9.1 API-Anbindung & Datenschutz

Claude API Integration

  ┌─────────────────────────────────────────────────────────┐
  │              CLAUDE API INTEGRATION                      │
  │                                                          │
  │  On-Premises AI Gateway                                  │
  │  ┌─────────────────────────────────────────────────┐     │
  │  │                                                  │     │
  │  │  1. Anfrage von Portal-Service empfangen         │     │
  │  │  2. PII-Filter: Personendaten entfernen/masken   │     │
  │  │  3. Prompt Assembly: System-Prompt + Kontext      │     │
  │  │  4. Rate Limiting & Token Budget prüfen           │     │
  │  │  5. Request an Anthropic Claude API senden        │     │
  │  │     (HTTPS, via Proxy/Firewall)                   │     │
  │  │  6. Response empfangen & validieren               │     │
  │  │  7. Output Guardrails anwenden                    │     │
  │  │  8. Response cachen (Redis, wenn sinnvoll)        │     │
  │  │  9. Audit-Log schreiben (lokal)                   │     │
  │  │                                                  │     │
  │  └─────────────────────────────────────────────────┘     │
  │                                                          │
  │  Datenschutz-Garantien:                                  │
  │  • Keine personenbezogenen Daten an Claude API           │
  │  • Alle Logs verbleiben On-Premises                      │
  │  • API-Key in HashiCorp Vault gespeichert                │
  │  • Verschlüsselte Verbindung (TLS 1.3)                   │
  │  • Anthropic speichert keine Anfragen (API ToS)          │
  └─────────────────────────────────────────────────────────┘

9.2 Cost Management

Maßnahme	Beschreibung
Prompt Caching	Wiederverwendung häufiger System-Prompts (Anthropic Prompt Caching)
Response Caching	Cache für identische/ähnliche Anfragen (Redis On-Prem)
Model Routing	Einfache Anfragen → Haiku 4.5, Komplexe → Sonnet 4.5
Token Budgets	Maximale Token-Budgets pro Anfrage und pro Monat
Batch Processing	Nicht-zeitkritische AI-Tasks im Batch (Anthropic Batch API)
Local Processing	Einfache NLP-Tasks (Sentiment, Entity Extraction) lokal ohne API

10. AI Governance & Ethics

Aspekt	Maßnahme
Bias Detection	Regelmäßige Prüfung auf Verzerrungen in AI-Entscheidungen
Explainability	Jede AI-Entscheidung kann begründet werden
Human Override	Jede AI-Aktion kann von Menschen übersteuert werden
Data Privacy	PII-Filterung vor jeder API-Anfrage, keine personenbezogenen Daten im AI-Training
Monitoring	Continuous Monitoring von AI-Qualität und -Fairness (Prometheus-Metriken)
Feedback Loop	Nutzerfeedback fließt in Prompt-Optimierung und RAG-Verbesserung ein
Audit Trail	Alle AI-Entscheidungen sind nachvollziehbar protokolliert (On-Prem)
Responsible AI	Einhaltung der Anthropic Usage Policies und interner AI-Richtlinien

← ZurückTicketsystem Weiter →Security & IAM/PAM