Während die Jahre 2023 und 2024 von einer Euphorie über die generativen ...
Das Jahr 2025 markiert einen fundamentalen Wendepunkt in der Unternehmens-IT. Während die Jahre 2023 und 2024 von einer Euphorie über die generativen Fähigkeiten von Künstlicher Intelligenz (KI) geprägt waren, stehen wir nun vor einer harten Realität, die wir bei Dreher Consulting als "Pilot Purgatory" (Pilot-Fegefeuer) bezeichnen.
Die Datenlage ist eindeutig: Obwohl 88 % der Unternehmen angeben, KI in mindestens einer Geschäftsfunktion einzusetzen, verharren fast zwei Drittel in der Experimentier- oder Pilotphase.1
Noch alarmierender ist die finanzielle Diskrepanz: Nur eine Minderheit der Unternehmen konnte bisher einen messbaren Einfluss auf das EBIT (Earnings Before Interest and Taxes) nachweisen.1 Der Grund hierfür liegt nicht in der technologischen Unreife, sondern in einem fundamentalen Missverständnis der ökonomischen Wirkungsmechanismen. Die erste Welle der KI-Adoption konzentrierte sich auf "Co-Piloten" – Werkzeuge, die den Menschen assistieren. Dies führte zu individuellen Produktivitätsgewinnen, senkte jedoch selten die strukturellen Kosten, da der Mensch "in the loop" blieb und die gewonnene Zeit oft durch neue Aufgaben absorbiert wurde (Parkinsonsches Gesetz).
Dieser Report dient als strategische Handlungsanleitung ("Blueprint"), um diesen Stillstand zu durchbrechen.
Wir analysieren den technologischen Paradigmenwechsel von Generativer KI (Content-Erstellung) hin zu Agentic AI (Autonome Ausführung). KI-Agenten, die in der Lage sind, komplexe Handlungsstränge selbstständig zu planen und auszuführen, bieten erstmals die Möglichkeit, die Grenzkosten von Transaktionen von der menschlichen Arbeitszeit zu entkoppeln.3

Basierend auf First-Principles-Denken und einer MECE-Analyse (Mutually Exclusive, Collectively Exhaustive) legen wir dar, wie Unternehmen den Sprung von isolierten Piloten zu profitablen, skalierbaren KI-Operationen schaffen.
Eine nüchterne Betrachtung der aktuellen Marktlandschaft offenbart eine signifikante Lücke zwischen Aktivität und Ergebnis. McKinsey-Daten zeigen, dass zwar die Nutzung von KI in den Unternehmen explodiert ist, die Skalierung jedoch stagniert. Nur etwa ein Drittel der Organisationen hat begonnen, KI-Lösungen unternehmensweit auszurollen.3 Die überwältigende Mehrheit der Projekte bleibt in Silos stecken – gefangen zwischen Proof-of-Concept (PoC) und Produktion.
Die Ursachen hierfür sind struktureller Natur:
Um das Kostensenkungspotenzial zu realisieren, müssen wir die Technologie präzise definieren. Wir befinden uns im Übergang von passiven Modellen zu aktiven Agenten.
Tabelle 1: Technologische Evolution und ökonomische Implikation
|
Merkmal |
Generative KI (GenAI) |
Agentic AI (Autonome Agenten) |
|
Kernfunktion |
Erstellung & Zusammenfassung |
Planung & Ausführung |
|
Auslöser |
Menschlicher Prompt ("Schreibe eine Mail") |
Systemereignis oder Zielsetzung ("Bearbeite alle Rechnungen") |
|
Kontext |
Sitzungsbasiert (kurzfristig) |
Persistenter Speicher & Zugriff auf Unternehmensdaten (RAG) |
|
Interaktion |
Chat-Interface |
API-Calls & Systemintegrationen |
|
Ökonomischer Hebel |
Persönliche Produktivität (Soft ROI) |
Arbeitssubstitution (Hard ROI) |
Agentic AI unterscheidet sich durch drei Kernkompetenzen: Wahrnehmung (Perception) von Daten aus Live-Systemen, Schlussfolgerung (Reasoning) zur Zerlegung komplexer Ziele in Teilaufgaben, und Handlung (Action) durch direkte Systemeingriffe.1 Erst durch diese Autonomie wird es möglich, den Menschen aus der kritischen Pfad der Transaktionsbearbeitung zu nehmen und so echte Kostensenkungen zu realisieren.
Um "Profit" zu generieren, müssen wir die Unit Economics (Stückkostenrechnung) der KI verstehen. Es handelt sich hierbei um eine Verschiebung von Fixkosten (Personal) zu variablen Kosten (Compute/Token), die jedoch bei Skalierung gegen Null tendieren.
In traditionellen Betriebsmodellen korreliert das Transaktionsvolumen linear mit den Arbeitskosten. Um doppelt so viele Kundenanfragen zu bearbeiten, benötigen Sie – ceteris paribus – doppelt so viel Personal. Agentic AI durchbricht diese Linearität. Nach der initialen Investition in Training und Integration skalieren die Kosten logarithmisch. Die Grenzkosten einer zusätzlichen Transaktion entsprechen lediglich den Inferenzkosten (Token) und den API-Gebühren.
Analysen zeigen, dass KI-Agenten die Kosten pro Transaktion im Vergleich zu Onshore-Arbeitskräften um 90-95 % und im Vergleich zu Offshore-Kräften um 50-70 % senken können.7

Ein entscheidendes Konzept für die Kommunikation mit dem CFO ist die "J-Kurve". KI-Projekte liefern selten sofortigen ROI.
Unternehmen, die Projekte während der Lernphase abbrechen, weil "es schneller geht, es selbst zu machen", realisieren nie den Profit. Sie zahlen die Rüstkosten, ohne die Ernte einzufahren.
Wir führen bei Dreher Consulting die Metrik LCOAI (Levelized Cost of AI) ein, analog zu den Stromgestehungskosten in der Energiewirtschaft. Sie berechnet die Gesamtkosten pro nützlichem Output über den Lebenszyklus des Systems.10
$$ LCOAI = \frac{\text{Entwicklungskosten} + \sum(\text{Inferenzkosten}) + \sum(\text{Wartungskosten})}{\text{Anzahl erfolgreich automatisierter Transaktionen}} $$
Diese Formel zwingt zur Ehrlichkeit: Ein Agent, der nur 500 Mal im Jahr genutzt wird, ist oft teurer als ein Mensch. Ein Agent, der 500.000 Transaktionen übernimmt, ist unschlagbar günstig. Volumen ist der Schlüssel zur Amortisation der Fixkosten.
Um Potenziale "MECE" (überschneidungsfrei und vollständig) zu erfassen, kategorisieren wir Anwendungsfälle nach zwei Dimensionen: Komplexität der Aufgabe und Volumen der Transaktionen.
Ziel: Direkte Kostensenkung (Labor Substitution)
Hier liegen die größten und am schnellsten realisierbaren Hebel ("Low Hanging Fruits"). Es handelt sich um regelbasierte, repetitive Aufgaben.
Customer Operations (Service & Support):
Anwendungsfall: Vollständige autonome Bearbeitung von Tier-1-Anfragen (Rücksendungen, Statusabfragen, Adressänderungen).
Evidenz: Klarna ersetzte die Arbeitsleistung von 700 Vollzeitäquivalenten (FTEs) durch einen KI-Agenten, der 2,3 Millionen Konversationen führte und die Gewinnprognose um 40 Millionen Dollar verbesserte.11
Mechanismus: Integration in CRM und ERP erlaubt dem Agenten nicht nur zu antworten, sondern die Transaktion (z.B. Rückerstattung) durchzuführen.
Anwendungsfall: Rechnungsabgleich (Invoice Matching). Agenten vergleichen eingehende Rechnungen mit Bestellungen (PO) und Wareneingangsbelegen. Bei Diskrepanzen kontaktieren sie autonom den Lieferanten.
Evidenz: Ein globales Medienunternehmen konsolidierte Daten aus 80 Hauptbüchern und identifizierte Millionen an "Shadow IT"-Ausgaben durch KI-Analysen.12
Ziel: Produktivitätssteigerung & Durchsatz
Hier wird der Mensch nicht ersetzt, sondern massiv beschleunigt ("Super-Powering").
Anwendungsfall: Generierung von Boilerplate-Code, Unit-Tests und Dokumentation.
Evidenz: Entwicklungszyklen können um 20–30 % verkürzt werden. Dies senkt nicht zwingend die Headcount-Kosten, erhöht aber den Output bei gleicher Kostenbasis (Vermeidung von Neueinstellungen).12
Risiko: "Lazy Reviews" durch Entwickler können zu Qualitätsverlust führen, wenn der generierte Code nicht kritisch geprüft wird.11
Anwendungsfall: Bearbeitung von Leistungsablehnungen (Denials). Agenten analysieren den Ablehnungsgrund, korrigieren die Codierung und reichen den Antrag neu ein.
Evidenz: Reduktion der Außenstandsdauer (A/R Days) um 35 Tage und Senkung der Ablehnungsquote um 7 %.13
Ziel: Strategischer Wettbewerbsvorteil
Anwendungsfall: Prädiktive Risikoanalyse. Agenten überwachen Tausende externer Signale (Wetter, Streiks, Geopolitik) und simulieren Auswirkungen auf die Lieferkette in Echtzeit.
Evidenz: Ermöglichung proaktiver Routenänderungen vor Eintritt der Störung, was teure Sonderfahrten und Produktionsstopps verhindert.14
Technologie allein generiert keinen Wert; sie benötigt ein operatives Einbettungssystem. Wir nennen dies die Architecture of Agency. Bain & Company betont zu Recht, dass die meisten Piloten nicht an der KI scheitern, sondern an der fehlenden Datenstrategie.5

Agenten benötigen Zugriff auf "Ground Truth". Ein Agent, der auf veralteten oder widersprüchlichen Daten trainiert wird, halluziniert nicht zufällig – er halluziniert systemisch.
Data Products: Behandeln Sie Datensätze (z.B. "Kundendaten", "Produktkatalog") als Produkte mit klaren SLAs (Service Level Agreements), Eigentümern und Qualitätsmetriken.15
Vectorization Pipeline: Um unstrukturierte Daten (PDF-Handbücher, E-Mail-Archive) nutzbar zu machen, müssen diese in Vektordatenbanken (RAG - Retrieval Augmented Generation) überführt werden. Dies ist das "Langzeitgedächtnis" des Agenten.
Autonomie erfordert Kontrolle. Ein Agent, der autonom buchen oder kommunizieren darf, stellt ein operatives Risiko dar.
Das 3-Schichten-Sicherheitsmodell:
Das Ziel ist nicht die 100%ige Automatisierung, sondern die optimale Automatisierung. Erfolgreiche Systeme leiten Transaktionen mit niedriger Konfidenz ("Low Confidence Score") automatisch an menschliche Experten weiter. Diese Korrekturen müssen zwingend in das System zurückfließen (Feedback Loop), um das Modell kontinuierlich zu verbessern.
Im Folgenden präsentieren wir den konkreten Fahrplan für die Transformation. Dieser Leitfaden ist phasenbasiert und deckt die kritischen Meilensteine ab.

Ziel: Identifikation der "Golden Use Cases", wo Datenverfügbarkeit auf ökonomische Relevanz trifft.
Kosten-Analyse (P&L-Scan): Beginnen Sie nicht mit Ideen, sondern mit der Gewinn- und Verlustrechnung. Wo sind die größten Blöcke an SG&A-Kosten (Selling, General & Administrative Expenses)? Identifizieren Sie Prozesse mit hohem manuellem Aufwand.
Atomare Prozess-Zerlegung: Brechen Sie diese Prozesse in kleinste Arbeitsschritte auf. Wenden Sie den "Autonomie-Test" an:
Ist der Input digital?
Sind die Entscheidungsregeln explizit?
Ist das Ergebnis messbar?
Daten-Audit: Prüfen Sie die Verfügbarkeit der notwendigen Daten via API. Ohne API keine Agenten-Skalierung.
Output: Eine priorisierte Liste von 3 Anwendungsfällen mit berechnetem ROI-Potenzial.
Ziel: Technischer Beweis und Aufbau der Governance.
Output: Ein funktionierender Agent im Schattenbetrieb mit einer Genauigkeit von >80%.
Ziel: Übergang von Überwachung zu Autonomie.
Output: Ein Agent im Live-Betrieb mit >50% Deflektionsrate. Erste Realisierung von Kosteneinsparungen.
Ziel: P&L-Wirksamkeit.
Um den Erfolg gegenüber Stakeholdern nachzuweisen, bedarf es eines robusten KPI-Dashboards. Weiche Faktoren wie "Mitarbeiterzufriedenheit" reichen nicht aus.
Tabelle 2: Das Agentic AI KPI-Framework
|
Kategorie |
KPI |
Beschreibung |
Zielwert (Benchmark) |
|
Finanzen |
Cost per Transaction |
Gesamtkosten (Tech + Mensch) geteilt durch Volumen. |
Reduktion um >50 % |
|
Finanzen |
LCOAI |
Levelized Cost of AI (siehe Kapitel 2.3). |
Muss < menschliche Kosten sein |
|
Operativ |
Deflection Rate |
Anteil der Fälle, die ohne menschliches Zutun gelöst werden. |
> 60 % (Top-Performer: >80 %) |
|
Qualität |
Resolution Accuracy |
Anteil korrekter Lösungen (keine Wiedereröffnung des Tickets). |
> 95 % |
|
Technik |
Hallucination Rate |
Häufigkeit faktisch falscher Aussagen. |
< 1 % (kritisch!) |
Szenario: IT-Helpdesk in einem mittelständischen Unternehmen (100.000 Tickets/Jahr).

Status Quo (Mensch):
Kosten pro Ticket: 8,00 € (Vollkosten).
Gesamtkosten: 800.000 € p.a.
Szenario Agent (Investition):
Entwicklung & Setup: 100.000 € (Einmalig).
Laufende Kosten (Hosting, Token, Wartung): 60.000 € p.a.
Ergebnis:
Annahme: 60 % Deflektionsrate (60.000 Tickets autonom).
Verbleibende Tickets für Menschen: 40.000 * 8 € = 320.000 €.
Gesamtkosten Neu: 320.000 € (Mensch) + 60.000 € (KI) = 380.000 €.
Einsparung Jahr 1: 800.000 € - 380.000 € - 100.000 € (Invest) = 320.000 € Netto-Ersparnis.
ROI Jahr 1: 3,2x.
Dieses Rechenbeispiel 7 verdeutlicht die immense Hebelwirkung, sobald die Fixkosten der Entwicklung durch das Volumen amortisiert werden.
Kein Transformationsprozess ist ohne Risiko. Die folgenden Fallstricke müssen proaktiv gemanagt werden.
Effizienzgewinne führen oft dazu, dass Arbeit "expandiert". Wenn ein Bericht in 5 Minuten statt 5 Stunden erstellt wird, fordern Manager plötzlich 10 Berichte anstatt einem.
Mitigation: Klare Governance über den Output. Nutzen Sie die gewonnene Zeit explizit für neue Wertschöpfung oder realisieren Sie die Einsparung durch Einstellungsstopps. Produktivität ohne Abbau von Arbeitsstunden senkt keine Kosten.8
Schnell zusammengebaute Agenten neigen zu Instabilität.
Mitigation: Behandeln Sie Prompts als Code. Nutzen Sie Versionierung, automatisierte Tests (Eval-Frameworks) und CI/CD-Pipelines für Agenten.
Wer haftet, wenn ein Agent fälschlicherweise einen Rabatt gewährt?
Mitigation: Definieren Sie klare finanzielle Autoritätsgrenzen (z.B. "Bis 50€ autonom, darüber Genehmigung"). Implementieren Sie Audit-Trails, die jede Entscheidung des Agenten revisionssicher protokollieren.17
Abschließend zeigt unsere Analyse der McKinsey-Daten, dass der wichtigste Prädiktor für den Erfolg nicht die Technologie, sondern die Ambition ist.1 Unternehmen, die KI nur nutzen, um "5 % Kosten zu sparen", scheitern oft an den Implementierungshürden. Unternehmen, die KI nutzen, um ihr Geschäftsmodell neu zu erfinden – z.B. durch 24/7-Echtzeit-Service oder vollautomatisierte Lieferketten –, realisieren die massiven Profit-Pools.
Wir bei Dreher Consulting empfehlen unseren Kunden, die Phase des Spielens zu beenden.
Die Technologie ist reif. Die Ökonomie ist validiert. Es liegt nun an der Führungsebene, die organisatorischen Weichen zu stellen. Der Weg "From Pilot to Profit" ist kein technisches Upgrade. Er ist eine operative Transformation.
Nutzen Sie diese Checkliste, um den Reifegrad Ihrer Initiative zu prüfen.
[ ] Zieldefinition: Haben wir definiert, ob wir Kosten senken (Efficiency) oder wachsen (Innovation) wollen? (Vermeiden Sie Mischziele).
[ ] Data Readiness: Sind die Kernsysteme (ERP, CRM) via API zugänglich? Sind die Daten sauber?
[ ] Atomare Aufgaben: Wurden die Prozesse in kleinste, logische Schritte zerlegt?
1. Status Quo 2025: Die Anatomie des "Pilot Purgatory"
2. First Principles Economics: Die Ökonomie der Intelligenz
3. Strategische Identifikation: Das MECE-Framework zur Potenzialanalyse
4. Das Operative Betriebsmodell: Architecture of Agency
5. Handlungsanleitung: "From Pilot to Profit"
6. Deep Dives: Kennzahlen und Erfolgsmessung
7. Risikomanagement und Herausforderungen
Sprechen Sie direkt mit Drehers KI-Assistent – klicken Sie auf das Mikrofon-Symbol und stellen Sie Ihre Frage laut oder geben Sie sie ein. Erhalten Sie innerhalb von Sekunden kompetente Antworten, rund um die Uhr verfügbar.
Jetzt per Sprache fragen