IDEAL-X
← KI-Wissen

1. April 2026

Warum für KI-Projekte im Mittelstand die Rechnung nicht aufgeht – und was eine belastbare Bewertung wirklich braucht

tl;dr: KI-Projekte scheitern selten an der Technik – meistens an einer unvollständigen Rechnung. Wer nur Stunden einspart und keine Baseline hat, rechnet auf Wunschdenken. Eine belastbare Bewertung braucht: Ist-Zustand dokumentiert, alle drei Nutzenarten getrennt bewertet, interne Kosten vollständig eingerechnet, Realisierungsgrad explizit begründet, und ein Risikoprofil in drei Dimensionen.

Es gibt eine Rechnung, die in fast jedem KI-Projekt auftaucht. Sie steht in einer Excel-Tabelle, wurde in einer Stunde zusammengestellt und sieht auf den ersten Blick überzeugend aus: Anzahl Mitarbeitende × eingesparte Stunden/Woche × Stundensatz = Einsparpotenzial pro Jahr. Ergebnis: Amortisation in acht Monaten. Investition freigegeben.

Zwölf Monate später ist das Projekt ins Stocken geraten. Die Einsparungen sind nicht eingetreten – oder zumindest nicht in der erwarteten Größenordnung. In vielen Fällen ist die Technologie nicht das Problem. Die Rechnung war unvollständig.

Schritt 0: Ohne Baseline keine belastbare Rechnung

Bevor überhaupt über Nutzen und Kosten gesprochen werden kann, muss eine Frage beantwortet sein: Wie läuft der Prozess heute – messbar, nicht gefühlt?

Bearbeitungszeiten, Fehlerquoten, Durchlaufzeiten, Rückfragequoten: Ohne diese Ausgangsdaten bleibt jede ROI-Berechnung eine Schätzung auf eine Schätzung. Die Verbesserung durch KI lässt sich nur dann belastbar beziffern, wenn der Status quo dokumentiert ist. Für Entscheider bedeutet das: Wer keine Baseline hat, kann nach dem Projekt nicht nachweisen, was tatsächlich besser geworden ist – und hat damit auch keine Grundlage für eine Folgeentscheidung.

Die gute Nachricht: Eine Baseline muss nicht perfekt sein. Grobe Messwerte aus dem Tagesgeschäft – Stunden pro Vorgang, Fehlerrate pro Woche, Durchlaufzeit pro Auftrag – sind oft ausreichend, um den Vorher-nachher-Vergleich zu ermöglichen.

Die drei Nutzenarten von KI-Projekten: Effizienz, Risikoreduktion, Umsatzhebel

Was der Nutzen wirklich ist – und warum Zeitersparnis nicht reicht

Der häufigste Fehler bei der ROI-Berechnung von KI-Projekten: alles auf Stunden reduzieren. Dabei gibt es mindestens drei Nutzenarten, die jeweils anders berechnet werden müssen.

Effizienz

Ein Prozess, der heute vier Stunden dauert, dauert mit KI-Unterstützung eine Stunde. Die Rechnung scheint einfach. Aber: Werden die drei eingesparten Stunden tatsächlich produktiv anderweitig eingesetzt? Oder verteilen sie sich unsichtbar im Arbeitsalltag? Ohne eine ehrliche Einschätzung des Realisierungsgrades ist jede Effizienzrechnung Wunschdenken.

Risikoreduktion

Der am häufigsten übersehene Nutzentyp. Wenn ein manueller Prozess regelmäßig Fehler produziert – fehlerhafte Angebote, falsche Klassifizierungen, übersehene Fristen – hat jeder Fehler einen wirtschaftlichen Wert. Eintrittswahrscheinlichkeit mal Schadenshöhe ergibt den erwarteten jährlichen Risikowert. Wer diesen Nutzentyp ignoriert, unterschätzt den Business Case systematisch – und übersieht, was das Nichtstun tatsächlich kostet.

Umsatzhebel

Relevant, sobald KI nicht nur Kosten spart, sondern Erträge steigert: mehr Kapazität für umsatzrelevante Tätigkeiten, schnellere Angebotserstellung, höhere Conversion. Hier zählt nicht der Umsatz, sondern der Deckungsbeitrag.

Daneben gibt es eine vierte Kategorie, die sich nicht direkt in Euro ausdrücken lässt, aber strategisch oft entscheidend ist: bessere Entscheidungsqualität durch konsistentere Informationsaufbereitung, kürzere Einarbeitungszeiten für neue Mitarbeitende, geringere Abhängigkeit von Einzelpersonen mit spezifischem Prozesswissen. Diese Nutzen begründen häufig, warum ein Projekt auch dann sinnvoll ist, wenn der direkte ROI im ersten Jahr nicht maximal aussieht. Sie gehören in die Bewertung – als qualitative Einschätzung, nicht als Phantomzahl.

Was die Kosten wirklich sind – die zwei blinden Flecken

Interne Projektstunden

KI-Projekte brauchen interne Ressourcen: Anforderungsanalyse mit den Fachexperten, Tests und Abnahme, Schulung aller Nutzer, Rollout-Begleitung und Change-Management. Das sind keine Overhead-Posten – das ist substanzielle Arbeitszeit von Mitarbeitenden, deren Vollkostensatz in die Rechnung gehört. Erfahrungswert: Interne Projektstunden entsprechen oft 20 bis 40 Prozent der externen Implementierungskosten. Bei einem externen Budget von 50.000 Euro bedeutet das 10.000 bis 20.000 Euro zusätzliche interne Kosten – die in der Anfangskalkulation meistens fehlen.

Laufende Qualitätssicherung und Governance

KI-Lösungen sind keine Software, die man einmal installiert und dann läuft. Prozesse ändern sich, Anforderungen entwickeln sich weiter, Ergebnisse müssen regelmäßig durch Fachexperten bewertet werden. Human-in-the-Loop ist kein optionales Feature, sondern eine betriebliche Notwendigkeit. Diese Kosten fallen in jedem Jahr an und gehören als eigene Position in jede ROI-Berechnung – getrennt vom einmaligen Investment.

Warum Realisierung kein Selbstläufer ist

Selbst wenn Nutzen und Kosten korrekt berechnet sind, bleibt eine dritte Variable, die Kalkulationen regelmäßig kippt: der Realisierungsgrad.

Die Annahme, dass 100 Prozent des theoretischen Nutzens tatsächlich eintreten, ist in der Praxis selten gerechtfertigt. Ein konservativer Ausgangswert liegt bei 50 Prozent – aber dieser Wert ist keine feste Daumenregel, sondern ein Startpunkt. Er sollte explizit begründet werden: höher bei klarer Pilotierungsgrundlage und nachgewiesener Akzeptanz im Team, niedriger bei hohem Integrationsaufwand, fehlendem Owner oder bekannten Vorbehalten im betroffenen Bereich.

Realisierungsgrad und Adoption-Risiko bei KI-Projekten

Genau dort liegt das Adoption-Risiko: Fehlt ein klar benannter interner Verantwortlicher? Gibt es im Team Vorbehalte, die bisher nicht adressiert wurden? Beides erhöht den realen Implementierungsaufwand und senkt die Wahrscheinlichkeit, dass das Potenzial tatsächlich gehoben wird. Eine seriöse Kalkulation weist das aus – nicht als Schwäche, sondern als Planungsgrundlage.

Das Risiko, das den ROI kippt

KI-Projekte tragen drei verschiedene Risikoarten, die getrennt bewertet werden müssen.

Technisches Risiko

Wie wahrscheinlich ist es, dass die KI-Lösung nicht wie erwartet funktioniert? Schlechte Datenqualität, instabile Modelle, Halluzinationen bei komplexen Anfragen – das sind keine theoretischen Probleme. Sie treten auf, wenn die Datenbasis nicht ausreichend geprüft wurde oder der Anwendungsfall für den gewählten Ansatz nicht geeignet ist.

Organisatorisches Risiko

Wie wahrscheinlich ist es, dass die Lösung intern nicht genutzt wird? Ein Tool, das niemand verwendet, hat keinen ROI – egal wie gut es technisch funktioniert. Kein Owner, fehlende Prozessintegration, unklare Verantwortlichkeiten sind die häufigsten Gründe für Adoption-Versagen.

Compliance-Risiko

Mit dem EU AI Act gelten verbindliche Anforderungen für KI-Systeme – abhängig von Anwendungsfall und Risikoklasse. Besonders relevant wird das bei Prozessen mit Personenbezug, bei Entscheidungen die Mitarbeitende oder Kunden direkt betreffen – etwa Bewerberbewertungen oder Kreditentscheidungen – sowie überall dort, wo DSGVO-Anforderungen greifen. Ein Use-Case, der in eine höhere Risikokategorie fällt, braucht vor jeder Investitionsentscheidung eine Compliance-Prüfung.

Was eine belastbare Entscheidungsvorlage braucht

Eine ROI-Berechnung, die vor dem Management standhält, braucht keine perfekten Zahlen. Sie braucht dokumentierte Annahmen und explizite Unsicherheiten:

  1. Baseline dokumentiert – Wie läuft der Prozess heute, messbar? Ohne Ausgangswert kein belastbarer Vorher-nachher-Vergleich.
  2. Nutzenart klar definiert – Effizienz, Risikoreduktion oder Umsatzhebel. Getrennt bewertet, dann zusammengeführt. Qualitative Nutzen separat benannt.
  3. Interne Projektkosten eingerechnet – als eigene Position, nicht als Fußnote.
  4. Realisierungsquote begründet – mit Verweis auf Adoption-Readiness, Change-Aufwand und vorhandene Vergleichswerte.
  5. Zwei Payback-Varianten – klassisch auf die Anfangsinvestition, konservativ inklusive der Jahresbetriebskosten.
  6. Risikoprofil bewertet – technisch, organisatorisch, Compliance. Für jeden Bereich eine kurze Einschätzung mit Begründung.
  7. Confidence-Level dokumentiert – Sind die Annahmen validiert oder geschätzt? Gibt es Pilotdaten oder nur Benchmarks?

Das Ergebnis ist keine Garantie. Aber es ist eine Grundlage, auf der Entscheidungen getroffen werden können – und auf der Korrekturen möglich sind, wenn Annahmen sich als falsch erweisen.


Belastbare Entscheidungsvorlage für KI-Projekte

Sie bewerten gerade einen KI-Use-Case – oder eine Bewertung liegt vor, die sich zu einfach anfühlt?

Wir zeigen Ihnen mit unserem KI-Potenzial-Check, ob Ihr Use-Case wirtschaftlich tragfähig ist – bevor Budgets freigegeben werden.

Termin buchen →

KI konkret für Ihr Unternehmen einordnen

Wir besprechen Ihre Ausgangslage und zeigen, wo KI in Ihrem Kontext realistische Wirkung entfaltet.

Kostenloses Erstgespräch