DORA Report 2025: KI als Amplifier

Inhaltsverzeichnis

1.Die zentrale These: KI verstärkt, sie repariert nicht
2.Der Stabilitäts-Trade-off: Was die Daten wirklich zeigen
3.Vom 4-Tier-Modell zum Capability-Denken
4.Die 7 Capabilities, die KI-Gewinne real machen
5.Die 7 Team-Archetypen: Wo steht eure Organisation?
6.Die unsichtbare Nebenwirkung: Cognitive Debt
7.Was Delivery-Verantwortliche jetzt konkret tun sollten
8.Fazit: KI ist eine Reifegrad-Frage, keine Tooling-Frage
9.Quellen & Referenzen

Die zentrale These: KI verstärkt, sie repariert nicht

Der DORA Report 2025 (Google Cloud) ist die bislang umfangreichste empirische Untersuchung dazu, was künstliche Intelligenz tatsächlich mit der Software-Delivery von Organisationen macht. Die Kernaussage steht quer zur dominanten Marketing-Erzählung des Jahres: KI repariert keine kaputten Delivery-Prozesse. Sie verstärkt das, was bereits da ist. Organisationen mit reifen Praktiken werden durch KI schneller und besser. Organisationen mit instabilen Prozessen werden durch KI schneller — und instabiler.

Diese Differenzierung ist deshalb so wichtig, weil sie der verbreiteten Annahme widerspricht, die Einführung von KI-gestützten Coding-Werkzeugen sei für sich genommen ein Fortschrittssignal. Laut dem DORA Report 2025 nutzen rund 90 % der befragten Entwicklerinnen und Entwickler KI-Werkzeuge in ihrer täglichen Arbeit. KI-Adoption ist damit kein Differenzierungsmerkmal mehr — sie ist die Grundannahme. Die entscheidende Frage hat sich verschoben: Nicht mehr „Nutzt ihr KI?", sondern „Hat eure Organisation die Fähigkeiten, um aus KI einen Nettonutzen zu ziehen?".

Die Daten zeigen ein konsistentes Muster: KI erhöht den Throughput — Teams produzieren mehr Code in kürzerer Zeit. Gleichzeitig steht dieser Throughput-Gewinn in einem messbaren Spannungsverhältnis zur Delivery-Stabilität. Ohne ausgereifte technische und organisatorische Grundlagen verschlechtern sich Stabilitätsindikatoren, während die Geschwindigkeit steigt. Das ist kein Argument gegen KI — es ist ein Argument für die Fundamente, die KI erst sicher nutzbar machen.

Im deutschsprachigen Raum existiert zu diesem Befund bislang fast ausschließlich englischsprachige Vendor-Kommunikation. Eine seriöse, herstellerneutrale Aufbereitung fehlt weitgehend. Genau diese Lücke schließt dieser Artikel: eine datenbasierte Einordnung des DORA Report 2025 für Delivery-Verantwortliche, die Entscheidungen treffen müssen — nicht für Marketing-Folien.

KI ist ein Amplifier, kein Fix. Sie verstärkt die vorhandene Delivery-Reife in beide Richtungen — nach oben bei stabilen Organisationen, nach unten bei instabilen.

Der Stabilitäts-Trade-off: Was die Daten wirklich zeigen

Der vielleicht meistdiskutierte Befund des DORA Report 2025 ist der Zusammenhang zwischen KI-Nutzung und Delivery-Stabilität. Über Jahre hinweg hatte die DORA-Forschung gezeigt, dass Geschwindigkeit und Stabilität kein Gegensatz sein müssen — die besten Teams sind in beiden Dimensionen führend. Der 2025er-Report nuanciert diese Erkenntnis im KI-Kontext erheblich.

Die Beobachtung: KI-Adoption korreliert mit höherem Throughput, aber nicht automatisch mit höherer Stabilität. In Organisationen ohne die nötigen Grundlagen geht der Geschwindigkeitsgewinn mit einer Verschlechterung der Stabilitätsindikatoren einher. Mehr Code, schneller geliefert — aber mit einer höheren Wahrscheinlichkeit, dass dieser Code in Produktion Probleme verursacht. Der unabhängige Analyst RedMonk und die technische Fachredaktion InfoQ haben diesen Trade-off als die entscheidende Lesart des Reports herausgearbeitet.

Mechanisch ist das nachvollziehbar. KI-Assistenten erhöhen die Rate, mit der Codeänderungen entstehen. Wenn die Sicherheitsnetze einer Organisation — automatisierte Tests, schnelle Feedback-Schleifen, saubere Versionskontrolle, kleine Batch-Größen — nicht mit dieser erhöhten Rate skalieren, dann passiert mehr fehlerhafter Code pro Zeiteinheit ungeprüft die Pipeline. KI beschleunigt nicht nur die Produktion guter Lösungen, sondern auch die Produktion von Fehlern.

Daraus folgt eine kontraintuitive, aber belastbare Schlussfolgerung: Der Wert von KI für eine Delivery-Organisation ist keine Funktion der KI-Werkzeuge selbst. Er ist eine Funktion der Reife, mit der die Organisation diese Werkzeuge einbettet. Wer KI einführt, ohne gleichzeitig in Stabilitätsgrundlagen zu investieren, kauft Geschwindigkeit auf Kosten der Zuverlässigkeit — ein schlechter Tausch in jedem regulierten oder geschäftskritischen Kontext.

Vom 4-Tier-Modell zum Capability-Denken

Wer die klassischen DORA-Metriken kennt — Deployment Frequency, Lead Time for Changes, Mean Time to Restore und Change Failure Rate — kennt auch das vertraute Vier-Stufen-Klassifikationsmodell: Low, Medium, High und Elite Performer. Dieses Modell ist nach wie vor nützlich, um die Output-Seite der Software-Delivery zu messen. Eine vertiefte Darstellung der vier Metriken und ihrer Benchmarks findet sich im bestehenden Alev-B-Artikel „DORA Metrics erklärt" — er bleibt das Fundament, auf dem dieser Artikel aufbaut.

Der DORA Report 2025 verlagert den Schwerpunkt jedoch von der reinen Ergebnis-Klassifikation hin zur Frage nach den zugrundeliegenden Fähigkeiten. Die Logik: Ein Performance-Tier sagt, WO eine Organisation steht. Ein Capability-Modell sagt, WARUM sie dort steht und welche Hebel sie bewegen muss, um sich zu verbessern — gerade unter den Bedingungen verbreiteter KI-Nutzung.

Das Vier-Tier-Modell und das neue Capability-Denken sind dabei keine Konkurrenten, sondern aufeinander aufbauende Ebenen. Die vier Metriken bleiben die Messgrößen für Throughput und Stabilität. Das Capability-Modell des 2025er-Reports erklärt, welche organisatorischen und technischen Fundamente darüber entscheiden, ob KI diese Metriken hebt oder verschlechtert. Wer das alte Modell als überholt abtut, missversteht die Beziehung: Es ist die Vorstufe, nicht der Gegensatz.

Für Delivery-Verantwortliche bedeutet das eine konkrete Verschiebung der Fragestellung. Statt „In welchem Tier sind wir?" lautet die produktivere Frage: „Welche der Fähigkeiten, die KI-Gewinne real machen, haben wir bereits robust etabliert — und welche fehlen uns, sodass KI bei uns gerade Risiko statt Wert erzeugt?".

Das 4-Tier-Modell misst, wo ihr steht. Das Capability-Modell des DORA Report 2025 erklärt, warum — und welche Fundamente KI-Gewinne überhaupt erst tragfähig machen.

Die 7 Capabilities, die KI-Gewinne real machen

Der DORA Report 2025 identifiziert ein Bündel von Fähigkeiten, die darüber entscheiden, ob eine Organisation aus KI einen Nettonutzen zieht oder ob KI ihre Schwächen verstärkt. Es handelt sich um organisatorische und technische Grundlagen, die zusammenwirken — keine einzelne davon ist isoliert ausreichend. Die folgende Tabelle fasst die Fähigkeitsdimensionen und ihre Relevanz im KI-Kontext zusammen.

Entscheidend ist das Zusammenspiel: KI verstärkt den Effekt jeder dieser Fähigkeiten. Wo sie robust sind, multipliziert KI den Nutzen. Wo sie fehlen, multipliziert KI das Risiko. Eine Organisation, die KI-Coding einführt, ohne zuvor diese Fundamente zu prüfen, betreibt im Kern ein ungesteuertes Experiment mit ihrer Produktionsumgebung.

Warum keine dieser Fähigkeiten optional ist

Die häufigste Fehlinterpretation lautet: „Wir picken uns die zwei Fähigkeiten heraus, die am leichtesten umzusetzen sind." Der DORA Report 2025 legt das Gegenteil nahe. Die Fähigkeiten bilden ein System gegenseitiger Abhängigkeiten. Schnelle Feedback-Schleifen ohne ausgereifte Testautomatisierung sind schnelles Feedback über nichts. Kleine Batches ohne reibungsarme Plattform erzeugen lediglich häufigere manuelle Engpässe.

Für die Praxis heißt das: Organisationen sollten ihre schwächste relevante Fähigkeit zuerst adressieren, nicht ihre stärkste weiter optimieren. KI verstärkt Engpässe — und ein System ist immer nur so schnell und stabil wie sein limitierender Faktor. Die Investitionslogik dreht sich damit um: Nicht dort investieren, wo der Fortschritt am sichtbarsten ist, sondern dort, wo das KI-induzierte Risiko am größten ist.

Capability-Dimension	Worum es geht	Warum KI sie verstärkt
Klare, geteilte Spezifikationen	Eindeutig dokumentierte Anforderungen und Intent, an denen sich Mensch und KI gleichermaßen orientieren	KI ohne klaren Intent produziert plausiblen, aber zielverfehlenden Code in hoher Geschwindigkeit
Gesunde Datengrundlage	Verlässliche, zugängliche interne Daten und Kontext über das eigene System	KI-Ausgaben sind nur so gut wie der Kontext, mit dem die Organisation sie füttern kann
Ausgereifte Testautomatisierung	Belastbare, schnelle automatisierte Tests als Sicherheitsnetz vor Produktion	Höhere Änderungsrate durch KI braucht proportional stärkere automatisierte Absicherung
Schnelle Feedback-Schleifen	Kurze Zyklen zwischen Codeänderung und verlässlicher Rückmeldung über deren Qualität	KI erhöht die Änderungsfrequenz — langsames Feedback wird so zum dominierenden Engpass
Saubere Versionskontrolle und kleine Batches	Trunk-naher Workflow, kleine reviewbare Changesets statt großer Sammel-Releases	KI erleichtert große, schwer überprüfbare Diffs — kleine Batches halten Risiko beherrschbar
Reibungsarme interne Plattform	Self-Service-Infrastruktur, die Reibung zwischen Idee und Produktion minimiert	KI-beschleunigte Entwicklung staut sich an jeder manuellen Plattform-Hürde
Nutzerzentrierter Arbeitsfokus	Ausrichtung der Arbeit an echtem Nutzerwert statt an reiner Output-Menge	KI maximiert Output trivial — ohne Nutzerfokus entsteht schnell wertloser Mehr-Code

Die 7 Team-Archetypen: Wo steht eure Organisation?

Statt Organisationen pauschal in vier Performance-Tiers zu sortieren, beschreibt der DORA Report 2025 differenzierte Team-Archetypen. Sie ergeben sich aus der Kombination von Throughput, Stabilität und der Reife der zugrundeliegenden Fähigkeiten unter KI-Nutzung. Der praktische Wert dieser Archetypen liegt nicht im Etikett, sondern in der Diagnose: Jeder Archetyp impliziert einen anderen nächsten Schritt.

Die folgende Übersicht beschreibt sieben charakteristische Muster. Sie sind als Diagnose-Raster gedacht, nicht als starre Schubladen — viele Organisationen erkennen sich in Mischformen wieder oder bewegen sich über die Zeit zwischen Archetypen. Entscheidend ist die ehrliche Selbsteinordnung als Ausgangspunkt für gezielte Verbesserung.

Self-Check: Welcher Archetyp ist eure Org?

Eine ehrliche Selbsteinordnung gelingt am besten über drei Leitfragen, die sich aus dem DORA Report 2025 ableiten lassen.

1Throughput-Frage: Hat KI bei euch messbar zu mehr ausgelieferten Änderungen geführt? Wenn nein, liegt euer Engpass nicht bei der KI, sondern bei Fundament oder Adoption — Archetyp „Stabil, aber langsam" oder „Limitiert durch Fundament".
2Stabilitäts-Frage: Sind im selben Zeitraum eure Change Failure Rate oder eure Wiederherstellungszeiten gestiegen? Wenn ja, seid ihr mit hoher Wahrscheinlichkeit „Schnell, aber fragil" — der gefährlichste Archetyp, weil der Schaden zeitverzögert auftritt.
3Wert-Frage: Können eure Teams für die letzten zehn größeren Änderungen den konkreten Nutzerwert benennen? Fällt das schwer, deutet das auf „Output-getrieben ohne Nutzerfokus" hin — KI verstärkt hier die Produktion von Beschäftigung statt Wirkung.
4Aggregation: Der Archetyp, der auf die meisten ehrlich beantworteten Fragen passt, ist euer realistischer Ausgangspunkt. Wichtig ist nicht die perfekte Zuordnung, sondern die abgeleitete Priorität für den nächsten Schritt.

Archetyp	Charakteristik	Empfohlener nächster Schritt
Stabil und schnell	Hoher Throughput, hohe Stabilität, reife Fähigkeiten — KI wirkt klar als Multiplikator	Fortschritt sichern, KI-Governance formalisieren, Erkenntnisse skalieren
Schnell, aber fragil	KI hat Throughput stark erhöht, Stabilität bröckelt — der klassische Trade-off-Fall	Sofort in Testautomatisierung und Feedback-Schleifen investieren, Batch-Größe senken
Stabil, aber langsam	Solide Stabilität, niedriger Throughput — KI-Potenzial noch ungenutzt	KI gezielt einführen, aber an die vorhandenen Sicherheitsnetze koppeln
Limitiert durch Fundament	Schwache technische Grundlagen begrenzen jeden KI-Nutzen, in beiden Dimensionen mittelmäßig	Erst Fundament härten (Tests, VCS, Plattform), dann KI-Adoption ausbauen
KI-experimentell	Frühe, unstrukturierte KI-Nutzung, hohe Varianz in den Ergebnissen	Spezifikations- und Reviewdisziplin etablieren, Experimente in Leitplanken überführen
Output-getrieben ohne Nutzerfokus	Hoher Output, unklarer Wertbeitrag — KI verstärkt die Produktion irrelevanter Arbeit	Arbeitsfokus auf Nutzerwert ausrichten, Wertstrom statt Volumen messen
Reaktiv und überlastet	Hohe Fehler- und Wiederherstellungslast bindet Kapazität, KI verschärft die Lage	Stabilität vor Geschwindigkeit priorisieren, Incident- und Feedback-Mechanik sanieren

Die unsichtbare Nebenwirkung: Cognitive Debt

Ein Stabilitäts-Trade-off, der sich in der Change Failure Rate niederschlägt, ist messbar und damit steuerbar. Schwieriger ist eine zweite Nebenwirkung KI-beschleunigter Delivery, die der DORA Report 2025 implizit adressiert und die der branchenweite Diskurs 2026 unter dem Begriff „Cognitive Debt" diskutiert: KI-generierter Code kann technisch fehlerfrei sein und trotzdem das geteilte mentale Systemmodell eines Teams erodieren.

Der Mechanismus: Wenn ein erheblicher Teil des Codes von KI erzeugt und nur oberflächlich reviewt wird, sinkt das tiefe Verständnis des Teams für das eigene System — auch ohne dass die klassischen Qualitätsmetriken Alarm schlagen. Die Folgekosten zeigen sich verzögert: bei Incidents, die niemand schnell diagnostizieren kann, bei Architekturentscheidungen, die auf unverstandenem Bestand aufsetzen, bei Onboarding, das gegen eine Wand aus „funktioniert, aber keiner weiß warum" läuft.

Diese kognitive Verschuldung ist die direkte Verwandte der klassischen technischen Schuld — sie betrifft jedoch nicht den Code, sondern das Wissen über den Code. Wer die Mechanik technischer Schulden, ihre Akkumulation und ihren systematischen Abbau verstehen will, findet die Grundlagen im Alev-B-Artikel „Technical Debt Management". Cognitive Debt ist deren KI-Zeitalter-Erweiterung: gleiche Akkumulationslogik, schwierigere Sichtbarkeit.

Die praktische Konsequenz aus dem DORA Report 2025 ist eindeutig: Reviewdisziplin und bewusste Verständnis-Checkpoints sind unter KI-Nutzung keine Bürokratie, sondern Risikomanagement. Code, den niemand im Team erklären kann, ist auch dann eine Verbindlichkeit, wenn er heute fehlerfrei läuft.

Was Delivery-Verantwortliche jetzt konkret tun sollten

Aus dem DORA Report 2025 lässt sich eine pragmatische Handlungslogik ableiten, die bewusst gegen den Reflex „erst KI breit ausrollen, dann optimieren" steht. Die Reihenfolge ist entscheidend: Fundament vor Beschleunigung.

Die folgenden Schritte sind keine Reihenfolge nach Aufwand, sondern nach Risikoreduktion. Sie adressieren zuerst den Mechanismus, über den KI Schaden anrichtet, bevor sie den Mechanismus optimieren, über den KI Nutzen stiftet.

Fundament vor Beschleunigung: Wer in Stabilitätsgrundlagen investiert, bevor er KI breit ausrollt, kauft Geschwindigkeit ohne den Stabilitätspreis. Die umgekehrte Reihenfolge bezahlt man in Incidents.

Der Anschluss an strukturierte Reifegradbewertung

Die sieben Capabilities des DORA Report 2025 lassen sich nicht aus dem Bauch heraus bewerten — sie brauchen ein strukturiertes, wiederholbares Bewertungsraster. Der Alev-B-Artikel „DevOps Maturity Assessment" beschreibt, wie sich DevOps-Reife systematisch erheben und über die Zeit verfolgen lässt. In Kombination mit der Capability-Logik dieses Artikels entsteht daraus ein konkreter Bewertungsrahmen: Wo stehen wir je Fähigkeit, wo erzeugt KI gerade Risiko, und welche Investition reduziert dieses Risiko am stärksten?

Unsere Empfehlung: Behandeln Sie die KI-Einführung nicht als Tooling-Entscheidung, sondern als Reifegrad-Frage. Die Werkzeuge sind in wenigen Tagen ausgerollt. Die Fähigkeiten, die aus diesen Werkzeugen einen Nettonutzen machen, brauchen Monate gezielter Arbeit — und genau diese Arbeit entscheidet, ob KI eure Delivery verstärkt oder verschlechtert.

1Archetyp ehrlich bestimmen: Führen Sie den Self-Check aus diesem Artikel mit den verantwortlichen Teams durch. Ohne ehrliche Ausgangsdiagnose ist jede KI-Investition ein Blindflug.
2Schwächste relevante Capability identifizieren: Prüfen Sie die sieben Fähigkeiten und benennen Sie die eine, deren Fehlen unter KI-Nutzung das größte Risiko erzeugt — in der Regel Testautomatisierung oder Feedback-Geschwindigkeit.
3Stabilitäts-Sicherheitsnetz vor Throughput härten: Investieren Sie zuerst in automatisierte Tests, schnelle Feedback-Schleifen und kleine Batch-Größen. Das ist die Voraussetzung dafür, dass KI-Geschwindigkeit nicht in Instabilität umschlägt.
4KI-Nutzung mit Spezifikations- und Reviewdisziplin koppeln: Etablieren Sie klare Anforderungs-Spezifikationen als gemeinsamen Bezugspunkt für Mensch und KI und definieren Sie Verständnis-Checkpoints gegen Cognitive Debt.
5Mit denselben Metriken messen wie vorher: Tracken Sie Throughput und Stabilität über die etablierten DORA-Metriken weiter — nur so wird sichtbar, ob KI bei euch verstärkt oder verschlechtert. Wer KI einführt und das Messen einstellt, fliegt blind.
6Reifegrad strukturiert bewerten: Ordnen Sie die Capability-Lücken in ein wiederholbares Assessment ein, das den Fortschritt über die Zeit nachvollziehbar macht — DevOps-Reife ist kein einmaliger Zustand, sondern eine kontinuierliche Disziplin.

Fazit: KI ist eine Reifegrad-Frage, keine Tooling-Frage

Der DORA Report 2025 liefert die belastbarste verfügbare Antwort auf die Frage, was KI mit Software-Delivery macht — und die Antwort ist unbequem für alle, die sich von KI eine Abkürzung erhofft haben. KI rettet keine unreife Delivery-Organisation. Sie macht sie schneller darin, ihre vorhandenen Probleme zu produzieren. Umgekehrt belohnt sie reife Organisationen mit einem echten Multiplikatoreffekt.

Für Delivery-Verantwortliche bedeutet das eine klare strategische Neuausrichtung. Die relevante Frage ist nicht, welches KI-Werkzeug man einführt, sondern ob die Organisation die sieben Fähigkeiten besitzt, die aus KI Wert statt Risiko machen. Wer den eigenen Archetyp ehrlich bestimmt und die schwächste relevante Capability zuerst angeht, bewegt sich in die richtige Richtung. Wer KI ausrollt und auf das Beste hofft, verstärkt sein bestehendes Delivery-Profil — in beide Richtungen.

Die gute Nachricht: Die Hebel sind bekannt, messbar und steuerbar. Das alte Vier-Tier-Modell und die klassischen DORA-Metriken bleiben gültig — sie sind nicht überholt, sondern die Basis, auf der das Capability-Denken des 2025er-Reports aufsetzt. Wer beide Ebenen zusammen nutzt, hat einen kompletten Kompass: Die Metriken zeigen, wo man steht. Die Capabilities erklären, warum — und welcher nächste Schritt KI von einem Risiko in einen echten Vorteil verwandelt.

Die entscheidende Frage 2026 lautet nicht „Nutzt ihr KI?", sondern „Hat eure Organisation die Reife, aus KI einen Nettonutzen zu ziehen?".

Quellen & Referenzen

Die in diesem Artikel referenzierten Erkenntnisse und Einordnungen basieren auf den folgenden Quellen:

DORA Report 2025 — Google Cloud, „2025 DORA AI-Assisted Software Development Report": https://cloud.google.com/resources/content/2025-dora-ai-assisted-software-development-report
Google Cloud — Announcing the 2025 DORA Report: https://cloud.google.com/blog/products/ai-machine-learning/announcing-the-2025-dora-report
InfoQ — AI Is Amplifying Software Engineering Performance (DORA 2025): https://www.infoq.com/news/2026/03/ai-dora-report/
RedMonk — DORA 2025: Measuring Software Delivery After AI: https://redmonk.com/rstephens/2025/12/18/dora2025/
DevOps.com — DORA 2025: Faster, But Are We Any Better?: https://devops.com/dora-2025-faster-but-are-we-any-better/
DORA — DevOps Research and Assessment (Google): https://dora.dev/

Die wichtigsten Erkenntnisse

Laut dem DORA Report 2025 (Google Cloud) nutzen rund 90 % der Entwickler KI — KI-Adoption ist kein Differenzierungsmerkmal mehr, sondern die Grundannahme.
KI ist ein Amplifier, kein Fix: Sie hebt den Throughput, verschlechtert aber die Delivery-Stabilität, wenn die zugrundeliegenden technischen und organisatorischen Fundamente fehlen.
Das neue Capability-Denken ersetzt das Vier-Tier-Modell nicht, sondern erklärt es: Die klassischen DORA-Metriken messen, WO ihr steht — die 7 Capabilities erklären, WARUM.
Sieben Fähigkeiten entscheiden über den KI-Nettonutzen — von klaren Spezifikationen über ausgereifte Testautomatisierung bis zu nutzerzentriertem Arbeitsfokus; keine davon ist optional.
Die 7 Team-Archetypen sind ein Diagnose-Raster: „Schnell, aber fragil" ist der gefährlichste, weil der Stabilitätsschaden zeitverzögert auftritt.
Cognitive Debt ist die unsichtbare Nebenwirkung: KI-Code kann fehlerfrei sein und trotzdem das geteilte Systemverständnis erodieren — Reviewdisziplin wird zum Risikomanagement.
Handlungslogik: Fundament vor Beschleunigung — erst die schwächste Capability härten, dann KI breit ausrollen, und durchgängig mit denselben Metriken messen.

Passende Assessment-Templates

DevOps Maturity Assessment

Bewerten Sie die 7 Capabilities Ihrer Delivery-Organisation

DORA Metrics Dashboard

Throughput und Stabilität messen — das Fundament unter den Capabilities

Delivery Audit

Strukturierter Reifegrad-Check Ihrer Software-Delivery

Häufig gestellte Fragen

Nein, im Gegenteil. Die vier klassischen Metriken — Deployment Frequency, Lead Time for Changes, Mean Time to Restore und Change Failure Rate — bleiben die Messgrößen für Throughput und Stabilität. Der DORA Report 2025 ergänzt sie um ein Capability-Modell, das erklärt, welche organisatorischen und technischen Fundamente darüber entscheiden, ob KI diese Metriken hebt oder verschlechtert. Das Vier-Tier-Modell sagt, WO eine Organisation steht; das Capability-Denken sagt, WARUM und welcher Hebel zu bewegen ist. Eine vertiefte Darstellung der vier Metriken bietet der bestehende Alev-B-Artikel „DORA Metrics erklärt". Wer das alte Modell als überholt abtut, missversteht die Beziehung: Es ist die Vorstufe, nicht der Gegensatz.

Nein. Die Aussage des DORA Report 2025 ist differenzierter: KI verschlechtert die Stabilität nur dort, wo die nötigen Fundamente fehlen. In Organisationen mit ausgereifter Testautomatisierung, schnellen Feedback-Schleifen und kleinen Batch-Größen wirkt KI als klarer Multiplikator des Nutzens. Die richtige Schlussfolgerung ist daher nicht „keine KI", sondern „erst Stabilitätsgrundlagen härten, dann KI breit ausrollen". Wer KI einführt, ohne in diese Fundamente zu investieren, kauft Geschwindigkeit auf Kosten der Zuverlässigkeit — ein schlechter Tausch in jedem geschäftskritischen oder regulierten Kontext.

Es handelt sich um ein zusammenwirkendes Bündel organisatorischer und technischer Fähigkeiten: klare und geteilte Spezifikationen, eine gesunde Datengrundlage, ausgereifte Testautomatisierung, schnelle Feedback-Schleifen, saubere Versionskontrolle mit kleinen Batches, eine reibungsarme interne Plattform und ein nutzerzentrierter Arbeitsfokus. Der entscheidende Punkt: KI verstärkt den Effekt jeder dieser Fähigkeiten. Wo sie robust sind, multipliziert KI den Nutzen; wo sie fehlen, multipliziert KI das Risiko. Keine der Fähigkeiten ist isoliert ausreichend — sie bilden ein System gegenseitiger Abhängigkeiten, weshalb Organisationen ihre schwächste relevante Fähigkeit zuerst adressieren sollten.

Über drei Leitfragen: Erstens die Throughput-Frage — hat KI bei euch messbar zu mehr ausgelieferten Änderungen geführt? Zweitens die Stabilitäts-Frage — sind im selben Zeitraum Change Failure Rate oder Wiederherstellungszeiten gestiegen? Drittens die Wert-Frage — können eure Teams für die letzten zehn größeren Änderungen den konkreten Nutzerwert benennen? Der Archetyp, der auf die meisten ehrlich beantworteten Fragen passt, ist euer realistischer Ausgangspunkt. Wichtig ist nicht die perfekte Zuordnung in eine starre Schublade, sondern die daraus abgeleitete Priorität für den nächsten Schritt. Viele Organisationen erkennen sich in Mischformen wieder oder bewegen sich über die Zeit zwischen Archetypen.

Cognitive Debt bezeichnet die Erosion des geteilten mentalen Systemmodells eines Teams durch KI-generierten Code, der zwar technisch fehlerfrei sein kann, aber nur oberflächlich verstanden wird. Der DORA Report 2025 adressiert diese Nebenwirkung implizit über die Betonung von Reviewdisziplin und Verständnis-Checkpoints. Cognitive Debt ist die KI-Zeitalter-Verwandte der klassischen technischen Schuld: gleiche Akkumulationslogik, aber schwerer sichtbar, weil sie nicht den Code, sondern das Wissen über den Code betrifft. Die Grundlagen technischer Schulden behandelt der Alev-B-Artikel „Technical Debt Management". Code, den niemand im Team erklären kann, ist eine Verbindlichkeit — auch wenn er heute fehlerfrei läuft.

Bislang existiert zum DORA Report 2025 im deutschsprachigen Raum fast ausschließlich englischsprachige Vendor-Kommunikation — eine herstellerneutrale, datenbasierte Aufbereitung fehlt weitgehend. Dieser Artikel schließt genau diese Lücke und ordnet den Report für Delivery-Verantwortliche ein, die Entscheidungen treffen müssen. Die Primärquelle ist der „2025 DORA AI-Assisted Software Development Report" von Google Cloud; ergänzend bieten der unabhängige Analyst RedMonk und die Fachredaktion InfoQ neutrale Einordnungen des Stabilitäts-Trade-offs.

Die ehrliche Bestimmung des eigenen Archetyps, gefolgt von der Identifikation der schwächsten relevanten Capability. Der DORA Report 2025 legt nahe, dass Organisationen ihre schwächste Fähigkeit zuerst adressieren sollten, nicht ihre stärkste weiter optimieren — weil KI Engpässe verstärkt und ein System immer nur so stabil ist wie sein limitierender Faktor. In der Praxis ist das meist Testautomatisierung oder Feedback-Geschwindigkeit. Unsere Empfehlung: KI-Einführung als Reifegrad-Frage behandeln, nicht als Tooling-Entscheidung, und die Capability-Lücken in ein strukturiertes, wiederholbares Assessment einordnen — siehe der Alev-B-Artikel „DevOps Maturity Assessment".

DORA Report 2025KISoftware DeliveryDevOpsDelivery-Stabilität7 Capabilities

Vorheriger Artikel

DORA vs. NIS2 — Welche EU-Resilienzpflicht trifft Sie wirklich?

Nächster Artikel

DORA-Regulierung 2026: Vom Compliance-Papier zum Echtzeit-Nachweis

DORA Report 2025: Warum KI eure Software-Delivery nicht repariert, sondern verstärkt