KPMG KI-Report zurückgezogen: KI-Halluzinationen in seriösen Reports
KPMG zieht KI-Report zu agentischer KI zurück – wegen falscher Quellen und KI-Halluzinationen. Was der Fall über Quellenprüfung und Responsible AI aussagt.
Dieser Artikel hat eine Lesedauer von 5 minutes Minuten.

KPMG hat einen vielbeachteten Report zu agentischer KI zurückgezogen – wegen massiver Probleme mit KI-Halluzinationen und falschen Quellen. Der Fall zeigt, wie schnell KI-generierte Inhalte in seriös wirkenden Whitepapers landen und welche Konsequenzen das für Quellenprüfung, Responsible AI und die Glaubwürdigkeit von Beratungsunternehmen hat.
KPMG-Report zu agentischer KI wird zum Warnhinweis
KPMG hat einen Bericht mit dem Titel “Redefining excellence in the age of agentic AI” zurückgezogen. Laut TechCrunch geschah das, nachdem mehrere Organisationen erklärt hatten, Aussagen über ihre angebliche KI-Nutzung seien falsch oder irreführend.
Das ist schon für sich genommen bemerkenswert. Brisant wird der Fall aber durch das Thema des Reports: Es ging um agentische KI, also um Systeme, die nicht nur Texte ausgeben, sondern Aufgaben stärker eigenständig planen, ausführen und koordinieren sollen.
Der KPMG KI-Report sollte offenbar zeigen, wie Unternehmen und öffentliche Organisationen solche Systeme bereits einsetzen. Genau an dieser Stelle liegt das Problem. Wenn Beispiele erfunden, überdehnt oder falsch zugeordnet sind, wird aus einem Thought-Leadership-Papier schnell ein Dokument, das die eigenen Warnhinweise unfreiwillig bestätigt.
Was im KPMG-Report laut GPTZero problematisch war
Der KPMG-Report wurde bereits im Oktober 2025 veröffentlicht. Die Recherchegruppe GPTZero untersuchte später die Quellen und Fallbeispiele des Dokuments. Laut GPTZero waren von 45 Quellen nur fünf eindeutig korrekt. Weitere Quellen hätten paraphrasierte, falsche oder schwer überprüfbare Bestandteile enthalten.
TechCrunch verweist außerdem auf Berichte der Financial Times. Demnach widersprachen unter anderem UBS, der britische National Health Service, Swiss Federal Railways und Transport for London bestimmten Aussagen über ihre KI-Nutzung. KPMG entfernte den Report daraufhin von Websites und kündigte eine interne Prüfung an.
Der Fall ist auch deshalb relevant, weil er mehrere Such- und Problemfelder verbindet: KI-Halluzinationen, falsche Quellen, agentische KI und die Glaubwürdigkeit großer Beratungsunternehmen. Genau diese Kombination macht den KPMG-Report zu mehr als einer einzelnen Panne. Er zeigt, wie schnell KI-generierte Inhalte in professionellen Dokumenten seriös wirken können, obwohl einzelne Belege nicht tragen.
Wichtig ist die vorsichtige Formulierung: Nicht jede fehlerhafte Quellenangabe ist automatisch ein Beweis für KI-Einsatz. Menschen machen ebenfalls Fehler. Aber das Muster ist in solchen Fällen entscheidend. Wenn Titel leicht verändert, Zuständigkeiten vermischt, Jahreszahlen falsch gesetzt und reale Quellen mit überzogenen Behauptungen verbunden werden, erinnert das stark an typische Halluzinationen großer Sprachmodelle.
KI-generierte Quellen: Warum echte Links nicht automatisch echte Belege sind
Ein langer Quellenapparat wirkt seriös. Er signalisiert: Hier wurde recherchiert. Hier gibt es Belege. Hier steht nicht nur Meinung.
Bei KI-generierten Texten kann genau dieser Eindruck täuschen. Sprachmodelle sind gut darin, plausible Strukturen zu erzeugen. Dazu gehören auch Quellenlisten, Endnoten, Studiennamen und Zusammenfassungen. Das Problem ist nicht nur die frei erfundene Quelle. Noch schwieriger sind halbrichtige Quellen.
Eine Quelle kann real existieren und trotzdem die konkrete Aussage nicht tragen. Ein Bericht kann ein echtes Unternehmen nennen, aber dessen Rolle falsch darstellen. Eine Pressemitteilung kann ein KI-Projekt beschreiben, aber keine agentische KI. Ein Tool kann “Agent” heißen, obwohl damit Menschen im Callcenter gemeint sind.
Das macht Quellenprüfung bei KI-Texten mühsam. Es reicht nicht, zu schauen, ob eine Quelle existiert. Man muss prüfen, ob sie genau die Aussage belegt, für die sie verwendet wird.
Warum der KPMG-Fall über eine einzelne KI-Panne hinausgeht
KPMG ist eine der großen Beratungsgesellschaften. Solche Marken haben Gewicht. Wenn ein kleiner Blog ein falsches Beispiel nennt, bleibt der Schaden oft begrenzt. Wenn ein bekannter Beratungsname einen Report veröffentlicht, übernehmen andere Medien, Unternehmen und interne Präsentationen diese Aussagen leichter.
Das ist der eigentliche Verstärker. Ein fehlerhafter KI-Report kann zur Quelle für weitere Artikel werden. Diese Artikel können wiederum in Suchmaschinen, Newsletter, Präsentationen oder KI-Antworten wandern. Aus einer ungeprüften Aussage wird dann eine scheinbar etablierte Tatsache.
In der Gesellschaft entsteht dadurch ein neues Vertrauensproblem. Nicht, weil KI grundsätzlich unbrauchbar wäre. Sondern weil der professionelle Umgang damit oft weniger reif ist als die öffentliche Kommunikation darüber.
Viele Organisationen sprechen inzwischen über Responsible AI, Governance, Human Oversight und Compliance. Der KPMG-Fall zeigt, dass diese Begriffe nur dann etwas bedeuten, wenn sie auch im eigenen Publikationsprozess angewendet werden.
Menschliche Kontrolle darf nicht nur im Vorwort stehen
Die naheliegende Lehre lautet nicht: KI darf nie beim Schreiben helfen. Das wäre zu einfach. KI kann bei Recherchevorbereitung, Strukturierung, Zusammenfassungen und ersten Entwürfen nützlich sein.
Aber je stärker ein Text mit konkreten Fakten arbeitet, desto klarer muss die Kontrollkette sein. Besonders kritisch sind:
- Namen von Organisationen
- konkrete Fallstudien
- Prozentzahlen und Marktgrößen
- Zitate und Quellenangaben
- technische Begriffe wie “agentic AI”
- Aussagen über reale Produkte oder Implementierungen
Diese Punkte dürfen nicht nur plausibel klingen. Sie müssen überprüfbar sein.
Gerade bei großen Organisationen braucht es dafür klare Rollen. Wer hat die Quelle geöffnet? Wer hat geprüft, ob die Quelle die Aussage wirklich trägt? Wer hat die finale Version freigegeben? Und wer ist verantwortlich, wenn ein Report später korrigiert oder zurückgezogen werden muss?
KI verschiebt diese Verantwortung nicht. Sie macht sie sichtbarer.
Wie sich falsche KI-Quellen erkennen lassen
Falsche KI-Quellen sind nicht immer frei erfunden. Oft sind sie schwieriger zu erkennen, weil sie reale Elemente enthalten. Ein echter Report wird mit einer falschen Aussage verbunden. Ein reales Unternehmen wird in einen falschen Kontext gesetzt. Ein vorhandener Link belegt nicht das, was der Text behauptet.
Deshalb sollte man bei KI-generierten Texten nicht nur fragen: Gibt es diese Quelle? Die bessere Frage lautet: Belegt diese Quelle genau diese Aussage?
Praktisch heißt das: Titel, Autor, Datum, Organisation und konkrete Textstelle müssen zusammenpassen. Wenn ein Absatz eine bestimmte Behauptung über ein Unternehmen enthält, muss die Quelle genau diese Behauptung tragen. Nicht eine ähnliche. Nicht eine allgemein passende. Sondern genau diese.
Das ist besonders wichtig bei Reports, Whitepapers und Studien. Diese Dokumente werden oft als sekundäre Belege genutzt. Wenn dort bereits Fehler enthalten sind, können sie sich schnell in weiteren Texten ausbreiten.
FAQ
Warum hat KPMG den KI-Report zurückgezogen?
KPMG hat den Report zu agentischer KI zurückgezogen, nachdem mehrere Fallbeispiele und Quellenangaben als falsch, irreführend oder nicht ausreichend belegbar kritisiert wurden.
Was sind KI-Halluzinationen bei Quellen?
KI-Halluzinationen entstehen, wenn KI-Systeme plausible, aber falsche Informationen erzeugen. Bei Quellen kann das bedeuten, dass Studien, Links oder Fallbeispiele nicht existieren oder eine Aussage nicht belegen.
Was lässt sich aus dem KPMG-Fall lernen?
Der Fall zeigt, dass KI-generierte Texte konsequent geprüft werden müssen. Besonders Namen, Zahlen, Studien, Zitate und Fallbeispiele sollten einzeln verifiziert werden.


