Warum die Debatte über KI-Texte zu kurz greift

Zwischen digitaler Hexenjagd und blindem Software-Glauben: Warum Verlage wieder auf echtes redaktionelles Urteilsvermögen vertrauen müssen.

Stellen Sie sich vor, ein Verlag scannt ein anonym eingereichtes Manuskript, die Software schlägt Alarm – und das Buch wird als vermeintliche KI-Fälschung abgelehnt. Das Problem? Der Text stammt von J.K. Rowling. Was wie ein bizarres Zukunftsszenario klingt, entpuppt sich bei genauerem Hinsehen als die logische Konsequenz einer völlig fehlgeleiteten Debatte. Während die digitale Öffentlichkeit Jagd auf vermeintliche Chatbot-Texte macht, übersehen Verlage und Medienhäuser das eigentliche Problem: Die Werkzeuge versagen und die wahre Veränderung der Arbeit beginnt lange vor dem ersten geschriebenen Satz.

Published: 11.6.2026 | Foto / Video: Magnific

In einem Beitrag für das Magazin „Slate“ kritisiert der Journalist Tim Requarth die aktuelle Aufregung um KI-generierte Medieninhalte. Seine zentrale These lautet, dass die Diskussion zu stark auf fertige Texte, Detektionssoftware und öffentliche Verdächtigungen fixiert sei. Dadurch gerate aus dem Blick, dass Künstliche Intelligenz die journalistische Arbeit bereits beeinflusse, bevor überhaupt der erste Satz geschrieben werde.

Als Auslöser nennt Requarth prominente Fälle, in denen Verlage auf KI-Verdachtsfälle reagierten, indem sie etwa Bücher zurückzogen oder die Zusammenarbeit mit Autoren beendeten. Dass das Publikum wissen wolle, ob ein Text von einem Menschen stamme, sei verständlich, da Autorenschaft auf Vertrauen basiere. Er hält die aktuelle Debatte jedoch für zu eng, da sie das Problem lediglich auf das sichtbare Endprodukt reduziere.

Die Macht der Detektoren und der Graubereich

Eine Schlüsselrolle weist Requarth Detektionsunternehmen wie Pangram zu. Hierbei beobachte er ein problematisches Muster: Eine digitale Öffentlichkeit äußere einen Verdacht, Detektoren lieferten die scheinbar objektive Bestätigung und der Druck auf Medienhäuser steige. Zwar bescheinigt Requarth modernen Detektoren eine verbesserte Genauigkeit, doch blieben sie limitiert. Sie funktionierten vor allem dann, wenn Chatbot-Texte unverändert übernommen wurden.

Schwierig werde es im Graubereich, in dem menschliche und maschinelle Arbeit ineinandergreifen – etwa wenn KI zum Vorstrukturieren, Zusammenfassen oder Formulieren genutzt werde. Ein bloßer Prozentwert eines Detektors könne diese feinen Unterschiede nicht sichtbar machen. Zudem bestehe das Risiko von Fehlzuordnungen, weshalb Software niemals allein über berufliche Konsequenzen entscheiden dürfe.

Der wichtigste Einfluss entsteht vor dem Schreiben

Den entscheidenden Punkt sieht Requarth in der vorgelagerten Recherche- und Strukturierungsphase. Wenn eine KI vorab das Material vorsortiere, Quellen gewichte und eine Erzählrichtung nahelege, sei der spätere Text inhaltlich stark maschinell geprägt. Da er vom Journalisten jedoch selbst ausformuliert wurde, schlage kein KI-Detektor an.

Requarth hält daher die gängige Grenze – dass KI vor dem Schreiben akzeptabel sei, beim Schreiben selbst aber als Täuschung gelte – für verfehlt. Diese Haltung schütze lediglich das Gefühl menschlicher Autorenschaft, nicht aber die tatsächliche inhaltliche Unabhängigkeit eines Textes.

Verlegerische Perspektiven: Das Plädoyer gegen die Hexenjagd

Ergänzend zu dieser medienkritischen Perspektive beleuchtet Mark Williams in einem Artikel für The New Publishing Standard (TNPS) die Haltung des Hachette-Chefs David Shelley. Dieser habe sich auf einer Branchenmesse vehement gegen den systematischen Einsatz von KI-Detektoren bei Manuskripteinsendungen ausgesprochen, da dies eine Kultur des Misstrauens zwischen Autoren und Verlagen schaffe.

Williams führt Shelleys Haltung auf eine prägende persönliche Erfahrung zurück: Im Jahr 2011 habe dieser das Manuskript zu The Cuckoo’s Calling von einem vermeintlichen Debütanten namens Robert Galbraith erworben – ohne zu wissen, dass sich dahinter J.K. Rowling verbarg. Shelley habe das Buch rein nach literarischer Qualität beurteilt, was Williams als Paradebeispiel für echtes verlegerisches Urteilsvermögen anführt.

Das mathematische Versagen der Software

Um die Unzuverlässigkeit der Detektoren zu demonstrieren, unternimmt Williams ein Experiment und jagt Rowlings originale Prosa durch sechs gängige KI-Scanner. Das Ergebnis sei paradox: Während einige Tools den Text als rein menschlich einstuften, bewerteten andere ihn mit einer Wahrscheinlichkeit von bis zu 73 Prozent als KI-generiert. Umgekehrt sei echte KI-Massenware von den Systemen oft anstandslos als „menschlich“ durchgewinkt worden.

Williams erklärt dieses fundamentale Versagen mit der Funktionsweise der Software. Diese messe lediglich mathematische Eigenschaften wie:

Perplexität (Unvorhersehbarkeit): Wie überraschend ist die Wortwahl?
Burstiness (Varianz): Wie stark variieren Satzlänge und Satzstruktur?

Das fatale Problem dabei sei, dass hochgradig geschliffene, professionell lektorierte und elegante menschliche Prosa dieselbe statistische Signatur aufweise wie das optimierte Produkt einer KI. Die Tools bestraften somit im Grunde sprachliche Eleganz, formale Präzision und literarisches Können. Zudem warnt Williams vor einer nachgewiesenen Diskriminierung von Nicht-Muttersprachlern, da diese beim Schreiben oft zu sichereren, statistisch unauffälligeren Formulierungen neigten und deshalb überproportional häufig fälschlich beschuldigt würden.

Fazit und Ausblick

Sowohl Requarth als auch Williams plädieren für eine Abkehr vom blinden Glauben an Detektor-Zahlen. Für Medienhäuser und Verlage gelte es, präzisere KI-Richtlinien zu entwickeln, die den kreativen Graubereich anerkennen und zwischen reiner Recherchehilfe und tatsächlicher Textgenerierung unterscheiden. Ein technischer Prozentwert könne eine fundierte redaktionelle Prüfung niemals ersetzen. Am Ende, so resümiert Williams, müsse nicht die Frage im Vordergrund stehen, ob ein Computer jemals einen Satz berührt habe, sondern ob ein menschlicher Autor die volle kreative Kontrolle über das Werk besessen habe.