"Hier reicht ‚wahrscheinlich richtig‘ nicht aus"

Michael Justus (Carl Hanser Verlag) und Sarah Nicolin (Verlagsgruppe Beltz) über RAG-Systeme als strategische Chance für Verlage

RAG-Systeme gelten als eine der vielversprechendsten KI-Technologien für die Verlagsbranche – doch zwischen Potenzial und Praxis liegen oft erhebliche Hürden. Im Gespräch mit Sarah Nicolin, Leiterin Geschäftsfeldentwicklung Digital Business der Beltz Verlagsgruppe, und Michael Justus, Verlagsleiter Fachbuch beim Carl Hanser Verlag, wird deutlich, wo diese Hürden liegen und wie sie sich überwinden lassen. Nicolin hat als Mitautorin des Branchenleitfadens  „How to RAG“ die strategischen und rechtlichen Dimensionen von RAG-Projekten durchdacht; Justus kann mit plastics.ai bereits auf ein produktives System im Markt verweisen. Gemeinsam geben sie Einblick in die technischen Fallstricke, die Frage Make-or-Buy und die Bedingungen, unter denen kuratierte Verlagsinhalte gegenüber generischen Chatbots tatsächlich punkten können.

Herr Justus, mit plastics.ai hat Hanser bereits ein RAG-System im Markt. Was war die größte Hürde – Technik, Monetarisierung oder interne Akzeptanz?

Justus: Die höchste Hürde ist die Monetarisierung. Ein RAG-System ist ein komplexes B2B-Softwareprodukt, für das ein Verlag ganz neue Vertriebsstrukturen aufbauen muss. Außerdem wird man mit zum Teil weitreichenden Individualisierungswünschen und Sicherheitsanforderungen von Industriekunden konfrontiert. Sie sind zu erfüllen, bevor die ersten Euros fließen.

 

Frau Nicolin, der Leitfaden zeigt verschiedene RAG-Szenarien von B2B-Fachinformation bis zur Leser-Community. Wie entscheiden Sie, welches Szenario zu welchem Programmbereich passt – und wo liegt das größte Potenzial für Bildungsverlage?

Nicolin: Der Leitfaden beschreibt drei Szenarien – Evolution, Hybrid und Disruption. Für einen Verlag bedeutet die Auseinandersetzung mit RAG jedoch nicht zuerst die Entscheidung für eines dieser Szenarien, sondern die Klärung strategischer Fragen:

·         Wo entsteht für unsere Zielgruppen realer Mehrwert?

·         Welche Probleme können wir lösen?

·         Wo verteidigen wir mit kuratierten Inhalten eine Rolle, die generische KI nicht übernehmen kann?

Für unsere Programmbereiche sehe ich, dass wir uns in den beschriebenen Szenarien aktuell ausgeprägt in Richtung der Hybridmodelle bewegen. In unseren Fachprogrammen gehen wir von einer geringen Fehlertoleranz aus. Unsere Zielgruppen arbeiten mit Menschen, mit Diagnosen, mit Bildungslaufbahnen. Hier reicht „wahrscheinlich richtig“ nicht aus. Genau hier liegt aber die Chance für uns als Verlage und in besonderer Weise mit dem Einsatz neuer Technologie. RAG ermöglicht es, die Geschwindigkeit und Dialogfähigkeit generativer KI mit der Verlässlichkeit kuratierter Inhalte zu verbinden. Das ist keine Spielerei, sondern kann eine strategische Weiterentwicklung unserer bestehenden Angebote bedeuten – vorausgesetzt, Qualitätssicherung und Quellenbezug bleiben zentral.

Im Publikumsbereich ist die Lage anders. Problemlösung und persönliche Entlastung werden bereits heute zunehmend über Chatbots gesucht. Als Verlage befinden wir uns damit in einem sich verändernden Wettbewerbsumfeld. Der Zugang zu kompakten, schnell verfügbaren Antworten kann damit in einigen Zielgruppen zum kritischen Erfolgsfaktor werden. Mithilfe von RAG-Technologie eröffnen sich für Verlage Möglichkeiten, Inhalte besser auffindbar zu machen, Fragen dialogisch zu beantworten, Leser:innen tiefer in unsere Inhalte zu führen.

„Der richtige Ansatz ist klar: Legal by Design“

Frau Nicolin, welche rechtlichen Aspekte sollten bei der RAG-Produktentwicklung von Anfang an mitgedacht werden?

Nicolin: Der richtige Ansatz ist aus meiner Sicht klar: Legal by Design. Das beginnt bereits bei der Konzeption. Zunächst geht es um das Urheberrecht und die Frage der Nutzungsrechte. Wir müssen klären, ob die bestehenden Verlagsverträge die Nutzung der Werke in einem RAG-System abdecken. Dabei stellt sich unter Umständen die Frage nach einer neuen oder bisher unbekannten Nutzungsart. Gerade bei älteren Verträgen ist hier eine sorgfältige Prüfung notwendig. Hinzu kommt die Frage der Honorierung. Wenn Inhalte in einem RAG-System systematisch genutzt werden, muss transparent geregelt sein, wie Autor:innen beteiligt werden. Das ist nicht nur eine juristische, sondern auch eine partnerschaftliche Frage. Ein weiterer zentraler Bereich ist der Datenschutz. Sobald personenbezogene Daten verarbeitet werden – etwa bei personalisierten Anwendungen oder internen Systemen – greifen die Anforderungen der DSGVO. Hier stellen sich konkrete Fragen:

·         Wo wird gehostet?

·         Werden Daten an Dritte übermittelt?

·         Wird ein US-LLM eingesetzt?

·         Wie lange werden Anfragen gespeichert?

Diese Fragen müssen vor der Produktentscheidung beantwortet werden, nicht danach. Hinzu kommen regulatorische Anforderungen auf europäischer und internationaler Ebene – insbesondere durch den AI Act. Ein weiterer wichtiger Punkt ist die Quellenanzeige. Sie ist nicht nur vertrauensbildend, sondern auch aus urheberrechtlicher Sicht relevant, um Werkintegrität und Zitierfähigkeit sicherzustellen. Legal by Design heißt deshalb: Rechteklärung, Datenschutz, Transparenzpflichten und Vergütungsmodelle gehören in die Produktarchitektur – nicht in die Fußnote.

 

Herr Justus, der Leitfaden betont den Qualitätsvorsprung gegenüber generischen Chatbots als Kernvorteil. Wie stellen Sie bei plastics.ai sicher, dass dieser Anspruch auch in der KI-Antwort ankommt – und wie messen Sie das?

Justus: Erste Voraussetzung ist die Qualität des Verlagscontents. Das gilt sowohl für die inhaltliche Korrektheit und Aussagefähigkeit als auch für die strukturelle Konsistenz. Dann muss die Verarbeitung des Contents durch das LLM von jemandem gesteuert werden, der von diesem Content etwas versteht. Das gilt zum Beispiel für das Chunking, die Systemprompts oder die Steuerung des Rankings der Antworten. Und dann sollte die damit erreichte Qualität für Nutzer:innen nachweisbar gemacht werden, indem die dem Chat zugrunde liegenden Quellen angezeigt werden. Vor dem Launch von plastics.ai standen umfangreiche Tests durch Kunststofftechnik-Experten. Erst nach diesen Tests haben wir unser Qualitätsversprechen abgegeben. Es finden aber weiterhin laufend Vergleichstests mit generischen Chatbots statt. Dabei stützen wir uns auf Musterfragen von Fachleuten und die etablierten Qualitätskriterien für Software: Validität, Reproduzierbarkeit, Vollständigkeit usw. Für diese Kriterien gibt es KPIs. Die Vergleichstests haben wir zunächst manuell vorgenommen. Inzwischen finden sie automatisiert statt – mithilfe von KI.

 

Das komplette Interview ist im KI-Briefing des dpr (Ausgabe 60) zu lesen. Hier weitere Infos.

sarah-nicolin_(c)Beltz Verlagsgruppe

Nach Stationen in einer Agentur und bei der Frankfurter Buchmesse (Internationale Abteilung) war Sarah Nicolin beim internationalen Musikverlag Schott Music tätig. Dort verantwortete sie zunächst die Webshops und später als Digital Media Managerin die Entwicklung digitaler Produkte. 2013 wechselte sie zum Campus Verlag nach Frankfurt und arbeitete in verschiedenen Funktionen im Digitalvertrieb. Seit 2019 ist sie in der Geschäftsfeldentwicklung Digital Business tätig. 2024 übernahm sie die Leitung der Abteilung Geschäftsfeldentwicklung Digital Business der Beltz Verlagsgruppe in Weinheim.

Foto:Beltz Verlagsgruppe

Michael Justus_(c)_Katharina Marx

Michael Justus ist studierter Volkswirt und arbeitete zunächst als Lektor und dann für mehr als zehn Jahre als Geschäftsführer für den Wirtschafts-Fachverlag Schäffer-Poeschel in Stuttgart, wo er seit 1992 auch Verantwortung für das Digital Publishing übernahm. Im Jahre 2002 wurde er zusätzlich Geschäftsführer beim geisteswissenschaftlichen Verlag J.B. Metzler und im Jahr 2008 kaufmännischer Geschäftsführer des S. Fischer Verlags in Frankfurt am Main. Seit 2018 ist er Verlagsleiter Fachbuch beim Carl Hanser Verlag und verantwortet beim Hanser Fachverlag auch das Business Development. 
Foto: Carl Hanser Verlag.