Vom Scraper zum Gescrapten

Sind die Google-Ergebnisse Allgemeingut oder schützenswert? Von Corina Lingscheidt

„Google ist das Internet“ – so pointiert liest man es gelegentlich im Netz, manchmal im Scherz, manchmal ernst gemeint. Doch was, wenn dieses vermeintliche Allgemeingut plötzlich nicht mehr frei zugänglich ist? Genau diese Frage wirft der jüngste Rechtsstreit zwischen Google und dem Datenanbieter SerpApi auf – ein Konflikt, der weit über technische Details hinausgeht und grundlegende Fragen zum Datenzugang, Urheberrecht und zur Informationsfreiheit berührt.

Am 19. Dezember 2025 hat Google eine Klage gegen die US-Firma SerpApi eingereicht. Der Vorwurf: SerpApi habe systematisch die Suchergebnisse von Google „gescraped“, also automatisch ausgelesen, und diese Daten (darunter auch Elemente, die Google von Dritten lizenziert) an zahlende Kunden weiterverkauft. Laut Klageschrift nutzte SerpApi Hunderte Millionen automatisierter Anfragen und umging dabei technische Schutzmaßnahmen wie das 2025 eingeführte SearchGuard-System, das genau solchen Zugriff verhindern soll.

Was klingt wie ein juristischer Kleinkrieg in einer Nische, ist tatsächlich symptomatisch für einen zentralen Konflikt der digitalen Welt: Wer darf auf welche Daten zugreifen – und unter welchen Bedingungen?

Google vs. SerpApi: Zwischen Open-Data-Idealismus und proprietären Schutzinteressen

Aus Sicht von Google handelt es sich bei den Suchergebnissen nicht um beliebig reproduzierbare öffentliche Informationen, sondern um ein geistiges Produkt, das erhebliche Investitionen und auch Lizenzkosten vereint: Suchalgorithmen, Indexierung, Lizenzvereinbarungen mit Content-Anbietern, Echtzeit-Daten aus Maps, Shopping-Boxen, Knowledge Panels: All das ist nicht „im freien Web verstreutes Allgemeingut“, sondern gepoolte und kuratierte Information mit hohem wirtschaftlichen Wert.

Google argumentiert, dass SerpApi nicht nur klassische öffentlich zugängliche Daten extrahiert habe, sondern auch Inhalte, die Google lizenziert. Und: Die verwendeten Scraping-Methoden hätten dabei Sicherheitsmechanismen umgangen und damit Websites und Rechteinhabern die Möglichkeit genommen, selbst über den Zugang zu ihren Inhalten zu entscheiden.

SerpApi hingegen sieht in dem Vorgehen einen Angriff auf die Idee eines offenen Internets. In einer Stellungnahme argumentiert das Unternehmen, die Daten seien öffentlich sichtbar und damit grundsätzlich zugänglich, was eine Nutzung durch Dritte rechtfertige. Die von SerpApi erfassten Daten seien identisch mit den Informationen, die jeder Nutzer ohne Anmeldung über einen normalen Browser einsehen könne. SerpApi argumentiert, dass das bloße Zugänglichmachen bereits verfügbarer Daten der Innovationsfreiheit diene.

Der sich anbahnende Rechtsstreit berührt zwei konkurrierende Weltbilder: das offene Netz auf der einen Seite und die Kontrolle durch Plattformen auf der anderen Seite.

Beide Positionen haben ihre Berechtigung: Ein uneingeschränkter automatisierter Zugang zu Daten kann Innovation beflügeln – etwa für Forschung, Ranking-Tools oder neue KI-Modelle. Andererseits kann der Verlust von Kontrolle über Inhalte dazu führen, dass Urheber und Plattformen kein Einkommen mehr erzielen oder keine Kontrolle über die Nutzung ihrer Inhalte behalten.

Konsequent fürs Scrapen zahlen?

Ein möglicher Ausweg aus diesem Dilemma könnte ein stärker regulierter, fairer Zugang zu Such- und Web-Daten sein – etwa in Form lizenzierter APIs, die unter klaren Bedingungen verfügbar sind. Solche Zugänge könnten Transparenz und Nutzbarkeit von Daten für Entwickler und Forscher fördern, gleichzeitig aber sicherstellen, dass Inhalte nicht ungefragt kommerziell weiterverkauft werden und dass Urheber für die Nutzung ihrer Daten angemessen entlohnt oder anerkannt werden.

Sitzt Google im Glashaus?

Die Auseinandersetzung wirft weitergehende rechtliche Fragen auf: Besitzt Google überhaupt Rechte an den Inhalten, die in den Suchergebnissen angezeigt werden? Für bestimmte Elemente (etwa Bilder in Knowledge Panels) hat Google nach eigenen Angaben entsprechende Lizenzen erworben. Unklar bleibt jedoch, wie es sich mit Inhalten verhält, die Google von externen Websites crawlt. Mit der Mehrheit dieser Seitenbetreiber bestehen keine vertraglichen Vereinbarungen; die Inhalte werden dennoch abgerufen, verarbeitet und in eigene Produkte integriert.

Dass ausgerechnet Google sich auf dem Klageweg gegen das Scrapen von Informationen wehrt, ist daher für Websitebetreiber verwunderlich. Spätestens seit der Einführung der AI Overviews in den SERPs beschweren sich schließlich mehr und mehr Content-Anbieter darüber, dass Google urheberrechtlich geschützte Informationen absaugen würde, ohne dafür zu zahlen.

In diesem Zusammenhang betont Google wiederum regelmäßig, dass man per Anweisung in der robots.txt durchaus sein Opt-out zeigen könnte, das dann auch beachtet werden würde. Diesen Weg wagen sich viele Online-Publisher jedoch nicht zu gehen, da sie in der Folge den kompletten Ausschluss aus den Suchergebnissen und damit noch mehr Reichweitenverlust fürchten.

So stellt sich die Frage, ob für Google andere Regeln gelten bzw. ob ein wirtschaftlich erzwungenes Opt-in zum Scraping (wie es viele Website-Betreiber Google geben) einen moralisch höheren Wert hat als gar keines wie im Fall von SerpApi, die sich „nur“ auf das offene Web berufen. Ein spannender Rechtsstreit, der durchaus wegweisend sein dürfte.

news.de-Corina-Lingscheidt

Corina Lingscheidt ist seit über 10 Jahren als Geschäftsführerin in der Medienbranche aktiv. Unter der Dachmarke der MM New Media GmbH betreibt die studierte Journalistin und Psychologin mit ihrem Team u. a. die reichweitenstarken Websites news.de, unternehmer.de und qiez.de. Dabei setzt sie auf eine hybride Redaktion und ergänzende automatisierte Nachrichtenerstellung. Ihre Themen sind: Online-Medien, KI und New Work.