CommonsDB

von Damian Paderta | 3. März 2026 | Blog, Open Data, OpenGLAM, Projekte

Die Frage, ob ein digital verfügbares Werk frei nachgenutzt werden darf, lässt sich in der Praxis oft nicht zuverlässig beantworten. Fehlende, inkonsistente oder schlicht nicht maschinenlesbare Rechtsangaben erzeugen strukturelle Unsicherheit für Kulturerbe-Institutionen, Plattformbetreiber und zunehmend auch für Akteure im Bereich des maschinellen Lernens. CommonsDB ist ein Versuch, diese Lücke durch technische und rechtliche Infrastruktur zu schließen.

Urheberrechtlich relevante Inhalte im digitalen Raum sind durch ein grundlegendes Informationsproblem gekennzeichnet: Weder der Rechtsstatus einzelner Werke noch die Identität der Rechteinhaber:innen sind aus den Werken selbst ableitbar. Dies gilt insbesondere für ältere Bestände in Kulturerbe-Institutionen sowie für Werke, deren Schutzfrist abgelaufen ist und die sich damit in der Gemeinfreiheit befinden, ohne dass dies verlässlich dokumentiert wäre.

CC-Lizenzen und verwandte Rechtsinstrumente lösen dieses Problem partiell, indem sie standardisierte Nutzungsrechte vergeben. Doch selbst lizenzierte Werke sind im digitalen Raum oft nur schwer auffindbar oder verlässlich identifizierbar, zumal ein und dasselbe Werk in unterschiedlichen Formaten und auf unterschiedlichen Plattformen kursiert, ohne dass eine persistente Verknüpfung mit seinen Rechtsinformationen existiert. CommonsDB setzt auf der Ebene der Auffindbarkeit und Verifizierbarkeit von Rechtsinformationen an.

Hintergrund

Die konzeptuelle Grundlage für CommonsDB bildet ein White Paper von Paul Keller und Felix Reda, das 2021 im Auftrag von Open Future erschien. Darin wurde die Einrichtung eines öffentlichen Repositoriums für gemeinfreie und offen lizenzierte Werke vorgeschlagen. Das Europäische Parlament griff diesen Impuls auf und beauftragte die Europäische Kommission mit der Finanzierung eines entsprechenden Pilotprojekts. CommonsDB ist die institutionalisierte Antwort auf diesen Auftrag. Das Projekt wird von Open Future geleitet, einer zivilgesellschaftlichen Organisation, die sich auf Digital-Commons-Politik spezialisiert hat und läuft in Kooperation mit der Europeana Foundation, Wikimedia Sverige, dem Institut für Informationsrecht (IViR) der Universität Amsterdam sowie dem Technologieanbieter Liccium.

Standards & Technik

Der technische Kern von CommonsDB basiert auf drei ineinandergreifenden Komponenten:

International Standard Content Code (ISCC). Der ISCC ist ein offener Standard zur inhaltsbasierten Identifikation digitaler Medien. Anders als dateibasierte Identifier (z. B. Dateiname oder Hash) wird der ISCC deterministisch aus dem Medieninhalt selbst abgeleitet und ist damit formatunabhängig stabil. Ein Bild bleibt unter seinem ISCC identifizierbar, unabhängig davon, ob es als JPEG, PNG oder in einer anderen Auflösung vorliegt. Dies ist eine wesentliche Voraussetzung für ein dezentrales, interoperables Registry.

Verifiable Credentials. Rechtsinformationen werden nicht als bloße Metadatenfelder gespeichert, sondern als kryptographisch signierte, verifizierbare Behauptungen („Verifiable Credentials“ gemäß W3C-Standard). Damit lässt sich die Provenienz einer Rechtsangabe technisch nachvollziehen: Wer hat diese Deklaration erzeugt, wann, und auf welcher Grundlage?

Föderierte Architektur und öffentliche APIs. CommonsDB ist nicht als zentralisierte Datenbank konzipiert, sondern als föderiertes System, in dem autorisierte „Data Suppliers“, darunter Europeana und Wikimedia Commons Deklarationen in das Registry einspeisen. Der Zugang zu den aggregierten Daten erfolgt über öffentliche APIs, sodass Dritte (Plattformen, Repositorien, Softwareentwickler:innen) Rechtsinformationen programmatisch abrufen und in eigene Systeme integrieren können.

Delegierten Konfliktlösung statt Schiedsinstanz

Ein Problem bei verteilten Registrys ist der Umgang mit widersprüchlichen Angaben, etwa wenn zwei Datenbereitsteller für dasselbe Werk unterschiedliche Rechtsangaben deklarieren. CommonsDB verfolgt hier ein Modell der „delegierten Konfliktlösung“: Das System detektiert Divergenzen und signalisiert diese an die betreffenden Datenbereitsteller zurück, ohne selbst als Schiedsinstanz aufzutreten. Die Verantwortung für die Korrektur verbleibt bei den Institutionen, die über den notwendigen Kontext verfügen. Dieses Prinzip bewahrt die Datenprovenienz und ist mit einer dezentralen Governance-Philosophie kompatibel.

KI-Training und Compliance

CommonsDB ist nicht allein als Infrastruktur für das Kulturerbe konzipiert, sondern beinhaltet explizit auch die Schnittstelle zwischen offenem Wissen und KI-Entwicklung. Zwei Funktionen stehen dabei im Vordergrund: Erstens soll das Registry maschinenlesbare Informationen darüber bereitstellen, welche Werke für das Training von KI-Systemen genutzt werden dürfen und welche nicht. Damit würde eine technische Grundlage für die Umsetzung von Opt-out-Mechanismen geschaffen, wie sie etwa die EU-KI-Verordnung und der AI Act im Zusammenspiel mit dem Urheberrecht erfordern. Zweitens zielt CommonsDB darauf ab, Standards für die KI-Trainings-Compliance zu entwickeln: also normative Referenzpunkte, anhand derer Trainingsanbieter nachweisen können, dass sie Rechte im Einklang mit den anwendbaren Regelwerken genutzt haben. Beide Funktionen sind noch im Entwicklungsstadium.

-> zu commonsdb.org