Gestaffelte Offenheit: Die NOODL-Lizenz und die Frage nach gerechtem Teilen
Wenn ein Datensatz unter einer offenen Lizenz steht, gelten für alle Nutzerinnen und Nutzer dieselben Bedingungen – für die Forscherin in Nairobi ebenso wie für den Technologiekonzern mit eigener Recheninfrastruktur. An dieser formalen Gleichbehandlung setzt eine Debatte an, die die europäische Denkfabrik Open Future 2020 unter dem Begriff „Paradox of Open“ zugespitzt hat: Gleiche Rechte führen unter ungleichen Voraussetzungen zu ungleichen Ergebnissen. Wer über Kapital, Rechenleistung und Marktzugang verfügt, kann offene Ressourcen schneller verwerten als jene, die sie bereitstellen.
Eine Lizenz mit Abstufungen
Die Nwulite Obodo Open Data License (NOODL) ist ein Versuch, dieser Asymmetrie zu begegnen. Entwickelt haben sie Dr. Chijioke Okorie und Dr. Melissa Omino vom Centre for Intellectual Property and Information Technology Law (CIPIT) der Strathmore University in Nairobi, in Zusammenarbeit mit afrikanischen Sprachgemeinschaften. Anlass war die Beobachtung, dass Sprachdaten zwar in Afrika gesammelt, die darauf aufbauenden KI-Werkzeuge jedoch andernorts entwickelt und vermarktet werden.
NOODL baut auf Creative Commons auf, ergänzt das Modell aber um eine Staffelung der Pflichten nach geografisch-ökonomischer Lage. Für Nutzer*innen aus Ländern, die die Weltbank nicht als einkommensstark einstuft, gelten permissive Bedingungen. Für Nutzer*innen aus einkommensstarken Ländern tritt eine Pflicht zum value or benefit sharing hinzu – ein Beitrag an die datengebende Gemeinschaft, der nicht zwingend finanziell sein muss, sondern etwa in Infrastrukturzugang, Zusammenarbeit oder Capacity-Building bestehen kann. Eine generelle Beschränkung kommerzieller Nutzung enthält die Lizenz nicht; die umverteilende Wirkung liegt im Benefit-Sharing. Attribution und Share-Alike bleiben erhalten.
Verschiedene Lesarten
Omino versteht die Differenzierung nicht als Diskriminierung, sondern als Herstellung eines faireren Ausgangspunkts. In ihrer Argumentation ist Sprache Kultur und damit gemeinschaftlich getragen – kein Rohstoff, der sich beliebig fördern lässt. Erstmals angewandt wurde NOODL auf das DhoNam-Sprachdatenset für das kenianische Dholuo, dessen Aufbau Dr. Lilian Wanzare am Maseno Center for Applied Artificial Intelligence leitete; die beteiligte Gemeinschaft entschied in Workshops selbst über die Lizenzwahl.
Alek Tarkowski ordnet NOODL in seinem für Mozilla und GIZ erstellten Bericht „An experiment in equitable data licensing: promise and limits„ in die breitere Diskussion um Commons-basierte Datengovernance ein. Er zieht eine Parallele zum Copyleft: So wie AGPL und die GPLv3 zusätzliche Pflichten einführten, um Offenheit zu sichern statt sie zu beschneiden, lasse sich auch NOODL als Mechanismus lesen, der die Allmende schützt („commons-based protectionism“).
Widerspruch kam ausgerechnet aus dem Lager der Offenheits-Bewegung, die in einer abgestuften Lizenz die Gefahr einer Einhegung des Gemeinguts sieht. Auch über die Trennlinie selbst wird gestritten: Das Forschungslabor Lelapa.ai schlug eine Unterscheidung zwischen Afrika und dem Rest der Welt vor und entwickelte mit der Esethu-Lizenz eine eigene, von NOODL abgeleitete Variante.
Implikationen der Lizenz
Den möglichen Wirkungen stehen ungelöste Fragen gegenüber. Befürworter verweisen auf den Rückfluss an die Gemeinschaften, deren Sichtbarkeit als Akteure und die Möglichkeit kontextsensibler Lösungen jenseits des Schemas „offen oder geschlossen“. Vorläufer wie die Kaitiakitanga-Lizenz der neuseeländischen Māori-Organisation Te Hiku Media zeigen, dass solche Ansätze nicht neu sind.
Offen bleibt die Durchsetzbarkeit: Wie lässt sich Benefit-Sharing kontrollieren, und welche Handhabe haben Gemeinschaften bei Verstößen? Hinzu kommen die Komplexität gegenüber zwei Jahrzehnten eingeübter CC-Praxis, ein noch wenig ausgearbeitetes Verfahren zur Festlegung der Gegenleistung sowie eine konzeptionelle Lücke – die Pflichten für einkommensstarke Länder erfassen China nicht, obwohl dort bedeutende KI-Unternehmen sitzen. NOODL ist bislang auf einen einzigen Datensatz angewandt.
Damit verweist die Lizenz weniger auf eine Lösung als auf eine Verschiebung der Fragestellung: nicht mehr nur, ob geteilt wird, sondern zu welchen Bedingungen und zu wessen Nutzen.
Quellen

