Die deutsche Übersetzung der “Ten Principles for Opening Up Government Information” Open Government Arbeitsgruppe. Die zehn Prinzipien bilden die Maximalforderung an offene Daten der öffentlichen Verwaltung:
1. Vollständigkeit – Staatliche veröffentlichte Daten sollen dem Anspruch genügen, möglichst vollständig zu sein, und die ganze Spannweite an Daten beinhalten, die zu einem Thema erhoben und verarbeitet wurden. Dies beinhaltet auch die Veröffentlichung von Primärdaten (im Rahmen des Datenschutzgesetzes) inklusive der dazugehörigen Metadaten, sowie Formeln von Berechnung der Daten.
2. Primärquellen – Die vom Staat veröffentlichten Datensätze sollen Primärquellen sein, um die Nachprüfbarkeit seitens der Nutzer zu gewährleisten. Weiterhin sollen, ähnlich wissenschaftlichen Arbeiten, die Art der Datenerfassung sowie die genuinen Quellen der veröffentlichten Informationen publiziert werden.
3. Zeitliche Nähe – Die Veröffentlichung der Daten aus Regierung und öffentlicher Verwaltung sollte so zeitnah wie möglich geschehen. Besonders nützlich bei Daten, deren Gebrauch eine hohe Aktualität fordert, wären Updates in Echtzeit.
4. Leichter Zugang – Der Zugang zu amtlichen Datensätzen aller Art sollte so leicht wie möglich sein, sei es in physischer oder elektronischer Form. Ein erschwerter physischer Zugang liegt dann vor, wenn die Notwendigkeit besteht, persönlich an einem bestimmten Ort vorstellig zu werden oder das postale Einreichen von Anfragen vornehmen zu müssen, um an die Daten zu kommen. In elektronischer Form liegt ein erschwerter Zugang u.a. dann vor, wenn browserorientierte Technologien verwendet werden wie z.B. Flash, Javascript, Cookies oder Java applets. Die Daten sollten zudem auch in ihrer Gesamtform heruntergeladen (Bulk Access) werden und durch angegebene Prüfsummen (checksum) validiert werden können. Ein weiterer Aspekt ist die Auffindbarkeit der Daten: Die veröffentlichten Daten müssen mit Metadaten beschrieben werden und indizierbar sein, um von Suchmaschinen gefunden zu werden. Diese Anforderungen sind abhängig von der zweckmäßigen Repräsentationsform der Daten. Weiterhin fällt unter diesen Punkt die Zugänglichkeit für Menschen mit Behinderungen (Barrierefreiheit) und, falls möglich, die Verwendung mehrerer Sprachen (deutsch, englisch etc.).
5. Maschinenlesbarkeit – Unter der Maschinenlesbarkeit von Daten wird das Format verstanden, in dem Daten abgespeichert worden sind. In bestimmter Form sind Dateien maschinell leichter zu verarbeiten. Diese etablierten Formate sollen bevorzugt gebraucht werden. Weiterhin sollten für Fachdaten Dokumentationen bereitliegen, die sich auf deren fachliche Verwendung beziehen.
6. Diskriminierungsfreiheit – Die Diskriminierungsfreiheit bedeutet, dass keine Personen durch künstliche Restriktionen von der Benutzung der Daten ausgeschlossen werden. Dies wäre z.B. der Fall wenn die Daten nur über eine Registrierung, eine Mitgliedschaft bzw. ein autorisiertes Login abrufbar sind oder nur mit dezidierten Anwendungen auf sie zugreifen können. Jede Person soll zu jeder Zeit auf die Daten zugreifen, ohne Auskunft über ihre Identität oder sonstige Rechtfertigungen geben zu müssen.
7. Verwendung offener Standards – Die Daten sollen bevorzugt in Formaten oder Schnittstellen bereitgestellt werden, welche als offen gelten, um die Unabhängigkeit von privatwirtschaftlichen Unternehmen zu gewährleisten.
8. Lizenzierung – Die öffentlichen Daten sollten ohne Nutzungsbeschränkungen allgemein und frei zu Verfügung stehen. Lizenzen sollten einfach und knapp gehalten werden. Die CC0-Lizenz bietet sich hier an.
9. Dauerhaftigkeit – Die Daten sollten nachhaltig bereitgestellt werden. Nachhaltig meint, dass die Daten dauerhaft in Archiven zur Verfügung gestellt werden. Aktualisierungen oder Änderungen müssen nachvollziehbar sein. Hierzu eignet sich eine Versionskontrolle der Dateien (z. B. Apache Subversion). Informationen, die als Datenstrom versendet werden und nicht archiviert werden, sind in diesem Zusammenhang eine schlechte Wahl.
10. Nutzungskosten – Kommerzielle Nutzung sollte ebenso wie private gebührenfrei sein. Für Daten, die ohnehin zu Regierungszwecken erhoben werden, macht eine gebührenfinanzierte Nutzung, und sei die Gebühr noch so gering, kaum Sinn und vergrößert den Kreis derer, die von diesen Daten ausgeschlossen werden.