Neben den lizenzrechtlichen Anforderungen stellt die Bereitstellung von Daten unter Open Data eine Reihe technischer Anforderungen, um dem Begriff der Offenheit gerecht zu werden.
Hierbei spielen folgende Punkte eine entscheidende Rolle:
- Repräsentationsform der Datenressourcen (Datenformat, Schnittstelle)
- Auffindbarkeit und Beschreibung der Datenressourcen (Adresse, Metadaten)
- semantische Verknüpfung (Linked Data)
Offene und maschinenlesbare Datenformate bilden die Grundlage für Entwickler von Software. Sie können Dienste entwickeln, die auf offene Inhalte zugreifen, prozessieren und diese für einen bestimmten Zweck ausgeben lassen. Datenveredlern reicht die Veröffentlichung von Daten nicht. Sie müssen Veränderungen an den bestehenden Datensätzen vornehmen und diese auch weiterverkaufen dürfen.
Repräsentationsform der Datenressourcen
Sichergestellt wird dies durch Verwendung offener Industrie-Standards. Eine übergreifende Nutzung von Geodaten ist nur unter Einhaltung von Standards möglich, da diese meist aus verschiedenen Quellen stammen. Sie bilden die Voraussetzung für Interoperabilität zwischen heterogenen Systemen. Datenformate, die offenen Standards entsprechen, sollen gemäß den OGD- Prinzipien bevorzugt werden. Das Open Spatial Consortium (OGC) entwickelt offene Standards im Bereich der raumbezogenen Informationsverarbeitung.
Schnittstellen und Dienste
Geodaten können digital in Form von Downloads (z.B. Shapefiles oder SVG) bereitgestellt werden, per Vollzugriff auf eine Datenbank (z.B. PostgreSQL & PostGIS) oder per offener Schnittstelle. Schnittstellen halten Funktionen eines Systems für andere Systeme oder Programme bereit, um diese auf sie zugreifen zu lassen. Besonders bei Geobasisdaten bietet sich statt eines Downloads die Möglichkeit eines Zugriffs via einer webbasierten, offenen, standardisierten API an. Die Rekombination von Daten verschiedener Quellen und deren Neukombination wird als Mashup bezeichnet. Drittanbieter haben die Möglichkeit die Anwendung mit zusätzlichen Funktionen zu erweitern. Seitens der Benutzer können nach Bedarf ebenfalls Anpassungen vorgenommen werden. Öffentliche Verwaltungen können von dieser Technik, die verhältnismäßig wenig Aufwand und Programmierkenntnisse erfordert, sowohl intern als auch extern profitieren.
Für den Bereich der raumbezogenen Daten eigenen sich die von der OGC empfohlenen Standards, wenn es um ein hohes Maß an Interoperabilität und Herstellerunabhängigkeit geht. Interoperabilität ist die Fähigkeit von Systemen und Maschinen, Informationen korrekt auszutauschen, zu verarbeiten und auszuwerten. Dabei ist zu berücksichtigen, dass Geodaten häufig mit unterschiedlichen Anwendungen zu unterschiedlichen Zwecken erhoben, verarbeitet und gespeichert wurden. Die strukturellen, semantischen und geometrischen Unterschiede zwischen den Daten müssen berücksichtigt werden.
Eine Integration erfolgt dann, wenn die Inhalte sinnvoll vergleichbar gemacht werden können. Für die Öffnung von Geodatenbeständen hieße das nicht zwingend, einen direkten Zugriff auf die Datenbanken zu ermöglichen, sondern ein Konzept von Zugriffsmethoden. Die je nach Anwendungszweck unterschiedlichen Methoden des Zugriffs und der Analyse erfordern ebenfalls verschiedene Schnittstellen. Semantisch und ontologisch bedingte Unterschiede, die sich in der Repräsentationsform bzw. in der Speicherung der Geodatensätze einzelner Fachbereiche widerspiegeln, können mithilfe von Schnittstellen interoperabel gemacht werden.
Auffindbarkeit und Beschreibung der Datenressourcen
Damit Daten durch den Nutzer gefunden werden, sollten sie von gängigen Suchmaschinen indiziert werden können. Dies kann durch die Maschinenlesbarkeit der Daten selbst gewährleistet sein, indem sie ohne Passwortschutz, strukturiert und mit Metadaten versehen werden. Im Falle von Geodaten beschreiben Metadaten Eigenschaften wie Identifikation, Bedeutung, Qualität, räumlichen Bezug, Produktion, Entitäten und Attribute Metadaten werden nach de Lange als solche Angaben verstanden, die zum Nachweis und Zugriff auf Datenbestände erforderlich sind bzw. in formalisierter Form die Beschreibung komplexer Informationen erlauben.
Sie spielen für eine langfristige Werterhaltung eine entscheidende Rolle, da besonders Sammlungen von Rohdaten ohne Metadaten praktisch wertlos sind. Standardisierte Metadaten erleichtern die Datenpflege und verbessern die Vergleichbarkeit von Datenbeständen. Mehrfacherhebungen durch öffentliche Verwaltung können durch einen einfachen Vergleich in entsprechend zugänglichen Katalogen vermieden werden. Metadaten sind für Dokumente auf Open Basis wichtig, für Geodaten sind sie essentiell.
Zur Verbesserung der nachhaltigen Erreichbarkeit von Dateien im Web empfiehlt sich laut Berners-Lee die Verwendung von Cool URIs zur nachhaltigen und eindeutigen Referenzieren einer Ressource. Metadatenkataloge und Datenkataloge sowie die Errichtung von Datenportalen mit spezifischer Suchfunktion dienen ebenfalls der besseren Erreichbarkeit von Datensätzen. Die potentere Form, aus Open Data-Sicht, bildet die Datenbereitstellung von Daten im Web in Form von Linked Data.