Offene Kultur in der digitalen Gesellschaft

Linked Open Data

Das Konzept von Linked Data geht auf Berners Lee  zurück. Linked Data (vernetzte Daten) ist ein entscheidender Beitrag zum Semantic Web und eine Kernkomponente von Open Data. Aus dem WWW, dem Netz aus Webseiten, soll das Semantic Web, das Netz aus Daten, entstehen. Das Prinzip von Linked Data ist, vereinfacht ausgedrückt, die Vernetzung von unterschiedlichen Datenbeständen aus heterogenen Quellen. Die Quellen können sich z. B. aus Statistiken, Karten und Publikationen zusammenstellen, die automatisiert kombiniert werden und einen Mehrwert durch einen Erkenntnisgewinn aus den neuen Zusammenhängen generieren. Basis dieses Ansatzes ist eine leichte Adressierbarkeit von strukturierten Datensätzen im Web.

Diese Daten sollen referenzierbar und eindeutig verknüpfbar sein. Das Semantic Web soll im Web verfügbare Ressourcen maschinell (z. B. durch Suchmaschinen) verständlich wie auch für Menschen nutzbar machen. Um dies zu gewährleisten, müssen Ressourcen mit zusätzlichen Informationen angereichert werden, um diese maschinell und sinnvoll in Verbindung bringen zu können. Dabei treten besonders im Bereich der raumbezogenen Daten Probleme der Semantik auf. Bspw. kann ein Objekt unter Krankenhaus oder Spital beschrieben sein.

Diese Problematiken hinsichtlich des Semantic Web und Linked Data sind für den Bereich der öffentlichen Verwaltungen eine enorme Herausforderung, welche noch keinen Einzug in die Tagesordnungspunkte der geodatenhaltenden Stellen gefunden hat. Besonders der öffentliche Sektor verfügt über eine Vielzahl an Datenquellen, die zum Teil bereits öffentlich vorliegen. Werden diese Datenbestände nach den Linked Open Data-Prinzipien publiziert und miteinander verknüpft, entsteht eine einzigartige Möglichkeit, diese als wertvolle Informationsquelle nutzen zu können.

Die Open Data-Standards können als rechtliche Grundlage für die Nutzung und Kombination der im Netz bereitgestellten Daten und die Linked Data-Standards als Maßnahme für die technische Komptabilität zwischen den verteilten Ressourcen verstanden werden.

»Linked Open Data (LOD)« bezeichnet frei verfügbare Daten, die im Internet über einen Uniform Resource Identifier (URI) eindeutig identifiziert und adressiert sind und ebenfalls per URI auf andere Daten verweisen. Die miteinander verknüpften Daten ergeben ein weltweites Netz, das „»Web of Data«„. Um eine möglichst einfache automatische Nutzung der Daten unabhängig von ihrem konkreten Ursprung zu gewährleisten, sollten diese offenen Daten gemäß internationaler »W3C Standards« und nach den „Linked Open Data“ (LOD) Richtlinien im Internet vernetzt werden.

Dies eröffnet die Möglichkeit, diese Daten über Domänen- und Organisationsgrenzen hinweg zu nutzen und durch deren Verknüpfung komplexe Zusammenhänge sichtbar zu machen und zu verstehen. Dabei ergeben sich Mehrwerte und neue Erkenntnisse, insbesondere, sobald Datenbestände miteinander kombiniert werden, die zuvor noch nicht miteinander verknüpft wurden. Strukturierte Datenbestände lassen sich problemlos in LOD Ressourcen konvertieren. In Kombination mit dem »Resource Description Framework (RDF)« zur Repräsentation strukturierter Datenbestände bietet sich eine einfach umzusetzende Möglichkeit, diese Daten aufzubereiten, zu teilen, zu exportieren und zu vernetzen.

Basierend auf diesem Ansatz ist bereits ein Netzwerk miteinander verknüpfter freier Datenbestände entstanden, das aktuell mehr als 25 Milliarden Fakten beinhaltet, die über ca. 400 Millionen Links miteinander verknüpft sind. Diese als „»Linked Open Data Cloud«“ bezeichnete Datenwolke vereinigt populäre Datensätze aus öffentlichen und privaten Beständen des »Semantic Webs«, wie z.B. enzyklopädische Daten (»DBpedia«, »WordNet«), geografische Daten (»GeoNames«, »Open Street Map« und »Linked GeoData« oder bibliografische Daten (»DBLP«, »RDF Book MashUp«). Der „Linked Open Data“ Ansatz ermöglicht es, diese Datenbestände auf einfache Weise über offene Schnittstellen (APIs) in Anwendungen und Softwarewerkzeugen zu nutzen, um so automatisiert komplexe Recherchen, Überwachungen und Berichterstattungen mit geringem Aufwand durchführen zu können.

Photo Credits: CC-BY – SA- Anjeve, Richard Cyganiak on Wikipedia