Open Web Index

von | 6. August 2019 | Blog, Open Source Software, Projekte

Der Open Web Index ist ein europäischer Ansatz für eine wettbewerbsfähige und datenschützende digitale Infrastruktur. Er zielt darauf ab, eine Grundlage für echten Wettbewerb im Geschäft mit digitalen Plattformen zu schaffen. Die Hauptidee des Open Web Index besteht darin, einen öffentlich finanzierten, globalen, durchsuchbaren Index des Webs einzurichten, der konkurrierenden Unternehmen, Institutionen und zivilgesellschaftlichen Akteuren offen steht.

Ein Web-Index bringt unstrukturierte und heterogene Daten des Internets in eine strukturierte Form. Dies ermöglicht den Aufbau von Internet-Diensten, die diese Daten für verschiedene Nutzungsarten aufbereiten.

Die Trennung des Index und der Dienste ermöglicht es, eine Vielzahl von Diensten, ob als Suchmaschinen oder anderweitig vorhanden, auf einer gemeinsamen Infrastruktur zu betreiben. Die Abbildung zeigt, wie die öffentliche Infrastruktur für das Crawling des Webs, die Indizierung seines Inhalts und die Bereitstellung einer Schnittstelle und einer Anwendungsprogrammierschnittstelle (API) zu den Diensten, die auf dem Index aufbauen, verantwortlich ist. Während die Dienste ihre eigene weitere Indizierung zur Vorbereitung von Dokumenten vornehmen können, wird ein Teil der fortgeschrittenen Indizierung auch von der offenen Infrastruktur bereitgestellt. Da moderne Suchmaschinen in hohem Maße auf Nutzungsdaten angewiesen sind, werden diese Daten (vor allem Suchanfragen, die an den Index weitergeleitet werden) gesammelt und zur Wiederverwendung zur Verfügung gestellt.

zu Open Web Index