Open Diffix

von | 17. Mai 2022 | Blog, Free Software, Open Data, Software, Tools

Open Diffix ist ein MPI-SWS-unterstütztes offenes Softwareprojekt zur Entwicklung einer starken, aber nutzbaren Datenanonymisierung. Open Diffix basiert auf der Datenanonymisierungstechnologie Diffix, die in einer Forschungspartnerschaft zwischen der Gruppe von Paul Francis und der Aircloak GmbH entwickelt wurde. Open Diffix hat kürzlich sein erstes Tool, “Diffix for Desktop”, veröffentlicht.

Open Diffix ist ein Projekt, das die Diffix-Anonymisierung kostenlos und offen macht. Im Rahmen des Open Diffix-Projekts werden zwei Diffix-Abfrage-Engine-Implementierungen entwickelt, eine auf der Grundlage von .NET und die andere als PostgreSQL-Erweiterung. Wir haben Diffix for Desktop entwickelt, eine GUI-basierte Anwendung auf der .NET-Abfrage-Engine. Diffix for Desktop zielt auf eine einfache Handhabung ab, während Diffix for PostgreSQL auf eine höhere Komplexität und Skalierung abzielt. Beide sind stark anonym und erfüllen die GDPR-Definition von Anonymität.

Diffix for Desktop wurde mit Blick auf eine extrem einfache Handhabung entwickelt und kann auch von Nicht-Experten verwendet werden, um sensible Daten sicher an die Öffentlichkeit zu bringen. Diffix for Desktop befreit die Benutzer von der Sorge um die Anonymität und ermöglicht es ihnen, sich auf die Datenqualität zu konzentrieren. Diffix’ nutzt Mechanismen, die von nationalen Statistikämtern seit Jahrzehnten verwendet werden: Aggregation, Generalisierung, Rauschen, Unterdrückung und Vertauschung. Es wendet diese Mechanismen bei Bedarf automatisch auf jede einzelne Abfrage an, um das Rauschen zu minimieren und gleichzeitig eine hohe Anonymität zu gewährleisten.

Die von Opemn Diffix verwendetet “K-Anonymität” verwendet Generalisierung und Unterdrückung. Systeme, die auf Differential Privacy basieren, verwenden Rauschen und oft auch Generalisierung. Diffix verwendet alle drei und kombiniert so die Vorteile von k-anonymity und Differential Privacy, ohne sich formal an eines der beiden Modelle zu halten. Dabei orientiert sich Diffix eher an der Vorgehensweise nationaler Statistikämter bei der Anonymisierung. Diffix bietet zwar nicht die mathematischen Garantien von Low-Epsilon Differential Privacy, hat aber auch nicht den Nachteil eines Privacy-Budgets.

https://www.open-diffix.org

Damian Paderta

Damian Paderta

Damian Paderta ist Webgeograph & Digitalberater und beschäftigt sich mit Open Government, Open Data, Open Knowledge, Open Source und Open Science.

 

weitere Artikel

Open Access Network

Open Access Network

Die Plattform open-access.net informiert über das Thema Open Access und bietet praktische Umsetzungshilfen an. open-access.net wurde im Rahmen eines DFG-Projekts kooperativ von der Freien Universität Berlin und den Universitäten Göttingen, Konstanz und Bielefeld...

Open-Science Self-Assessment

Open-Science Self-Assessment

Das Open-Science Self-Assessment R2O hilft bei der Erfassung aktueller Open-Science-Aktivitäten an Hochschulen und unterstützt mit Empfehlungen sowie Best-Practice-Beispielen. Gemeinsam mit einem Team von fünf Open-Science-Expert:innen wurde der Prototyp...