On the trade-off between privacy and utility in statistical data analysis
- In dieser Arbeit beschäftigen wir uns mit dem Zielkonflikt, der bei der Durchführung genauer statistischer Analysen sensibler Daten unter starken Datenschutzgarantien entsteht. Wir konzentrieren uns dabei auf das Paradigma der Differential Privacy (DP) und betrachten eine Reihe von herausfordernden Problemen im Zusammenhang mit Datenanalyse und maschinellem Lernen. Wir betrachten das Problem der Veröffentlichung von ganzzahligen Partitionen unter DP und beweisen eine untere Schranke des Minimax-Risiko für jeden Mechanismus, der DP erfüllt. Wir formulieren allgemeine Bedingungen, unter denen der Exponentialmechanismus bezüglich des erwarteten Fehlers beweisbar optimal ist. Wir schlagen einen generischen Mechanismus für die Veröffentlichung von Funktionen unter DP vor. Schließlich betrachten wir ein verteiltes Modell, bei dem sich die Nutzer der Datenbank nicht auf eine vertrauenswürdige zentrale Einheit verlassen können und daher selber für den Schutz ihrer Daten verantwortlich sind.
Author: | Francesco AldàGND |
---|---|
URN: | urn:nbn:de:hbz:294-57889 |
Referee: | Hans Ulrich SimonORCiDGND, Alexander MayORCiDGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2018/06/28 |
Date of first Publication: | 2018/06/28 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Mathematik |
Date of final exam: | 2017/12/15 |
Creating Corporation: | Fakultät für Mathematik |
GND-Keyword: | Datenanalyse; Maschinelles Lernen; Algorithmische Lerntheorie; Randomisierter Algorithmus; Datenschutz |
Institutes/Facilities: | Lehrstuhl Mathematik & Informatik |
Dewey Decimal Classification: | Naturwissenschaften und Mathematik / Mathematik |
faculties: | Fakultät für Mathematik |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |