DSGVO-konforme Testdaten durch Synthetic Data sichern — Synthetic Data

Autor: Roman Mayr

Synthetic Data – kompakt erläutert.

Synthetic Data ·

Kernaussage: Synthetic Data ermöglicht es KMUs, DSGVO-konforme Testdaten zu erzeugen, ohne auf echte Kundendaten zurückzugreifen.

Was sind Synthetic Data?

Synthetic Data sind künstlich generierte Daten, die auf realen Datenmustern basieren, jedoch keine direkten Angaben zu echten Personen enthalten. Diese Datenreplikate sind essenziell für KMUs, die authentische und gleichzeitig datenschutzkonforme Testdaten benötigen. Der Vorteil liegt darin, dass sie in verschiedenen Anwendungen wie Softwaretests oder Datenanalysen realistische Ergebnisse liefern können, ohne die Datenschutzbestimmungen zu verletzen.

Bedeutung für KMUs

Für KMUs, die ihre Softwareanwendungen oder internen Prozesse testen wollen, stellt sich die Herausforderung, dabei keine realen Personendaten zu verwenden, um gegen die DSGVO zu verstossen. Synthetic Data bieten eine Lösung, indem sie den Unternehmen erlauben, ohne rechtliche Risiken solche Tests durchzuführen. Ein Beispiel ist ein KMU im Finanzsektor, das seine Applikationen mit typischen, aber anonymisierten Transaktionsdaten prüfen kann.

Typische Fehler bei der Erzeugung von Synthetic Data

Ein häufiger Fehler ist die Verwendung von unzureichend anonymisierten Daten als Basis für die synthetischen Exemplare. Dies kann korrigiert werden, indem zunächst ein gründliches Anonymisierungsverfahren durchgeführt wird, bevor Daten als Grundlage verwendet werden. Ein weiterer Fehler liegt in der unzureichenden Abbildung von Variabilität innerhalb der synthetisierten Daten, was zu unrealistischen Testszenarien führen kann. Hier ist eine sorgfältige Modellierung der realen Datenstrukturen erforderlich, um die Varianz korrekt nachzubilden. Schliesslich wird oft übersehen, dass auch synthetische Daten gewisse sensible Informationen enthalten könnten, die bei ungeschickter Anwendung Rückschlüsse auf reale Daten zulassen. Eine gestrenge Prüfung der erstellten Daten auf solche Aspekte ist entscheidend.

Steps zur Erstellung DSGVO-konformer Synthetic Data

Um DSGVO-konforme Synthetic Data zu erstellen, sollten KMUs einen strukturierten Ansatz verfolgen:

    Erkennen und Analysieren der realen Daten: Zuerst sollten die relevanten Datensätze erkannt und strukturell analysiert werden, um zu verstehen, welche Informationen abgebildet werden müssen.

    Datenschutzrisiken bewerten: Vor der Verwendung ist eine Bewertung der Datenschutzrisiken notwendig. Dies schliesst eine Risikoanalyse der möglichen Rückverfolgbarkeit echter Daten ein.

    Modellauswahl und Konfiguration: Wählen Sie ein geeignetes Modell zur Datenerzeugung, das zur Komplexität Ihrer realen Daten passt. Konfigurieren Sie das Modell sorgfältig, um ein realistisches Datenverhalten zu gewährleisten.

    Erstellung und Validierung: Erstellen Sie die synthetischen Daten und validieren Sie diese anschliessend, um sicherzustellen, dass sie keine sensiblen Informationen offenlegen und die gewünschten Testanforderungen erfüllen.

    Einsatz in Testszenarien: Setzen Sie die synthetischen Daten ein, um ihre Funktionalität in realitätsnahen, aber datenschutzkonformen Szenarien zu testen.


14-Tage-Handlungsanleitung


    Tag 1-3: Bestandsaufnahme und Datenanlayse – Bestimmen Sie die notwendigen Datenquellen und analysieren Sie die zugrunde liegenden Strukturen und Eigenschaften.

    Tag 4-6: Workshop zur Risikobewertung – Organisieren Sie einen Workshop zur Erkennung und Bewertung von Datenschutzrisiken mit einem interdisziplinären Team.

    Tag 7-10: Modell entwickeln – Entwickeln Sie basierend auf den analysierten Strukturen ein initiales Datenmodell zur Synthese.

    Tag 11-12: Daten erzeugen – Führen Sie einen ersten Durchgang der Datenerzeugung durch und dokumentieren Sie die Ergebnisse.

    Tag 13: Datenvalidierung – Validieren Sie die synthetischen Daten auf Genauigkeit und Erfüllung der Testanforderungen.

    Tag 14: Integration in Testumgebung – Integrieren Sie die validierten Daten in Ihre Testumgebung und beginnen Sie mit praktischen Tests.


Durch diesen strukturierten Prozess können KMUs nicht nur DSGVO-konform arbeiten, sondern auch von realitätsnahen Testbedingungen profitieren, die den Einsatz authentischer Daten überflüssig machen.

Kommentare