Synthetische Daten im digitalen Marketing: aktuelle Trends und Anwendungen

Synthetische Daten bieten eine datenschutzkonforme, skalierbare Lösung für moderne Marketingherausforderungen durch Datenknappheit und Vorschriften.

Daten sind die treibende Kraft des modernen Marketings. Doch während die weltweite Datenproduktion rapide zunimmt – Schätzungen zufolge soll sie bis 2025 über 180 Zettabyte erreichen – stehen Marketer vor erheblichen Herausforderungen hinsichtlich der Zugänglichkeit und Verlässlichkeit dieser Daten. Strengere Datenschutzvorschriften und die Einführung datenschutzfreundlicher Technologien schränken die Fähigkeit von Marketingexperten ein, umsetzbare Erkenntnisse aus verfügbaren Datensätzen zu gewinnen. Diese Einschränkungen machen innovative Ansätze erforderlich, um die analytische Leistungsfähigkeit zu erhalten und gleichzeitig den Datenschutzrahmen zu wahren.

Herausforderungen bei der Datenerhebung und -nutzung

Der regulatorische Rahmen für die Datennutzung wird durch Richtlinien wie die ePrivacy-Richtlinie der Europäischen Union und die Datenschutz-Grundverordnung (DSGVO) bestimmt. Diese Vorschriften erfordern eine ausdrückliche Zustimmung für die Datenerhebung und -verarbeitung, was erhebliche Einschränkungen für Online-Marketer mit sich bringt. Gleichzeitig hat das gestiegene öffentliche Bewusstsein für Datenschutzrechte zur weitverbreiteten Nutzung von Werbeblockern, intelligenten Tracking-Prevention-Technologien und datenschutzorientierten Webbrowsern geführt. So integrieren beispielsweise Browser wie Safari und Firefox Mechanismen zur Verhinderung von Tracking, die die Verfügbarkeit von Nutzerdaten für Analysen erheblich verringern.

Empirische Daten verdeutlichen das Ausmaß des Problems. Eine globale Marke meldete einen Rückgang der Zustimmungsraten um 70 %, nachdem ein DSGVO-konformer Zustimmungsbanner ohne manipulative Designelemente implementiert wurde. Dies zeigt die betrieblichen Auswirkungen der Einhaltung ethischer Datenpraktiken. Dieses Phänomen wird als „Datenkrokodil“ bezeichnet, das die wachsende Diskrepanz zwischen Datenvolumen und der Verfügbarkeit von verwertbaren Daten symbolisiert. Die Abhängigkeit von traditionellen Drittanbieter-Cookies verschärft dieses Problem, da diese Mechanismen durch regulatorische und technische Einschränkungen zunehmend unwirksam werden.

Synthetische Daten als analytisches Paradigma

Synthetische Daten erweisen sich als eine praktikable Lösung für die oben genannten Herausforderungen. Als Daten definiert, die mithilfe fortschrittlicher Algorithmen erzeugt werden, um die statistischen Eigenschaften realer Datensätze zu replizieren, ermöglichen synthetische Daten robuste Analysen, ohne die Privatsphäre Einzelner zu gefährden. Sie bieten den doppelten Vorteil, datenschutzrechtliche Vorgaben einzuhalten und gleichzeitig den analytischen Anforderungen des Online-Marketings gerecht zu werden.

Die Technologie wird in zwei Hauptkategorien unterteilt:

  • Teilweise synthetische Daten, bei denen ein Teil der Variablen durch synthetische Werte ersetzt wird und einige Originaldatenpunkte erhalten bleiben. Dieser Ansatz birgt ein moderates Risiko der Re-Identifikation.
  • Vollständig synthetische Daten, bei denen alle Variablen algorithmisch generiert werden. Diese bieten einen erhöhten Datenschutz, erfordern jedoch eine strenge Validierung, um die Nutzbarkeit und Sicherheit der Daten sicherzustellen.

Synthetische Daten werden von Regulierungsbehörden zunehmend als datenschutzfreundliche Technologie anerkannt. Institutionen wie das britische Information Commissioner’s Office (ICO) und der Europäische Datenschutzbeauftragte (EDPS) haben ihr Potenzial hervorgehoben und sie als ein zentrales Instrument für die Einhaltung gesetzlicher Anforderungen bezeichnet.

Praktische Anwendung: JENTIS’ Synthetic Users

Ein Beispiel für die Anwendung synthetischer Daten bietet JENTIS mit seiner Funktion „Synthetic User“, die maschinelle Lernmodelle nutzt, um Datenverluste durch nicht erteilte Einwilligungen zu kompensieren. Der Prozess beginnt mit der Erfassung von Daten einwilligender Nutzer, die zur Identifizierung prädiktiver Variablen verwendet werden. Diese Variablen bilden die Grundlage für die Erstellung synthetischer Nutzerprofile. Diese Methodik ermöglicht die Simulation des Verhaltens nicht einwilligender Nutzer und erzeugt Datensätze, die die statistischen Eigenschaften der gesamten Nutzerbasis nachbilden.

Das System integriert strenge Datenschutzmaßnahmen. Nicht einwilligungspflichtige Daten werden minimiert und zeitlich begrenzt verarbeitet; alle derartigen Daten werden innerhalb von 24 Stunden nach der Synthese gelöscht. Darüber hinaus priorisiert JENTIS die Erhebung von Erstanbieterdaten, sodass Organisationen die Kontrolle über die Datenverarbeitung behalten. Dieser Ansatz erleichtert die Einhaltung von Datenschutzvorschriften und reduziert die Abhängigkeit von Drittanbieter-Analytik.

Vorteile synthetischer Daten in der Marketinganalyse

Die Integration synthetischer Daten in die Marketinganalyse bietet mehrere Vorteile:

  • Regulatorische Compliance: Durch die Entkopplung von Datensätzen von identifizierbaren Personen entsprechen synthetische Daten der DSGVO und vergleichbaren Vorschriften und ermöglichen eine ethische Analyse.
  • Daten-Skalierbarkeit: Die Erzeugung synthetischer Daten mindert die Herausforderungen durch begrenzte Stichprobengrößen und erzeugt robuste Datensätze, die umfassende Trendanalysen und Szenariomodellierungen unterstützen.
  • Erweiterte Datenaufbewahrung: Anders als personenbezogene Informationen können synthetische Daten über längere Zeiträume gespeichert werden, was Langzeitstudien und strategische Prognosen erleichtert.
  • Kampagnenoptimierung: Synthetische Datensätze unterstützen rigorose A/B-Tests, prädiktive Modellierungen und Segmentierungsanalysen und verbessern so die Präzision und den ROI von Kampagnen.

Herausforderungen und Einschränkungen

Trotz ihres Nutzens sind synthetische Daten nicht ohne Herausforderungen. Die Qualität und Repräsentativität der Ausgangsdaten für die Synthese beeinflusst die Genauigkeit der synthetischen Datensätze erheblich. Unzureichende oder voreingenommene Eingabedaten können Ungenauigkeiten in den synthetischen Ergebnissen hervorrufen und deren Zuverlässigkeit untergraben. Darüber hinaus minimieren vollständig synthetische Daten zwar die Re-Identifikationsrisiken, eliminieren sie jedoch nicht vollständig, was eine kontinuierliche Bewertung der Synthesealgorithmen erforderlich macht.

Fazit

Synthetische Daten stellen eine transformative Innovation im Bereich des Online-Marketings dar. Sie vereinen die konkurrierenden Anforderungen von datengetriebenen Entscheidungen und strenger Datenschutzkonformität und bieten eine skalierbare und ethische Alternative zu traditionellen Methoden der Datenerhebung. Durch die Überwindung der durch Datenschutzvorschriften und technische Barrieren auferlegten Einschränkungen ermöglichen synthetische Daten Marketern, die analytische Effizienz aufrechtzuerhalten und gleichzeitig die Autonomie der Nutzer zu respektieren.

Die zukünftige Entwicklung synthetischer Daten wird wahrscheinlich durch Fortschritte im algorithmischen Design und regulatorische Klarheit geprägt sein. Mit zunehmender Reife der Technologie wird sie eine zentrale Rolle in der Weiterentwicklung der Marketinganalyse spielen, fundierte Entscheidungen ermöglichen und das Vertrauen zwischen Unternehmen und Verbrauchern fördern.

 

Credits:

Dieser Beitrag ist eine Reproduktion eines ursprünglich auf OneTrust DataGuidance veröffentlichten Artikels. Alle Rechte liegen bei der ursprünglichen Autorin, Mira Suleimenova, Director of Compliance and Legal bei JENTIS GmbH, und der Plattform. Den vollständigen Artikel finden Sie unter this link.

Häufig gestellte Fragen

Synthetische Daten ermöglichen präzise Modellierungen, Tests und Segmentierungen, wodurch genauere Vorhersagen des Nutzerverhaltens und eine Verbesserung des Marketing-ROI erzielt werden.

Zu den Risiken gehören Ungenauigkeiten aufgrund voreingenommener Eingabedaten, Herausforderungen bei der Gewährleistung der Re-Identifikationsresistenz und rechtliche Unklarheiten in Bezug auf die Datenklassifizierung.

JENTIS verwendet maschinelles Lernen zur Synthese von Nutzerprofilen auf Basis von einwilligungspflichtigen Daten, was umfassende Analysen bei gleichzeitiger Wahrung des Datenschutzes ermöglicht.

Aufgrund ihrer Entkopplung von personenbezogenen Daten können synthetische Daten langfristig gespeichert werden, was Langzeitstudien und datengestützte strategische Planungen erleichtert.

Synthetische Daten haben Unterstützung von Institutionen wie dem ICO und dem EDPS erhalten, die ihr Potenzial als datenschutzorientiertes Analysewerkzeug anerkennen.

Mehr lesen

Blog

Digital Fingerprinting erklärt: Anwendungen, Vorteile und datenschutzfreundliche Alternativen

Digital Fingerprinting erfasst einzigartige Geräte- und Verhaltensmerkmale und bietet Einblicke für Sicherheit, Marketing und Compliance-Herausforderungen.

Blog

Widerstandsfähigkeit gegen Analyseausfälle aufbauen: Die Vorteile der Rohdatenerfassung

Rohdaten-Tracking-Lösungen bieten Unternehmen eine zuverlässige Datenerfassung und minimieren die Risiken von Plattformausfällen wie dem jüngsten GA4-Vorfall.

Blog

Google schafft Third-Party Cookies doch nicht ab: Was das für Marketer bedeutet

Google Chrome wird Cookies von Drittanbietern weiterhin unterstützen. Erfahrungen mit Apples App Tracking Transparency deuten jedoch darauf hin, dass das Einholen von Nutzereinwilligungen trotzdem ihr Ende bedeuten könnte.