IHRE EIGENE DATENARCHITEKTUR

First-Party-Daten- & Messarchitektur

sGTM, Conversion API, BigQuery/Snowflake Data Lake, Consent Mode v2 + TCF 2.2, identity resolution und reverse ETL — die Dateninfrastruktur erfolgreicher Marken in einer Welt nach dem Third-Party-Cookie, mit konsequenter Engineering-Disziplin von Grund auf gebaut.

Wir treten nicht in ein Zeitalter ein, in dem das Pixel tot ist, sondern in eines, in dem Datenhoheit zur Pflicht wird; Infrastruktur ist Engineering-Arbeit, kein Plug-and-play-SaaS.

Mit Consent Mode v2, iOS 17 ATT, den Chrome-Cookie-Änderungen und TCF 2.2 ist das an Werbeplattformen gesendete Signal durchschnittlich um 40-60 % eingebrochen. Viele Marken haben parallel dazu, ohne es zu bemerken, mit mehreren SaaS-Tools fragmentierte Datenseen aufgebaut; jedes Tool mit eigener ID, eigener Consent-Interpretation, eigenem Event-Schema. Die First-Party-Datenoperationen von Roibase beseitigen diese Fragmentierung auf Basis von sechs Prinzipien; jedes Prinzip ist kein SaaS, sondern ein Engineering-Standard.

Roibase perspective

METHODIK

AUDIT → DESIGN → DEPLOY → VALIDATE → GOVERN → HANDOFF — Engineering-Disziplin

Datenarchitektur ist kein Tag-Management-Projekt, sondern eine langlebige Plattform. Der sechsstufige Prozess macht jede Entscheidung schriftlich fixiert, testbar und übergabefähig.

01

01

AUDIT

Audit des bestehenden client-seitigen GTM, GA4, Pixels, CMP, der Consent-Umsetzung, des Datenflusses und der Kostentransparenz; Signalverluste, Consent-Verstöße und Daten-Duplikate werden quantifiziert.

02

02

DESIGN

Event Taxonomy, Identity-Strategie, Consent-Policy, warehouse-Architektur und data contracts werden entworfen; Freigabe durch die Stakeholder (Legal, IT, Marketing, Data) wird eingeholt.

03

03

DEPLOY

sGTM-Container, CAPI-Endpoints, Consent-Mode-v2-Konfiguration, warehouse Streaming und dbt-Modelle gehen live; das Risiko wird per blue/green deployment reduziert.

04

04

VALIDATE

Die alte und neue Architektur laufen parallel im shadow mode + Dual-Tracking; bis zur Event-Parität von mindestens 99 % erfolgt kein Cutover; die QA-Checkliste umfasst 120+ Punkte.

05

05

GOVERN

Schema registry, PII-Tagging, Retention, RBAC, Audit-Log und Compliance-Reports werden aktiviert; das Data-Governance-Board tagt in monatlicher Cadence.

06

06

HANDOFF

3-wöchiges hands-on-Training für Ihr Team + runbook + 6 Monate asynchroner Support; kritische Alert-Rotation und SLA-Vereinbarung werden schriftlich übergeben.

— VERGLEICH

In-house vs. SaaS-abhängige Agentur vs. Roibase Data Engineering

Der konkrete Unterschied dreier Ansätze in Bezug auf Datenhoheit, Consent-Konformität, Engineering-Tiefe und Gesamtkosten.

DimensionIn-house minimalSaaS-abhängige AgenturRoibase Engineering
DatenhoheitFragmentiert (jedes Tool eigene DB)Beim SaaS-AnbieterIn Ihrem eigenen warehouse
sGTM + CAPITeilweise (client-only)Nicht vorhanden oder beim VendorIn Ihrer Infrastruktur, volle Ownership
Consent Mode v2 + TCF 2.2GrundintegrationCMP-Preset, keine AnpassungSchriftliche Policy + Legal Review + Tests
Identity resolutionNicht vorhanden oder E-Mail-onlyVendor-BlackboxDeterministisches + probabilistisches offenes Modell
PII-Governance + Audit-LogAd-hocVertraglich, nicht operativRunbook + monatlicher Compliance-Report
Data Contracts + Schema RegistryNicht vorhandenAbhängig vom SaaS-SchemaVersioniert, testbar, owned
Reverse ETL + AktivierungManuelle CSVSaaS-gebundenWarehouse-nativ, freie Auswahl
Gesamtkosten pro Jahr50-120 k € (fragmentierte SaaS)120-250 k € (Agentur + Lizenzen)80-180 k € (Setup + warehouse)

PROOF

Outcomes, measured

+45 %
Signalrückgewinnung

Rückgewinnung nicht attribuierter Conversions nach iOS 14+/ATT durch sGTM + CAPI.

94 %
Consent-Konformitätsquote

Akzeptable Consent-State-Verteilung nach TCF 2.2 + Consent Mode v2.

12
Tool-Konsolidierung

Typische Anzahl separater Daten-/Analytics-SaaS-Tools, die bei Kunden zusammengeführt werden können.

0 €
Monatliche Datenlizenzkosten

In Ihrem eigenen warehouse — nur Query- + Storage-Kosten; keine SaaS-per-seat-Gebühren.

8
Wochen Setup-Dauer

Typischer Zeitplan eines mittelständischen Kunden vom Audit bis zum Live-shadow-mode.

99,8 %
Event-Delivery-Rate

Durchschnittliche Event-Zustellrate nach sGTM + CAPI dual-path.

WHAT WE DO

Engagement scope

Every offering is an outcome-based work package. Roibase blends strategy and execution inside a single team — no hand-offs.

01 / 10

Server-side GTM (sGTM)

Ihr eigener sGTM-Container auf Google Cloud Run / AWS Fargate: Datenhoheit liegt bei Ihnen, kein Vendor-Lock-in, geringere Client-Last; PII-Redaktion erfolgt auf dem Server.

02 / 10

Consent Mode v2 + TCF 2.2

Integration eines IAB-TCF-2.2-konformen CMP, dynamische Ausspielung der Signale ad_user_data + ad_personalization je nach Consent-State; KVKK-/DSGVO-Legal-Basis-Abgrenzung durch schriftliche Richtlinie.

03 / 10

Conversion API (CAPI)

Server-seitige Conversion-Events für Meta, Google, TikTok, Pinterest; hashed PII + event deduplication; 30-50 % Signalrückgewinnung und iOS-14+/ATT-Konformität.

04 / 10

BigQuery / Snowflake Data Lake

Raw-Event-Streaming + dbt-Modelle + semantic layer + Visualisierung mit Looker Studio/Metabase/Looker; Partition + Clustering + Cost Optimization inklusive.

05 / 10

Identity resolution

Deterministischer (Login, E-Mail-Hash) + probabilistischer (Device-Fingerprint, Household) Identity Graph; eine einheitliche Nutzerkennung für Cross-Device-Journey und Cross-Channel-Attribution.

06 / 10

CDP-Readiness

Integration von Segment / RudderStack / mParticle oder warehouse-native CDP (Census, Hightouch) mit reverse ETL-Strecken; CDP-Auswahl durch unabhängige Bewertung.

07 / 10

Reverse ETL & Aktivierung

Automatische Übertragung berechneter Segmente (churn risk, LTV tier, product affinity) an Meta Custom Audience, Google Customer Match, Klaviyo, HubSpot, Braze.

08 / 10

Customer Match Rebuild

Neuaufbau von Lookalike + Retargeting mit hashed PII + CAPI; Infrastruktur, die die Werbeplattform-Performance in einer Welt ohne Pixel aufrechterhält.

09 / 10

Schema Registry + PII-Governance

Event-Schema versioniert, testbar; PII-Felder werden getaggt, Retention- + Masking-Richtlinien angewendet; Datenqualitätsüberwachung mit Schema-Drift-Alarmen.

10 / 10

Audit-Log + Zugriffsüberwachung

Es wird protokolliert, wer wann zu welchem Zweck auf welche Daten zugreift; role-based access control (RBAC), data contracts und monatlicher Compliance-Report werden automatisch generiert.

— NUTZEN

Der konkrete, messbare Ertrag der Datenhoheit

First-Party-Datenarchitektur bedeutet nicht nur Compliance; sie ist ein direkter Hebel für Werbeperformance, Kundenverständnis und Teamgeschwindigkeit.

+45 % Signal

Rückgewinnung von Werbesignalen

Mit Meta/Google/TikTok CAPI 30-50 % Signalrückgewinnung; Lerngeschwindigkeit und Optimierungsqualität der Werbeplattformen steigen deutlich.

−52 % SaaS-Kosten

Niedrigere Tool-Kosten

Der fragmentierte SaaS-Stack wird in einem warehouse + dbt-Layer konsolidiert; die jährlichen Lizenzkosten sinken um 40-60 %.

+38 % Entscheidungsgeschwindigkeit

Ihr Team wird schneller

Über den self-serve semantic layer beantworten Fachbereiche ihre eigenen Fragen; das Data-Team wird vom Bottleneck zum Enabler.

100 % audit-ready

Consent-Konformität schriftlich

TCF 2.2 + Consent Mode v2 + KVKK-Policy sind auditierbar und testbar; das 'Evidence File' ist für rechtliche Prüfungen bereit.

+28 % Attributionsgenauigkeit

Cross-Channel-Journey sichtbar

Per identity resolution eine geräte-/kanalunabhängige User-Journey; Attributionsmodelle und cohort-Analysen auf ganzheitlicher Datenbasis.

Runbook + RACI

Nachhaltige Daten-Governance

Schema registry, PII-Tagging, Retention, RBAC, Audit-Log — per runbook + monatlichem Compliance-Report an Ihr Team übergeben.

LIEFERUMFANG

Konkrete, schriftliche Deliverables für jedes First-Party-Projekt

Architektur, Code, Konfiguration, Dokumentation und Schulung — jede Lieferung wird versioniert und an Ihr Team übergeben.

  • Signal-Audit-Report

    Quantitative Bewertung von bestehendem Signalverlust, Consent-Verstößen und Tool-Duplikationen, 40-60 Seiten.

  • Event Taxonomy & Data Contracts

    Namen, Eigenschaften, Owner, Schema-Version und Backward-Compatibility-Regeln aller Events.

  • sGTM-Container-Setup

    Live-sGTM auf Google Cloud Run / AWS Fargate, blue/green deployment + CI/CD pipeline + Rollback-Plan.

  • CAPI-Integrationen

    Server-seitige Conversion-Events für Meta, Google, TikTok, Pinterest; event deduplication + hashed PII + Error Handling.

  • Consent Mode v2 + CMP-Policy

    IAB-TCF-2.2-konforme CMP-Konfiguration, dynamische Signale ad_user_data/ad_personalization, schriftliche Consent-Policy + Legal Review.

  • BigQuery/Snowflake warehouse

    Raw-Event-Streaming-Pipeline, Partition + Clustering, Cost Optimization, Monitoring + Alerting.

  • dbt-Modelle + semantic layer

    Staging → Intermediate → Marts-Schichten, dbt-Tests, Exposures, Lineage Graph + Documentation Site.

  • Identity-Resolution-Pipeline

    Deterministische + probabilistische Matching-Regeln, Household-Detection, Cross-Device-Journey-Tabelle.

  • Reverse-ETL-Strecken

    Census/Hightouch zur Segmentübertragung an Meta CA, Google CM, Klaviyo, HubSpot, Braze; Schedule + Monitoring.

  • Schema Registry & PII-Governance

    Versionierte Schema-Einträge, PII-Tagging, Retention- + Masking-Richtlinie, Schema-Drift-Alarme.

  • Audit-Log + Compliance-Report

    RBAC-Konfiguration, Data-Access-Log, monatlich automatisiert generierter Compliance-Report (KVKK/DSGVO + Werbeplattform-Policy).

  • Runbook + 3-wöchige Schulung

    Operatives runbook, On-Call-Rotation, SLA-Vereinbarung + 3-wöchiges hands-on-Training für Ihr Team.

— LEISTUNGSUMFANG

Was wir tun und was nicht — klare Grenzen

First-Party-Architektur ist Engineering-Arbeit; ein klar definierter Scope verhindert Überraschungen und Nachforderungen.

Was wir tun

  • Signal-Audit + Bewertung der Consent-Qualität
  • Design von Event Taxonomy + Data Contracts
  • sGTM-Container-Setup + CI/CD + Monitoring
  • CAPI-Integrationen für Meta/Google/TikTok/Pinterest
  • Consent Mode v2 + TCF 2.2 + CMP-Konfiguration
  • BigQuery/Snowflake warehouse + Streaming-Pipeline
  • dbt-Modelle + semantic layer + Tests
  • Identity resolution (deterministisch + probabilistisch)
  • Reverse-ETL-Strecken (Census/Hightouch)
  • Schema registry + PII-Governance + Audit-Log
  • Koordination von Legal-/Compliance-Reviews
  • Runbook + 3-wöchiges hands-on-Training

Was wir nicht tun

  • Rechtsberatung (koordiniert mit Partneranwalt + Policy-Review)
  • Verkauf von CDP-Lizenzen (wir geben vendor-agnostische Empfehlungen, provisionsfrei)
  • Betrieb eines fragmentierten SaaS-Stacks (wir empfehlen Konsolidierung)
  • Raw-Analytics-Agenturstunden (statt Pakete arbeiten wir in Engineering-Sprints)
  • Garantierte 'Pre-Pixel'-Signalrückgewinnung (wir nennen realistische Bandbreiten)
  • warehouse-Lizenz / Cloud-Rechnung (verbleibt im Kundenkonto)
  • Werbekontenverwaltung (separater Scope mit PPC-/Growth-Teams)
  • Plug-and-play-SaaS-Deployment (jeder Kunde erhält eine Custom-Architektur)

HOW WE WORK

Erste 8 Wochen Setup → 6 Monate Betrieb — was wann gemacht wird, ist schriftlich fixiert

01

Woche 1-2: Audit + Discovery

Audit des bestehenden GTM/GA4/CMP/Pixels, Consent-Health-Check, Stakeholder-Interviews, Architektur-Anforderungsdokument.

02

Woche 3-4: Design + Data Contracts

Event Taxonomy, Identity-Strategie, warehouse-Schema, Consent-Policy, Data Contracts — Freigabe von Legal + IT + Marketing.

03

Woche 5-6: sGTM + CAPI Deploy

Cloud-Run-/Fargate-Container geht live; CAPI-Integration für Meta/Google/TikTok; shadow mode wird gestartet.

04

Woche 7-8: warehouse + dbt

BigQuery/Snowflake-Streaming-Pipeline, dbt Staging + Intermediate + Marts, erste Version des semantic layer.

05

Woche 9-10: Validate + Cutover

Event-Paritätstest, QA-Checkliste, blue/green cutover; Decommissioning-Plan für die Altarchitektur.

06

Woche 11-12: Govern + Handoff

Schema registry, PII-Tagging, Audit-Log, RBAC; hands-on-Training für Ihr Team beginnt, runbook wird übergeben.

07

Monat 4-5: Aktivierung + Optimierung

Reverse-ETL-Strecken, erste Segment-Aktivierungen, Datenvorbereitung für MMM/Attribution, Cost Optimization.

08

Monat 6+: Steady State + Audit

Monatlicher Compliance-Report, quartalsweises Data-Governance-Board, Schema-Drift-Monitoring, SLA + On-Call-Rotation.

— TOOLSET

Die von uns eingesetzten Tools — vendor-agnostisch, aber mit klarer Auswahl

Wir wählen für jeden Kunden die passende Lösung; unsere Unabhängigkeit wahren wir, indem wir keine Provisionen annehmen.

SERVER-SIDE TRACKING

Google Tag Manager ServerStape.ioGoogle Cloud RunAWS FargateMeta Conversion APIGoogle Ads Enhanced ConversionsTikTok Events APIPinterest CAPI

CMP & CONSENT

OneTrustCookiebotDidomiUsercentricsGoogle Consent Mode v2IAB TCF 2.2

WAREHOUSE & CDP

BigQuerySnowflakeRedshiftdbt Core/CloudSegmentRudderStackmParticleAmplitude

REVERSE ETL & ACTIVATION

CensusHightouchPolytomicFivetranAirbyteStitchMeta Custom Audience APIGoogle Customer Match API

QUESTIONS

Frequently asked

Drei konkrete Vorteile: (1) 30-50 % Signalgewinn durch Umgehung von Ad-Blocker + ITP, (2) Datenhoheit — PII-Redaktion erfolgt auf dem Server, (3) schnellere Seitenladezeiten — geringere client-seitige Skriptlast. Zusätzlich entfällt der Vendor-Lock-in; die gesamte Tag-Logik liegt in Ihrer Cloud.

— GLOSSAR

Begriffe des First-Party-Data-Engineering

12 zentrale Begriffe, die Ihrem Team und den Stakeholdern eine gemeinsame Sprache geben.

01
sGTM
Server-side Google Tag Manager — ein Proxy, der das Payload des Browser-GTM aufnimmt, säubert und anreichert und an mehrere Destinations (GA4, Meta CAPI, TikTok etc.) verteilt. Verlängert Cookie-Lebensdauer, widersteht Adblockern und bildet das Rückgrat server-seitiger Conversion-APIs.
CAPIConsent Mode v2
02
CAPI
Server-to-Server-Event-API von Meta, parallel zum Pixel. Holt die 20-40 % Conversion-Signal zurück, die im Browser durch ITP und Adblocker verloren gehen; für die Deduplication muss jedes Event eine event_id und denselben Zeitstempel tragen. Fundament jedes modernen Paid-Social-Stacks.
sGTMCustomer Match
03
Consent Mode v2
Googles TCF-2.2-konformer Consent-Signal-Mechanismus; ad_user_data- + ad_personalization-States.
TCF 2.2PII
04
TCF 2.2
Seit 2024 verpflichtende Version des IAB Europe Transparency & Consent Framework. Standardisiert das Consent-Signal zwischen Publisher, Vendor und Nutzer; CMPs (OneTrust, Cookiebot, Didomi) liefern zusammen mit Google Consent Mode v2 die Pflicht-Compliance.
Consent Mode v2
05
Identity resolution
Die Verknüpfung von Nutzeraktivitäten auf verschiedenen Geräten und Kanälen zu einer einzigen Identität; deterministisch + probabilistisch.
CDPCustomer Match
06
CDP
Customer Data Platform; System, das Nutzerprofile vereint und für Aktivierungskanäle öffnet (Segment, mParticle, warehouse-native).
Reverse ETLData warehouse
07
Reverse ETL
Datenübertragung aus dem warehouse an operative Tools (Meta, Google, Klaviyo); Census und Hightouch sind typische Vendors.
CDPData warehouse
08
Customer Match
Nutzung einer gehashten First-Party-Liste (E-Mail, Telefon, Postanschrift) als Targeting-/Exclusion-Audience in Google Search, YouTube und Display. Basis für Lookalike-Seeds und Win-back; sinnvoll meist erst ab einer Match Rate von 30 %+.
CAPIPII
09
Data warehouse
Cloud-Datenspeicher für rohe und modellierte Event-Daten (BigQuery, Snowflake, Redshift, Databricks).
Event schemaData governance
10
Event schema
Die schriftliche, versionierte Definition der Event-Namen, Eigenschaften, Datentypen und Owner; wird in einer schema registry gespeichert.
Data governance
11
PII
Personally Identifiable Information; Daten, die eine Person identifizieren (E-Mail, Telefon, IP, Device-ID). Werden unter Tagging + Retention verwaltet.
Data governanceConsent Mode v2
12
Data governance
Die Gesamtheit der Disziplinen von Datenqualität, Zugriff, Steuerung und Compliance; RBAC + Audit-Log + Data Contracts sind Standard.
PIIEvent schema
13
GA4 Measurement Protocol
Server-to-Server-Protokoll, das Events per HTTP direkt an GA4 sendet. Erzeugt Conversion-Signal aus Umgebungen ohne Web-Pixel (CRM, IoT, App-Server); Authentifizierung über api_secret + measurement_id, Consent-Mode-konform konfiguriert.
14
Enhanced Conversions
Mess-Layer in Google Ads, der Conversions per gehashte First-Party-Daten (E-Mail, Telefon) einem User zuordnet. Holt 3-15 % der durch ITP und Cookie-Verfall verlorenen Attribution zurück; gibt es in Web- und Lead-Form-Varianten.
15
Offline Conversions
Prozess, mit dem im CRM entstandene Conversions (Lead-to-Sale, Telefonabschluss, Storebesuch) per Click-ID (gclid/wbraid/fbclid) an die Ad-Plattform zurückgespielt werden. Zuverlässigster Weg, tROAS mit echtem Umsatz zu speisen.
16
First-party Data
Daten, die die Marke mit User-Consent direkt aus eigenen Properties (Web, App, CRM, Callcenter, E-Mail, Mitgliedschaft) erhebt. Robusteste Grundlage für Performance-Marketing nach dem Wegfall der Third-Party-Cookies; gehasht und in Ad-Plattformen aktiviert.
17
Data Clean Room
Sichere Rechenumgebung, in der zwei Parteien (z. B. Marke + Medien-Plattform) Matching und Aggregation durchführen, ohne sich gegenseitig die Roh-PII zu zeigen. Google Ads Data Hub, Amazon AMC, Snowflake/Databricks Clean Rooms — Overlap-Analyse, Attribution, Audience-Aufbau.
18
Identity Graph
Relationaler Graph, der eine Person über Geräte, E-Mail, Telefon, Zahlungs-Identifier und gehashte IDs hinweg verknüpft. Grundlage für Cross-Device-Attribution, Retention-Modelle und LAL-Seed-Qualität — das Herz jeder CDP.
19
First-party Cookies
Cookies, die die eigene Domain der Site setzt und die nur bei deren Requests mitgeschickt werden. Nach dem Wegfall der Third-Party-Cookies hat ITP auch diese Kategorie verkürzt — server-seitiges Cookie-Setting + 1y+-Rotationspolitik sind essenziell.
20
Server-side Events
Conversion-Events, die nicht vom Browser, sondern vom eigenen Server (sGTM, eigenes Backend) per API an die Ad-Plattform gesendet werden. Immun gegen Adblocker und Browser-Limits; nutzt Specs wie CAPI (Meta), GA4 MP, TikTok Events API.
21
Hashed PII
Personenbezogener Wert (E-Mail, Telefon, Name), der über eine Einweg-Kryptografie-Funktion (meist SHA-256) fixiert wird. Pflicht für Matching, Custom-Audience-Upload und Enhanced Conversions bei Ad-Plattformen — Privacy- und Compliance-Anforderung.
22
Privacy Sandbox
API-Suite von Google in Chrome, die Ad-Messung, Retargeting und Fraud-Detection ohne Third-Party-Cookies ermöglichen soll: Topics, Protected Audience (FLEDGE), Attribution Reporting. Die Google-Seite der Cookieless-Zukunft.

— ENTSCHEIDUNGSBAUM

Ist eine First-Party-Datenoperation für Sie geeignet?

Beantworten Sie 4 Fragen mit Ja/Nein; die Empfehlung soll eindeutig sein.

01 / 04

Liegt Ihr monatliches Werbebudget über 30k USD?

Schwelle, ab der die Signalrückgewinnung wirtschaftlich sinnvoll wird.

— LET'S BEGIN

Wie sehr vertrauen Sie Ihren Pixeln?

Mit einem 2-stündigen Signal-Audit decken wir verlorene Conversions, Consent-Probleme und warehouse-Chancen auf.