IHRE EIGENE DATENARCHITEKTUR
First-Party-Daten- & Messarchitektur
sGTM, Conversion API, BigQuery/Snowflake Data Lake, Consent Mode v2 + TCF 2.2, identity resolution und reverse ETL — die Dateninfrastruktur erfolgreicher Marken in einer Welt nach dem Third-Party-Cookie, mit konsequenter Engineering-Disziplin von Grund auf gebaut.
Wir treten nicht in ein Zeitalter ein, in dem das Pixel tot ist, sondern in eines, in dem Datenhoheit zur Pflicht wird; Infrastruktur ist Engineering-Arbeit, kein Plug-and-play-SaaS.
Mit Consent Mode v2, iOS 17 ATT, den Chrome-Cookie-Änderungen und TCF 2.2 ist das an Werbeplattformen gesendete Signal durchschnittlich um 40-60 % eingebrochen. Viele Marken haben parallel dazu, ohne es zu bemerken, mit mehreren SaaS-Tools fragmentierte Datenseen aufgebaut; jedes Tool mit eigener ID, eigener Consent-Interpretation, eigenem Event-Schema. Die First-Party-Datenoperationen von Roibase beseitigen diese Fragmentierung auf Basis von sechs Prinzipien; jedes Prinzip ist kein SaaS, sondern ein Engineering-Standard.
METHODIK
AUDIT → DESIGN → DEPLOY → VALIDATE → GOVERN → HANDOFF — Engineering-Disziplin
Datenarchitektur ist kein Tag-Management-Projekt, sondern eine langlebige Plattform. Der sechsstufige Prozess macht jede Entscheidung schriftlich fixiert, testbar und übergabefähig.
01
AUDIT
Audit des bestehenden client-seitigen GTM, GA4, Pixels, CMP, der Consent-Umsetzung, des Datenflusses und der Kostentransparenz; Signalverluste, Consent-Verstöße und Daten-Duplikate werden quantifiziert.
02
DESIGN
Event Taxonomy, Identity-Strategie, Consent-Policy, warehouse-Architektur und data contracts werden entworfen; Freigabe durch die Stakeholder (Legal, IT, Marketing, Data) wird eingeholt.
03
DEPLOY
sGTM-Container, CAPI-Endpoints, Consent-Mode-v2-Konfiguration, warehouse Streaming und dbt-Modelle gehen live; das Risiko wird per blue/green deployment reduziert.
04
VALIDATE
Die alte und neue Architektur laufen parallel im shadow mode + Dual-Tracking; bis zur Event-Parität von mindestens 99 % erfolgt kein Cutover; die QA-Checkliste umfasst 120+ Punkte.
05
GOVERN
Schema registry, PII-Tagging, Retention, RBAC, Audit-Log und Compliance-Reports werden aktiviert; das Data-Governance-Board tagt in monatlicher Cadence.
06
HANDOFF
3-wöchiges hands-on-Training für Ihr Team + runbook + 6 Monate asynchroner Support; kritische Alert-Rotation und SLA-Vereinbarung werden schriftlich übergeben.
— VERGLEICH
In-house vs. SaaS-abhängige Agentur vs. Roibase Data Engineering
Der konkrete Unterschied dreier Ansätze in Bezug auf Datenhoheit, Consent-Konformität, Engineering-Tiefe und Gesamtkosten.
| Dimension | In-house minimal | SaaS-abhängige Agentur | Roibase Engineering |
|---|---|---|---|
| Datenhoheit | Fragmentiert (jedes Tool eigene DB) | Beim SaaS-Anbieter | In Ihrem eigenen warehouse |
| sGTM + CAPI | Teilweise (client-only) | Nicht vorhanden oder beim Vendor | In Ihrer Infrastruktur, volle Ownership |
| Consent Mode v2 + TCF 2.2 | Grundintegration | CMP-Preset, keine Anpassung | Schriftliche Policy + Legal Review + Tests |
| Identity resolution | Nicht vorhanden oder E-Mail-only | Vendor-Blackbox | Deterministisches + probabilistisches offenes Modell |
| PII-Governance + Audit-Log | Ad-hoc | Vertraglich, nicht operativ | Runbook + monatlicher Compliance-Report |
| Data Contracts + Schema Registry | Nicht vorhanden | Abhängig vom SaaS-Schema | Versioniert, testbar, owned |
| Reverse ETL + Aktivierung | Manuelle CSV | SaaS-gebunden | Warehouse-nativ, freie Auswahl |
| Gesamtkosten pro Jahr | 50-120 k € (fragmentierte SaaS) | 120-250 k € (Agentur + Lizenzen) | 80-180 k € (Setup + warehouse) |
PROOF
Outcomes, measured
Rückgewinnung nicht attribuierter Conversions nach iOS 14+/ATT durch sGTM + CAPI.
Akzeptable Consent-State-Verteilung nach TCF 2.2 + Consent Mode v2.
Typische Anzahl separater Daten-/Analytics-SaaS-Tools, die bei Kunden zusammengeführt werden können.
In Ihrem eigenen warehouse — nur Query- + Storage-Kosten; keine SaaS-per-seat-Gebühren.
Typischer Zeitplan eines mittelständischen Kunden vom Audit bis zum Live-shadow-mode.
Durchschnittliche Event-Zustellrate nach sGTM + CAPI dual-path.
WHAT WE DO
Engagement scope
Every offering is an outcome-based work package. Roibase blends strategy and execution inside a single team — no hand-offs.
Server-side GTM (sGTM)
Ihr eigener sGTM-Container auf Google Cloud Run / AWS Fargate: Datenhoheit liegt bei Ihnen, kein Vendor-Lock-in, geringere Client-Last; PII-Redaktion erfolgt auf dem Server.
Consent Mode v2 + TCF 2.2
Integration eines IAB-TCF-2.2-konformen CMP, dynamische Ausspielung der Signale ad_user_data + ad_personalization je nach Consent-State; KVKK-/DSGVO-Legal-Basis-Abgrenzung durch schriftliche Richtlinie.
Conversion API (CAPI)
Server-seitige Conversion-Events für Meta, Google, TikTok, Pinterest; hashed PII + event deduplication; 30-50 % Signalrückgewinnung und iOS-14+/ATT-Konformität.
BigQuery / Snowflake Data Lake
Raw-Event-Streaming + dbt-Modelle + semantic layer + Visualisierung mit Looker Studio/Metabase/Looker; Partition + Clustering + Cost Optimization inklusive.
Identity resolution
Deterministischer (Login, E-Mail-Hash) + probabilistischer (Device-Fingerprint, Household) Identity Graph; eine einheitliche Nutzerkennung für Cross-Device-Journey und Cross-Channel-Attribution.
CDP-Readiness
Integration von Segment / RudderStack / mParticle oder warehouse-native CDP (Census, Hightouch) mit reverse ETL-Strecken; CDP-Auswahl durch unabhängige Bewertung.
Reverse ETL & Aktivierung
Automatische Übertragung berechneter Segmente (churn risk, LTV tier, product affinity) an Meta Custom Audience, Google Customer Match, Klaviyo, HubSpot, Braze.
Customer Match Rebuild
Neuaufbau von Lookalike + Retargeting mit hashed PII + CAPI; Infrastruktur, die die Werbeplattform-Performance in einer Welt ohne Pixel aufrechterhält.
Schema Registry + PII-Governance
Event-Schema versioniert, testbar; PII-Felder werden getaggt, Retention- + Masking-Richtlinien angewendet; Datenqualitätsüberwachung mit Schema-Drift-Alarmen.
Audit-Log + Zugriffsüberwachung
Es wird protokolliert, wer wann zu welchem Zweck auf welche Daten zugreift; role-based access control (RBAC), data contracts und monatlicher Compliance-Report werden automatisch generiert.
— NUTZEN
Der konkrete, messbare Ertrag der Datenhoheit
First-Party-Datenarchitektur bedeutet nicht nur Compliance; sie ist ein direkter Hebel für Werbeperformance, Kundenverständnis und Teamgeschwindigkeit.
Rückgewinnung von Werbesignalen
Mit Meta/Google/TikTok CAPI 30-50 % Signalrückgewinnung; Lerngeschwindigkeit und Optimierungsqualität der Werbeplattformen steigen deutlich.
Niedrigere Tool-Kosten
Der fragmentierte SaaS-Stack wird in einem warehouse + dbt-Layer konsolidiert; die jährlichen Lizenzkosten sinken um 40-60 %.
Ihr Team wird schneller
Über den self-serve semantic layer beantworten Fachbereiche ihre eigenen Fragen; das Data-Team wird vom Bottleneck zum Enabler.
Consent-Konformität schriftlich
TCF 2.2 + Consent Mode v2 + KVKK-Policy sind auditierbar und testbar; das 'Evidence File' ist für rechtliche Prüfungen bereit.
Cross-Channel-Journey sichtbar
Per identity resolution eine geräte-/kanalunabhängige User-Journey; Attributionsmodelle und cohort-Analysen auf ganzheitlicher Datenbasis.
Nachhaltige Daten-Governance
Schema registry, PII-Tagging, Retention, RBAC, Audit-Log — per runbook + monatlichem Compliance-Report an Ihr Team übergeben.
LIEFERUMFANG
Konkrete, schriftliche Deliverables für jedes First-Party-Projekt
Architektur, Code, Konfiguration, Dokumentation und Schulung — jede Lieferung wird versioniert und an Ihr Team übergeben.
Signal-Audit-Report
Quantitative Bewertung von bestehendem Signalverlust, Consent-Verstößen und Tool-Duplikationen, 40-60 Seiten.
Event Taxonomy & Data Contracts
Namen, Eigenschaften, Owner, Schema-Version und Backward-Compatibility-Regeln aller Events.
sGTM-Container-Setup
Live-sGTM auf Google Cloud Run / AWS Fargate, blue/green deployment + CI/CD pipeline + Rollback-Plan.
CAPI-Integrationen
Server-seitige Conversion-Events für Meta, Google, TikTok, Pinterest; event deduplication + hashed PII + Error Handling.
Consent Mode v2 + CMP-Policy
IAB-TCF-2.2-konforme CMP-Konfiguration, dynamische Signale ad_user_data/ad_personalization, schriftliche Consent-Policy + Legal Review.
BigQuery/Snowflake warehouse
Raw-Event-Streaming-Pipeline, Partition + Clustering, Cost Optimization, Monitoring + Alerting.
dbt-Modelle + semantic layer
Staging → Intermediate → Marts-Schichten, dbt-Tests, Exposures, Lineage Graph + Documentation Site.
Identity-Resolution-Pipeline
Deterministische + probabilistische Matching-Regeln, Household-Detection, Cross-Device-Journey-Tabelle.
Reverse-ETL-Strecken
Census/Hightouch zur Segmentübertragung an Meta CA, Google CM, Klaviyo, HubSpot, Braze; Schedule + Monitoring.
Schema Registry & PII-Governance
Versionierte Schema-Einträge, PII-Tagging, Retention- + Masking-Richtlinie, Schema-Drift-Alarme.
Audit-Log + Compliance-Report
RBAC-Konfiguration, Data-Access-Log, monatlich automatisiert generierter Compliance-Report (KVKK/DSGVO + Werbeplattform-Policy).
Runbook + 3-wöchige Schulung
Operatives runbook, On-Call-Rotation, SLA-Vereinbarung + 3-wöchiges hands-on-Training für Ihr Team.
— LEISTUNGSUMFANG
Was wir tun und was nicht — klare Grenzen
First-Party-Architektur ist Engineering-Arbeit; ein klar definierter Scope verhindert Überraschungen und Nachforderungen.
Was wir tun
- Signal-Audit + Bewertung der Consent-Qualität
- Design von Event Taxonomy + Data Contracts
- sGTM-Container-Setup + CI/CD + Monitoring
- CAPI-Integrationen für Meta/Google/TikTok/Pinterest
- Consent Mode v2 + TCF 2.2 + CMP-Konfiguration
- BigQuery/Snowflake warehouse + Streaming-Pipeline
- dbt-Modelle + semantic layer + Tests
- Identity resolution (deterministisch + probabilistisch)
- Reverse-ETL-Strecken (Census/Hightouch)
- Schema registry + PII-Governance + Audit-Log
- Koordination von Legal-/Compliance-Reviews
- Runbook + 3-wöchiges hands-on-Training
Was wir nicht tun
- Rechtsberatung (koordiniert mit Partneranwalt + Policy-Review)
- Verkauf von CDP-Lizenzen (wir geben vendor-agnostische Empfehlungen, provisionsfrei)
- Betrieb eines fragmentierten SaaS-Stacks (wir empfehlen Konsolidierung)
- Raw-Analytics-Agenturstunden (statt Pakete arbeiten wir in Engineering-Sprints)
- Garantierte 'Pre-Pixel'-Signalrückgewinnung (wir nennen realistische Bandbreiten)
- warehouse-Lizenz / Cloud-Rechnung (verbleibt im Kundenkonto)
- Werbekontenverwaltung (separater Scope mit PPC-/Growth-Teams)
- Plug-and-play-SaaS-Deployment (jeder Kunde erhält eine Custom-Architektur)
HOW WE WORK
Erste 8 Wochen Setup → 6 Monate Betrieb — was wann gemacht wird, ist schriftlich fixiert
Woche 1-2: Audit + Discovery
Audit des bestehenden GTM/GA4/CMP/Pixels, Consent-Health-Check, Stakeholder-Interviews, Architektur-Anforderungsdokument.
Woche 3-4: Design + Data Contracts
Event Taxonomy, Identity-Strategie, warehouse-Schema, Consent-Policy, Data Contracts — Freigabe von Legal + IT + Marketing.
Woche 5-6: sGTM + CAPI Deploy
Cloud-Run-/Fargate-Container geht live; CAPI-Integration für Meta/Google/TikTok; shadow mode wird gestartet.
Woche 7-8: warehouse + dbt
BigQuery/Snowflake-Streaming-Pipeline, dbt Staging + Intermediate + Marts, erste Version des semantic layer.
Woche 9-10: Validate + Cutover
Event-Paritätstest, QA-Checkliste, blue/green cutover; Decommissioning-Plan für die Altarchitektur.
Woche 11-12: Govern + Handoff
Schema registry, PII-Tagging, Audit-Log, RBAC; hands-on-Training für Ihr Team beginnt, runbook wird übergeben.
Monat 4-5: Aktivierung + Optimierung
Reverse-ETL-Strecken, erste Segment-Aktivierungen, Datenvorbereitung für MMM/Attribution, Cost Optimization.
Monat 6+: Steady State + Audit
Monatlicher Compliance-Report, quartalsweises Data-Governance-Board, Schema-Drift-Monitoring, SLA + On-Call-Rotation.
— TOOLSET
Die von uns eingesetzten Tools — vendor-agnostisch, aber mit klarer Auswahl
Wir wählen für jeden Kunden die passende Lösung; unsere Unabhängigkeit wahren wir, indem wir keine Provisionen annehmen.
SERVER-SIDE TRACKING
CMP & CONSENT
WAREHOUSE & CDP
REVERSE ETL & ACTIVATION
QUESTIONS
Frequently asked
— GLOSSAR
Begriffe des First-Party-Data-Engineering
12 zentrale Begriffe, die Ihrem Team und den Stakeholdern eine gemeinsame Sprache geben.
- sGTM
- Server-side Google Tag Manager — ein Proxy, der das Payload des Browser-GTM aufnimmt, säubert und anreichert und an mehrere Destinations (GA4, Meta CAPI, TikTok etc.) verteilt. Verlängert Cookie-Lebensdauer, widersteht Adblockern und bildet das Rückgrat server-seitiger Conversion-APIs.
- CAPI
- Server-to-Server-Event-API von Meta, parallel zum Pixel. Holt die 20-40 % Conversion-Signal zurück, die im Browser durch ITP und Adblocker verloren gehen; für die Deduplication muss jedes Event eine event_id und denselben Zeitstempel tragen. Fundament jedes modernen Paid-Social-Stacks.
- Consent Mode v2
- Googles TCF-2.2-konformer Consent-Signal-Mechanismus; ad_user_data- + ad_personalization-States.
- TCF 2.2
- Seit 2024 verpflichtende Version des IAB Europe Transparency & Consent Framework. Standardisiert das Consent-Signal zwischen Publisher, Vendor und Nutzer; CMPs (OneTrust, Cookiebot, Didomi) liefern zusammen mit Google Consent Mode v2 die Pflicht-Compliance.
- Identity resolution
- Die Verknüpfung von Nutzeraktivitäten auf verschiedenen Geräten und Kanälen zu einer einzigen Identität; deterministisch + probabilistisch.
- CDP
- Customer Data Platform; System, das Nutzerprofile vereint und für Aktivierungskanäle öffnet (Segment, mParticle, warehouse-native).
- Reverse ETL
- Datenübertragung aus dem warehouse an operative Tools (Meta, Google, Klaviyo); Census und Hightouch sind typische Vendors.
- Customer Match
- Nutzung einer gehashten First-Party-Liste (E-Mail, Telefon, Postanschrift) als Targeting-/Exclusion-Audience in Google Search, YouTube und Display. Basis für Lookalike-Seeds und Win-back; sinnvoll meist erst ab einer Match Rate von 30 %+.
- Data warehouse
- Cloud-Datenspeicher für rohe und modellierte Event-Daten (BigQuery, Snowflake, Redshift, Databricks).
- Event schema
- Die schriftliche, versionierte Definition der Event-Namen, Eigenschaften, Datentypen und Owner; wird in einer schema registry gespeichert.
- PII
- Personally Identifiable Information; Daten, die eine Person identifizieren (E-Mail, Telefon, IP, Device-ID). Werden unter Tagging + Retention verwaltet.
- Data governance
- Die Gesamtheit der Disziplinen von Datenqualität, Zugriff, Steuerung und Compliance; RBAC + Audit-Log + Data Contracts sind Standard.
- GA4 Measurement Protocol
- Server-to-Server-Protokoll, das Events per HTTP direkt an GA4 sendet. Erzeugt Conversion-Signal aus Umgebungen ohne Web-Pixel (CRM, IoT, App-Server); Authentifizierung über api_secret + measurement_id, Consent-Mode-konform konfiguriert.
- Enhanced Conversions
- Mess-Layer in Google Ads, der Conversions per gehashte First-Party-Daten (E-Mail, Telefon) einem User zuordnet. Holt 3-15 % der durch ITP und Cookie-Verfall verlorenen Attribution zurück; gibt es in Web- und Lead-Form-Varianten.
- Offline Conversions
- Prozess, mit dem im CRM entstandene Conversions (Lead-to-Sale, Telefonabschluss, Storebesuch) per Click-ID (gclid/wbraid/fbclid) an die Ad-Plattform zurückgespielt werden. Zuverlässigster Weg, tROAS mit echtem Umsatz zu speisen.
- First-party Data
- Daten, die die Marke mit User-Consent direkt aus eigenen Properties (Web, App, CRM, Callcenter, E-Mail, Mitgliedschaft) erhebt. Robusteste Grundlage für Performance-Marketing nach dem Wegfall der Third-Party-Cookies; gehasht und in Ad-Plattformen aktiviert.
- Data Clean Room
- Sichere Rechenumgebung, in der zwei Parteien (z. B. Marke + Medien-Plattform) Matching und Aggregation durchführen, ohne sich gegenseitig die Roh-PII zu zeigen. Google Ads Data Hub, Amazon AMC, Snowflake/Databricks Clean Rooms — Overlap-Analyse, Attribution, Audience-Aufbau.
- Identity Graph
- Relationaler Graph, der eine Person über Geräte, E-Mail, Telefon, Zahlungs-Identifier und gehashte IDs hinweg verknüpft. Grundlage für Cross-Device-Attribution, Retention-Modelle und LAL-Seed-Qualität — das Herz jeder CDP.
- First-party Cookies
- Cookies, die die eigene Domain der Site setzt und die nur bei deren Requests mitgeschickt werden. Nach dem Wegfall der Third-Party-Cookies hat ITP auch diese Kategorie verkürzt — server-seitiges Cookie-Setting + 1y+-Rotationspolitik sind essenziell.
- Server-side Events
- Conversion-Events, die nicht vom Browser, sondern vom eigenen Server (sGTM, eigenes Backend) per API an die Ad-Plattform gesendet werden. Immun gegen Adblocker und Browser-Limits; nutzt Specs wie CAPI (Meta), GA4 MP, TikTok Events API.
- Hashed PII
- Personenbezogener Wert (E-Mail, Telefon, Name), der über eine Einweg-Kryptografie-Funktion (meist SHA-256) fixiert wird. Pflicht für Matching, Custom-Audience-Upload und Enhanced Conversions bei Ad-Plattformen — Privacy- und Compliance-Anforderung.
- Privacy Sandbox
- API-Suite von Google in Chrome, die Ad-Messung, Retargeting und Fraud-Detection ohne Third-Party-Cookies ermöglichen soll: Topics, Protected Audience (FLEDGE), Attribution Reporting. Die Google-Seite der Cookieless-Zukunft.
— ENTSCHEIDUNGSBAUM
Ist eine First-Party-Datenoperation für Sie geeignet?
Beantworten Sie 4 Fragen mit Ja/Nein; die Empfehlung soll eindeutig sein.
01 / 04
Liegt Ihr monatliches Werbebudget über 30k USD?
Schwelle, ab der die Signalrückgewinnung wirtschaftlich sinnvoll wird.
— LET'S BEGIN
Wie sehr vertrauen Sie Ihren Pixeln?
Mit einem 2-stündigen Signal-Audit decken wir verlorene Conversions, Consent-Probleme und warehouse-Chancen auf.