LA TUA ARCHITETTURA DATI

First-Party Data & Architettura di Misurazione

sGTM, Conversion API, data lake BigQuery/Snowflake, Consent Mode v2 + TCF 2.2, identity resolution e reverse ETL — l'infrastruttura dati dei brand che vincono nel mondo post-cookie di terza parte, costruita con disciplina ingegneristica da zero.

Non stiamo entrando nell'era della morte del pixel, ma in quella in cui la proprietà dei dati è obbligatoria; l'infrastruttura è lavoro di ingegneria, non un SaaS plug-and-play.

Con Consent Mode v2, iOS 17 ATT, i cambiamenti sui cookie di Chrome e TCF 2.2, il segnale verso le piattaforme pubblicitarie si è eroso mediamente del 40-60%. La maggior parte dei brand, senza accorgersene, ha costruito data lake paralleli con più strumenti SaaS; ogni strumento ha il suo ID, la sua interpretazione del consenso, il suo schema eventi. L'operazione first-party di Roibase nasce su sei principi che eliminano questa frammentazione; ogni principio non è un SaaS ma uno standard ingegneristico.

Roibase perspective

METODOLOGIA

AUDIT → DESIGN → DEPLOY → VALIDATE → GOVERN → HANDOFF — disciplina ingegneristica

L'architettura dati non è un progetto di tag management, ma una piattaforma a lungo termine. Il processo in sei fasi rende ogni decisione scritta, testabile e trasferibile.

01

01

AUDIT

Audit di GTM client-side, GA4, pixel, CMP, implementazione del consenso, flussi dati e visibilità sui costi; perdita di segnale, violazioni di consenso e duplicazioni dati vengono quantificate.

02

02

DESIGN

Si progettano event taxonomy, strategia di identity, consent policy, architettura warehouse e data contracts; si ottiene l'approvazione degli stakeholder (legal, IT, marketing, data).

03

03

DEPLOY

Si portano in produzione container sGTM, endpoint CAPI, configurazione Consent Mode v2, streaming warehouse e modelli dbt; il rischio si riduce con blue/green deployment.

04

04

VALIDATE

Con shadow mode + dual tracking, la vecchia e la nuova architettura girano in parallelo; il cutover non avviene finché la event parity non è al 99%+; la checklist QA conta 120+ punti.

05

05

GOVERN

Si attivano schema registry, PII tagging, retention, RBAC, audit log e report di compliance; il comitato di data governance si riunisce con cadenza mensile.

06

06

HANDOFF

Al tuo team: 3 settimane di training hands-on + runbook + 6 mesi di supporto asincrono; la rotazione on-call per gli alert critici e il contratto SLA vengono trasferiti per iscritto.

— CONFRONTO

In-house vs agenzia SaaS-dependent vs ingegneria dati Roibase

La differenza concreta tra i tre approcci su proprietà dei dati, conformità al consenso, profondità ingegneristica e costo totale.

DimensioneIn-house minimaleAgenzia SaaS-dependentIngegneria Roibase
Proprietà dei datiFrammentata (ogni tool il suo DB)Presso il fornitore SaaSNel tuo warehouse
sGTM + CAPIParziale (solo client)Assente o gestita dal vendorNella tua infrastruttura, piena proprietà
Consent Mode v2 + TCF 2.2Integrazione di baseCMP pre-set, senza personalizzazionePolicy scritta + legal review + test
Identity resolutionAssente o solo emailVendor black-boxModello aperto deterministico + probabilistico
PII governance + audit logAd-hocContrattuale, non operativaRunbook + report di compliance mensile
Data contracts + schema registryAssentiDipendenti dallo schema SaaSVersionati, testabili, di proprietà
Reverse ETL + activationCSV manualeVincolato al SaaSWarehouse-native, scelta libera
Costo totale annuo50-120k€ (SaaS frammentati)120-250k€ (agenzia + licenze)80-180k€ (setup + warehouse)

PROOF

Outcomes, measured

+45%
Recupero del segnale

Recupero delle conversioni non attribuite dopo iOS 14+/ATT grazie a sGTM + CAPI.

94%
Tasso di conformità consenso

Distribuzione accettabile degli stati di consenso dopo TCF 2.2 + Consent Mode v2.

12
Consolidamento strumenti

Numero tipico di tool SaaS data/analytics separati che si riescono a unificare per cliente.

€0
Costo mensile licenze dati

Nel tuo warehouse — solo costi di query + storage; nessun per-seat SaaS.

8
Settimane di setup

Timeline tipica dall'audit allo shadow mode live per un cliente mid-market.

99,8%
Tasso di consegna eventi

Successo medio di consegna eventi dopo il dual-path sGTM + CAPI.

WHAT WE DO

Engagement scope

Every offering is an outcome-based work package. Roibase blends strategy and execution inside a single team — no hand-offs.

01 / 10

Server-side GTM (sGTM)

Il tuo container sGTM su Google Cloud Run / AWS Fargate: la proprietà dei dati è tua, niente vendor lock-in, il carico client si riduce; la PII redaction avviene sul server.

02 / 10

Consent Mode v2 + TCF 2.2

Integrazione CMP conforme a IAB TCF 2.2, invio dinamico dei segnali ad_user_data + ad_personalization in base allo stato di consenso; separazione 'legal basis' KVKK/GDPR documentata per iscritto.

03 / 10

Conversion API (CAPI)

Eventi di conversione server-side per Meta, Google, TikTok, Pinterest; hashed PII + event deduplication; recupero del 30-50% del segnale e conformità iOS 14+/ATT.

04 / 10

Data lake BigQuery / Snowflake

Streaming di eventi raw + modelli dbt + semantic layer + visualizzazione con Looker Studio/Metabase/Looker; partition + clustering + cost optimization inclusi.

05 / 10

Identity resolution

Identity graph deterministico (login, hash email) + probabilistico (device fingerprint, household); una sola identità utente per journey cross-device e attribuzione cross-channel.

06 / 10

CDP readiness

Integrazione con Segment / RudderStack / mParticle o CDP warehouse-native (Census, Hightouch) con pipeline di reverse ETL; la scelta del CDP avviene con valutazione indipendente.

07 / 10

Reverse ETL & activation

Trasferimento automatico dei segmenti calcolati (churn risk, LTV tier, product affinity) verso Meta Custom Audience, Google Customer Match, Klaviyo, HubSpot, Braze.

08 / 10

Rebuild Customer Match

Ricostruzione di lookalike + retargeting con hashed PII + CAPI; l'infrastruttura che preserva le performance delle piattaforme pubblicitarie in un mondo senza pixel.

09 / 10

Schema registry + PII governance

Schema eventi versionato e testabile; i campi PII vengono taggati e sottoposti a policy di retention + masking; monitoring della qualità dati con alert sullo schema drift.

10 / 10

Audit log + monitoraggio accessi

Viene loggato chi accede a quali dati, quando e con quale finalità; role-based access control (RBAC), data contracts e report di compliance generati automaticamente ogni mese.

— VANTAGGI

Il ritorno concreto e misurabile della proprietà dei dati

L'architettura first-party non è solo conformità; è leva diretta per performance pubblicitaria, comprensione del cliente e velocità del team.

+45% segnale

Recupero del segnale pubblicitario

Con Meta/Google/TikTok CAPI recuperi il 30-50% del segnale; la velocità di apprendimento e la qualità di ottimizzazione delle piattaforme migliorano sensibilmente.

−52% spesa SaaS

Costi degli strumenti in calo

Lo stack SaaS frammentato si consolida in un unico warehouse + layer dbt; la spesa annuale di licenze cala del 40-60%.

+38% velocità decisionale

Il tuo team guadagna velocità

Con un semantic layer self-serve ogni business unit risponde da sola alle proprie domande; il data team passa da bottleneck a enabler.

100% audit-ready

Consenso conforme per iscritto

TCF 2.2 + Consent Mode v2 + policy KVKK sottoposti ad audit e testabili; in caso di controllo legale l'evidence file è pronto.

+28% accuratezza attribuzione

Journey cross-channel visibile

Con l'identity resolution il percorso utente è indipendente da dispositivo/canale; i modelli di attribuzione e le analisi di cohort girano su dati unificati.

Runbook + RACI

Data governance sostenibile

Schema registry, PII tagging, retention, RBAC, audit log — consegnati al tuo team con runbook + report di compliance mensile.

DELIVERABLE

Consegne concrete e documentate per ogni progetto first-party

Architettura, codice, configurazione, documentazione e formazione — ogni deliverable è versionato e trasferito al tuo team.

  • Report di signal audit

    Valutazione quantitativa di perdita di segnale, violazioni di consenso e duplicazioni tool, 40-60 pagine.

  • Event taxonomy & data contracts

    Nomi, proprietà, owner, versione schema e regole di backward compatibility di tutti gli eventi.

  • Setup container sGTM

    sGTM live su Google Cloud Run / AWS Fargate, blue/green deployment + pipeline CI/CD + piano di rollback.

  • Integrazioni CAPI

    Eventi di conversione server-side per Meta, Google, TikTok, Pinterest; event deduplication + hashed PII + error handling.

  • Consent Mode v2 + CMP policy

    Configurazione CMP conforme a IAB TCF 2.2, segnali dinamici ad_user_data/ad_personalization, consent policy scritta + legal review.

  • Warehouse BigQuery/Snowflake

    Pipeline di streaming eventi raw, partition + clustering, cost optimization, monitoring + alerting.

  • Modelli dbt + semantic layer

    Layer staging → intermediate → marts, test dbt, exposures, lineage graph + sito di documentazione.

  • Pipeline di identity resolution

    Regole di matching deterministico + probabilistico, household detection, tabella cross-device journey.

  • Pipeline di reverse ETL

    Trasferimento segmenti a Meta CA, Google CM, Klaviyo, HubSpot, Braze via Census/Hightouch; schedule + monitoring.

  • Schema registry & PII governance

    Registri di schema versionati, PII tagging, policy di retention + masking, alert su schema drift.

  • Audit log + report di compliance

    Configurazione RBAC, log degli accessi ai dati, report di compliance mensile automatico (KVKK/GDPR + policy pubblicitarie).

  • Runbook + 3 settimane di training

    Runbook operativo, rotazione on-call, contratto SLA + 3 settimane di training hands-on al tuo team.

— PERIMETRO

Cosa facciamo, cosa non facciamo — confini chiari

L'architettura first-party è ingegneria; definire il perimetro in modo netto evita sorprese e fatture aggiuntive.

Lo facciamo

  • Signal audit + valutazione della salute del consenso
  • Progettazione di event taxonomy + data contracts
  • Setup container sGTM + CI/CD + monitoring
  • Integrazioni CAPI per Meta/Google/TikTok/Pinterest
  • Configurazione Consent Mode v2 + TCF 2.2 + CMP
  • Warehouse BigQuery/Snowflake + pipeline di streaming
  • Modelli dbt + semantic layer + test
  • Identity resolution (deterministica + probabilistica)
  • Pipeline di reverse ETL (Census/Hightouch)
  • Schema registry + PII governance + audit log
  • Coordinamento legal/compliance review
  • Runbook + 3 settimane di training hands-on

Non lo facciamo

  • Consulenza legale (coordiniamo avvocato partner + policy review)
  • Vendita di licenze CDP (proposta vendor-agnostica, senza commissioni)
  • Mantenimento di stack SaaS frammentati (proponiamo il consolidamento)
  • Ore di raw analytics agency (niente pacchetti, ma sprint ingegneristici)
  • Recupero segnale 'pre-pixel' garantito (diamo range realistici)
  • Licenze warehouse / fatture cloud (restano sul conto del cliente)
  • Gestione account pubblicitari (ambito separato con team PPC/Growth)
  • Deployment SaaS plug-and-play (ogni cliente ha architettura custom)

HOW WE WORK

Setup nelle prime 8 settimane → 6 mesi di operatività — cosa succede e quando, per iscritto

01

Settimana 1-2: audit + discovery

Audit di GTM/GA4/CMP/pixel esistenti, consent health check, interviste agli stakeholder, documento di requisiti architetturali.

02

Settimana 3-4: design + data contracts

Event taxonomy, strategia di identity, schema warehouse, consent policy, data contracts — approvazione legal + IT + marketing.

03

Settimana 5-6: deploy sGTM + CAPI

Container Cloud Run/Fargate live; integrazione CAPI Meta/Google/TikTok; avvio shadow mode.

04

Settimana 7-8: warehouse + dbt

Pipeline di streaming BigQuery/Snowflake, dbt staging + intermediate + marts, prima versione del semantic layer.

05

Settimana 9-10: validate + cutover

Test di event parity, checklist QA, cutover blue/green; piano di decommissioning della vecchia architettura.

06

Settimana 11-12: govern + handoff

Schema registry, PII tagging, audit log, RBAC; parte il training hands-on al tuo team, viene consegnato il runbook.

07

Mese 4-5: activation + optimization

Pipeline di reverse ETL, prime attivazioni dei segmenti, preparazione dati per MMM/attribution, cost optimization.

08

Mese 6+: steady state + audit

Report di compliance mensile, comitato di data governance trimestrale, monitoring dello schema drift, SLA + rotazione on-call.

— TOOLKIT

Gli strumenti che usiamo — vendor-agnostici ma con scelte precise

Scegliamo ciò che è giusto per ogni cliente; proteggiamo la nostra indipendenza non incassando commissioni.

SERVER-SIDE TRACKING

Google Tag Manager ServerStape.ioGoogle Cloud RunAWS FargateMeta Conversion APIGoogle Ads Enhanced ConversionsTikTok Events APIPinterest CAPI

CMP & CONSENT

OneTrustCookiebotDidomiUsercentricsGoogle Consent Mode v2IAB TCF 2.2

WAREHOUSE & CDP

BigQuerySnowflakeRedshiftdbt Core/CloudSegmentRudderStackmParticleAmplitude

REVERSE ETL & ACTIVATION

CensusHightouchPolytomicFivetranAirbyteStitchMeta Custom Audience APIGoogle Customer Match API

QUESTIONS

Frequently asked

Tre vantaggi concreti: (1) recupero del 30-50% del segnale bypassando ad-blocker + ITP, (2) proprietà dei dati — la PII redaction avviene sul server, (3) miglior velocità di caricamento delle pagine perché il carico degli script client-side si riduce. In più rompi il vendor lock-in; tutta la logica dei tag vive nel tuo cloud.

— GLOSSARIO

Termini di ingegneria dei dati first-party

12 termini chiave che danno al tuo team e agli stakeholder un linguaggio comune.

01
sGTM
Server-side Google Tag Manager — un proxy che prende il payload del GTM del browser, lo pulisce e arricchisce, poi lo distribuisce a più destinazioni (GA4, Meta CAPI, TikTok ecc.). Estende la vita dei cookie, resiste agli ad-blocker ed è la spina dorsale delle conversion API server-side.
CAPIConsent Mode v2
02
CAPI
API event server-to-server di Meta in parallelo al Pixel. Recupera il 20-40 % di signal di conversion perso nel browser per ITP e ad-blocker; per la deduplicazione ogni event deve portare event_id e stesso timestamp. Fondamento di ogni stack paid social moderno.
sGTMCustomer Match
03
Consent Mode v2
Il meccanismo Google di segnalazione del consenso conforme a TCF 2.2; stati ad_user_data + ad_personalization.
TCF 2.2PII
04
TCF 2.2
Versione del Transparency & Consent Framework di IAB Europe obbligatoria dal 2024. Standardizza il signal di consent tra publisher, vendor e utente; i CMP (OneTrust, Cookiebot, Didomi) forniscono la compliance obbligatoria insieme a Google Consent Mode v2.
Consent Mode v2
05
Identity resolution
Associazione delle attività utente tra diversi dispositivi e canali a una singola identità; deterministica + probabilistica.
CDPCustomer Match
06
CDP
Customer Data Platform; sistema che unifica i profili utente e li espone ai canali di attivazione (Segment, mParticle, warehouse-native).
Reverse ETLData warehouse
07
Reverse ETL
Trasferimento dei dati dal warehouse agli strumenti operativi (Meta, Google, Klaviyo); Census, Hightouch sono i vendor tipici.
CDPData warehouse
08
Customer Match
Utilizzo di una lista first-party hashata (email, telefono, indirizzo postale) come audience di targeting/exclusion su Google Search, YouTube e Display. Base per seed lookalike e win-back; utile di solito da match rate 30 %+.
CAPIPII
09
Data warehouse
Il deposito dati cloud in cui risiedono eventi raw e modellati (BigQuery, Snowflake, Redshift, Databricks).
Event schemaData governance
10
Event schema
Definizione scritta e versionata di nomi, proprietà, tipi di dato e owner degli eventi; conservata nello schema registry.
Data governance
11
PII
Personally Identifiable Information; dati che identificano una persona (email, telefono, IP, device ID). Gestiti con tagging + retention.
Data governanceConsent Mode v2
12
Data governance
L'insieme delle discipline di qualità, accesso, governance e conformità dei dati; RBAC + audit log + data contracts sono standard.
PIIEvent schema
13
GA4 Measurement Protocol
Protocollo server-to-server che invia event direttamente a GA4 via HTTP. Genera signal di conversion da ambienti senza pixel web (CRM, IoT, app server); auth con api_secret + measurement_id, configurato per rispettare Consent Mode.
14
Enhanced Conversions
Layer di misurazione in Google Ads che lega la conversion all'utente tramite first-party data hashata (email, telefono). Recupera il 3-15 % di attribution persa per ITP e decadimento cookie; varianti web e lead-form.
15
Offline Conversions
Processo per restituire alla piattaforma ads le conversion avvenute nel CRM (lead-to-sale, chiusura in call, visita in store) tramite click ID (gclid/wbraid/fbclid). Il modo più affidabile per alimentare tROAS con revenue reale.
16
First-party Data
Dati che il brand raccoglie direttamente dalle proprie properties (web, app, CRM, call center, email, membership) con consenso utente. Il carburante più solido del performance dopo i third-party cookie; viene hashato e attivato in piattaforma.
17
Data Clean Room
Ambiente di calcolo sicuro in cui due parti (es. brand + piattaforma media) fanno match e aggregazione senza esporre i PII grezzi. Google Ads Data Hub, Amazon AMC, Snowflake/Databricks clean room — overlap, attribution e audience building.
18
Identity Graph
Grafo relazionale che collega una stessa persona attraverso device, email, telefono, identificativo di pagamento e ID hashati. Base per attribution cross-device, modelli di retention e qualità del seed LAL — il cuore del CDP.
19
First-party Cookies
Cookie impostati dal dominio stesso del sito e inviati solo nelle sue request. Dopo il blocco dei third-party, ITP ha accorciato anche questa categoria — cookie set server-side + policy di rotazione 1y+ diventano essenziali.
20
Server-side Events
Event di conversion inviati alla piattaforma ads via API dal tuo server (sGTM, backend) invece che dal browser. Immuni ad ad-blocker e limiti del browser; usano spec come CAPI (Meta), GA4 MP, TikTok Events API.
21
Hashed PII
Identificativo personale (email, telefono, nome) congelato tramite funzione crittografica one-way (di solito SHA-256). Obbligatorio per matching, upload custom audience ed Enhanced Conversions sulle piattaforme ads — requisito privacy e compliance.
22
Privacy Sandbox
Suite di API Chrome di Google pensata per misurazione pubblicitaria, retargeting e fraud detection senza third-party cookie: Topics, Protected Audience (FLEDGE), Attribution Reporting. Il lato Google del futuro cookieless.

— ALBERO DECISIONALE

Un'operazione di dati first-party è adatta a te?

Rispondi Sì/No a 4 domande; il risultato è una raccomandazione chiara.

01 / 04

Il tuo budget pubblicitario mensile supera i 30k USD?

Soglia perché il recupero del segnale sia economicamente rilevante.

— LET'S BEGIN

Quanto ti fidi davvero dei tuoi pixel?

Con un signal audit di 2 ore mettiamo in luce conversioni perse, problemi di consenso e opportunità sul warehouse.