LA TUA ARCHITETTURA DATI
First-Party Data & Architettura di Misurazione
sGTM, Conversion API, data lake BigQuery/Snowflake, Consent Mode v2 + TCF 2.2, identity resolution e reverse ETL — l'infrastruttura dati dei brand che vincono nel mondo post-cookie di terza parte, costruita con disciplina ingegneristica da zero.
Non stiamo entrando nell'era della morte del pixel, ma in quella in cui la proprietà dei dati è obbligatoria; l'infrastruttura è lavoro di ingegneria, non un SaaS plug-and-play.
Con Consent Mode v2, iOS 17 ATT, i cambiamenti sui cookie di Chrome e TCF 2.2, il segnale verso le piattaforme pubblicitarie si è eroso mediamente del 40-60%. La maggior parte dei brand, senza accorgersene, ha costruito data lake paralleli con più strumenti SaaS; ogni strumento ha il suo ID, la sua interpretazione del consenso, il suo schema eventi. L'operazione first-party di Roibase nasce su sei principi che eliminano questa frammentazione; ogni principio non è un SaaS ma uno standard ingegneristico.
METODOLOGIA
AUDIT → DESIGN → DEPLOY → VALIDATE → GOVERN → HANDOFF — disciplina ingegneristica
L'architettura dati non è un progetto di tag management, ma una piattaforma a lungo termine. Il processo in sei fasi rende ogni decisione scritta, testabile e trasferibile.
01
AUDIT
Audit di GTM client-side, GA4, pixel, CMP, implementazione del consenso, flussi dati e visibilità sui costi; perdita di segnale, violazioni di consenso e duplicazioni dati vengono quantificate.
02
DESIGN
Si progettano event taxonomy, strategia di identity, consent policy, architettura warehouse e data contracts; si ottiene l'approvazione degli stakeholder (legal, IT, marketing, data).
03
DEPLOY
Si portano in produzione container sGTM, endpoint CAPI, configurazione Consent Mode v2, streaming warehouse e modelli dbt; il rischio si riduce con blue/green deployment.
04
VALIDATE
Con shadow mode + dual tracking, la vecchia e la nuova architettura girano in parallelo; il cutover non avviene finché la event parity non è al 99%+; la checklist QA conta 120+ punti.
05
GOVERN
Si attivano schema registry, PII tagging, retention, RBAC, audit log e report di compliance; il comitato di data governance si riunisce con cadenza mensile.
06
HANDOFF
Al tuo team: 3 settimane di training hands-on + runbook + 6 mesi di supporto asincrono; la rotazione on-call per gli alert critici e il contratto SLA vengono trasferiti per iscritto.
— CONFRONTO
In-house vs agenzia SaaS-dependent vs ingegneria dati Roibase
La differenza concreta tra i tre approcci su proprietà dei dati, conformità al consenso, profondità ingegneristica e costo totale.
| Dimensione | In-house minimale | Agenzia SaaS-dependent | Ingegneria Roibase |
|---|---|---|---|
| Proprietà dei dati | Frammentata (ogni tool il suo DB) | Presso il fornitore SaaS | Nel tuo warehouse |
| sGTM + CAPI | Parziale (solo client) | Assente o gestita dal vendor | Nella tua infrastruttura, piena proprietà |
| Consent Mode v2 + TCF 2.2 | Integrazione di base | CMP pre-set, senza personalizzazione | Policy scritta + legal review + test |
| Identity resolution | Assente o solo email | Vendor black-box | Modello aperto deterministico + probabilistico |
| PII governance + audit log | Ad-hoc | Contrattuale, non operativa | Runbook + report di compliance mensile |
| Data contracts + schema registry | Assenti | Dipendenti dallo schema SaaS | Versionati, testabili, di proprietà |
| Reverse ETL + activation | CSV manuale | Vincolato al SaaS | Warehouse-native, scelta libera |
| Costo totale annuo | 50-120k€ (SaaS frammentati) | 120-250k€ (agenzia + licenze) | 80-180k€ (setup + warehouse) |
PROOF
Outcomes, measured
Recupero delle conversioni non attribuite dopo iOS 14+/ATT grazie a sGTM + CAPI.
Distribuzione accettabile degli stati di consenso dopo TCF 2.2 + Consent Mode v2.
Numero tipico di tool SaaS data/analytics separati che si riescono a unificare per cliente.
Nel tuo warehouse — solo costi di query + storage; nessun per-seat SaaS.
Timeline tipica dall'audit allo shadow mode live per un cliente mid-market.
Successo medio di consegna eventi dopo il dual-path sGTM + CAPI.
WHAT WE DO
Engagement scope
Every offering is an outcome-based work package. Roibase blends strategy and execution inside a single team — no hand-offs.
Server-side GTM (sGTM)
Il tuo container sGTM su Google Cloud Run / AWS Fargate: la proprietà dei dati è tua, niente vendor lock-in, il carico client si riduce; la PII redaction avviene sul server.
Consent Mode v2 + TCF 2.2
Integrazione CMP conforme a IAB TCF 2.2, invio dinamico dei segnali ad_user_data + ad_personalization in base allo stato di consenso; separazione 'legal basis' KVKK/GDPR documentata per iscritto.
Conversion API (CAPI)
Eventi di conversione server-side per Meta, Google, TikTok, Pinterest; hashed PII + event deduplication; recupero del 30-50% del segnale e conformità iOS 14+/ATT.
Data lake BigQuery / Snowflake
Streaming di eventi raw + modelli dbt + semantic layer + visualizzazione con Looker Studio/Metabase/Looker; partition + clustering + cost optimization inclusi.
Identity resolution
Identity graph deterministico (login, hash email) + probabilistico (device fingerprint, household); una sola identità utente per journey cross-device e attribuzione cross-channel.
CDP readiness
Integrazione con Segment / RudderStack / mParticle o CDP warehouse-native (Census, Hightouch) con pipeline di reverse ETL; la scelta del CDP avviene con valutazione indipendente.
Reverse ETL & activation
Trasferimento automatico dei segmenti calcolati (churn risk, LTV tier, product affinity) verso Meta Custom Audience, Google Customer Match, Klaviyo, HubSpot, Braze.
Rebuild Customer Match
Ricostruzione di lookalike + retargeting con hashed PII + CAPI; l'infrastruttura che preserva le performance delle piattaforme pubblicitarie in un mondo senza pixel.
Schema registry + PII governance
Schema eventi versionato e testabile; i campi PII vengono taggati e sottoposti a policy di retention + masking; monitoring della qualità dati con alert sullo schema drift.
Audit log + monitoraggio accessi
Viene loggato chi accede a quali dati, quando e con quale finalità; role-based access control (RBAC), data contracts e report di compliance generati automaticamente ogni mese.
— VANTAGGI
Il ritorno concreto e misurabile della proprietà dei dati
L'architettura first-party non è solo conformità; è leva diretta per performance pubblicitaria, comprensione del cliente e velocità del team.
Recupero del segnale pubblicitario
Con Meta/Google/TikTok CAPI recuperi il 30-50% del segnale; la velocità di apprendimento e la qualità di ottimizzazione delle piattaforme migliorano sensibilmente.
Costi degli strumenti in calo
Lo stack SaaS frammentato si consolida in un unico warehouse + layer dbt; la spesa annuale di licenze cala del 40-60%.
Il tuo team guadagna velocità
Con un semantic layer self-serve ogni business unit risponde da sola alle proprie domande; il data team passa da bottleneck a enabler.
Consenso conforme per iscritto
TCF 2.2 + Consent Mode v2 + policy KVKK sottoposti ad audit e testabili; in caso di controllo legale l'evidence file è pronto.
Journey cross-channel visibile
Con l'identity resolution il percorso utente è indipendente da dispositivo/canale; i modelli di attribuzione e le analisi di cohort girano su dati unificati.
Data governance sostenibile
Schema registry, PII tagging, retention, RBAC, audit log — consegnati al tuo team con runbook + report di compliance mensile.
DELIVERABLE
Consegne concrete e documentate per ogni progetto first-party
Architettura, codice, configurazione, documentazione e formazione — ogni deliverable è versionato e trasferito al tuo team.
Report di signal audit
Valutazione quantitativa di perdita di segnale, violazioni di consenso e duplicazioni tool, 40-60 pagine.
Event taxonomy & data contracts
Nomi, proprietà, owner, versione schema e regole di backward compatibility di tutti gli eventi.
Setup container sGTM
sGTM live su Google Cloud Run / AWS Fargate, blue/green deployment + pipeline CI/CD + piano di rollback.
Integrazioni CAPI
Eventi di conversione server-side per Meta, Google, TikTok, Pinterest; event deduplication + hashed PII + error handling.
Consent Mode v2 + CMP policy
Configurazione CMP conforme a IAB TCF 2.2, segnali dinamici ad_user_data/ad_personalization, consent policy scritta + legal review.
Warehouse BigQuery/Snowflake
Pipeline di streaming eventi raw, partition + clustering, cost optimization, monitoring + alerting.
Modelli dbt + semantic layer
Layer staging → intermediate → marts, test dbt, exposures, lineage graph + sito di documentazione.
Pipeline di identity resolution
Regole di matching deterministico + probabilistico, household detection, tabella cross-device journey.
Pipeline di reverse ETL
Trasferimento segmenti a Meta CA, Google CM, Klaviyo, HubSpot, Braze via Census/Hightouch; schedule + monitoring.
Schema registry & PII governance
Registri di schema versionati, PII tagging, policy di retention + masking, alert su schema drift.
Audit log + report di compliance
Configurazione RBAC, log degli accessi ai dati, report di compliance mensile automatico (KVKK/GDPR + policy pubblicitarie).
Runbook + 3 settimane di training
Runbook operativo, rotazione on-call, contratto SLA + 3 settimane di training hands-on al tuo team.
— PERIMETRO
Cosa facciamo, cosa non facciamo — confini chiari
L'architettura first-party è ingegneria; definire il perimetro in modo netto evita sorprese e fatture aggiuntive.
Lo facciamo
- Signal audit + valutazione della salute del consenso
- Progettazione di event taxonomy + data contracts
- Setup container sGTM + CI/CD + monitoring
- Integrazioni CAPI per Meta/Google/TikTok/Pinterest
- Configurazione Consent Mode v2 + TCF 2.2 + CMP
- Warehouse BigQuery/Snowflake + pipeline di streaming
- Modelli dbt + semantic layer + test
- Identity resolution (deterministica + probabilistica)
- Pipeline di reverse ETL (Census/Hightouch)
- Schema registry + PII governance + audit log
- Coordinamento legal/compliance review
- Runbook + 3 settimane di training hands-on
Non lo facciamo
- Consulenza legale (coordiniamo avvocato partner + policy review)
- Vendita di licenze CDP (proposta vendor-agnostica, senza commissioni)
- Mantenimento di stack SaaS frammentati (proponiamo il consolidamento)
- Ore di raw analytics agency (niente pacchetti, ma sprint ingegneristici)
- Recupero segnale 'pre-pixel' garantito (diamo range realistici)
- Licenze warehouse / fatture cloud (restano sul conto del cliente)
- Gestione account pubblicitari (ambito separato con team PPC/Growth)
- Deployment SaaS plug-and-play (ogni cliente ha architettura custom)
HOW WE WORK
Setup nelle prime 8 settimane → 6 mesi di operatività — cosa succede e quando, per iscritto
Settimana 1-2: audit + discovery
Audit di GTM/GA4/CMP/pixel esistenti, consent health check, interviste agli stakeholder, documento di requisiti architetturali.
Settimana 3-4: design + data contracts
Event taxonomy, strategia di identity, schema warehouse, consent policy, data contracts — approvazione legal + IT + marketing.
Settimana 5-6: deploy sGTM + CAPI
Container Cloud Run/Fargate live; integrazione CAPI Meta/Google/TikTok; avvio shadow mode.
Settimana 7-8: warehouse + dbt
Pipeline di streaming BigQuery/Snowflake, dbt staging + intermediate + marts, prima versione del semantic layer.
Settimana 9-10: validate + cutover
Test di event parity, checklist QA, cutover blue/green; piano di decommissioning della vecchia architettura.
Settimana 11-12: govern + handoff
Schema registry, PII tagging, audit log, RBAC; parte il training hands-on al tuo team, viene consegnato il runbook.
Mese 4-5: activation + optimization
Pipeline di reverse ETL, prime attivazioni dei segmenti, preparazione dati per MMM/attribution, cost optimization.
Mese 6+: steady state + audit
Report di compliance mensile, comitato di data governance trimestrale, monitoring dello schema drift, SLA + rotazione on-call.
— TOOLKIT
Gli strumenti che usiamo — vendor-agnostici ma con scelte precise
Scegliamo ciò che è giusto per ogni cliente; proteggiamo la nostra indipendenza non incassando commissioni.
SERVER-SIDE TRACKING
CMP & CONSENT
WAREHOUSE & CDP
REVERSE ETL & ACTIVATION
QUESTIONS
Frequently asked
— GLOSSARIO
Termini di ingegneria dei dati first-party
12 termini chiave che danno al tuo team e agli stakeholder un linguaggio comune.
- sGTM
- Server-side Google Tag Manager — un proxy che prende il payload del GTM del browser, lo pulisce e arricchisce, poi lo distribuisce a più destinazioni (GA4, Meta CAPI, TikTok ecc.). Estende la vita dei cookie, resiste agli ad-blocker ed è la spina dorsale delle conversion API server-side.
- CAPI
- API event server-to-server di Meta in parallelo al Pixel. Recupera il 20-40 % di signal di conversion perso nel browser per ITP e ad-blocker; per la deduplicazione ogni event deve portare event_id e stesso timestamp. Fondamento di ogni stack paid social moderno.
- Consent Mode v2
- Il meccanismo Google di segnalazione del consenso conforme a TCF 2.2; stati ad_user_data + ad_personalization.
- TCF 2.2
- Versione del Transparency & Consent Framework di IAB Europe obbligatoria dal 2024. Standardizza il signal di consent tra publisher, vendor e utente; i CMP (OneTrust, Cookiebot, Didomi) forniscono la compliance obbligatoria insieme a Google Consent Mode v2.
- Identity resolution
- Associazione delle attività utente tra diversi dispositivi e canali a una singola identità; deterministica + probabilistica.
- CDP
- Customer Data Platform; sistema che unifica i profili utente e li espone ai canali di attivazione (Segment, mParticle, warehouse-native).
- Reverse ETL
- Trasferimento dei dati dal warehouse agli strumenti operativi (Meta, Google, Klaviyo); Census, Hightouch sono i vendor tipici.
- Customer Match
- Utilizzo di una lista first-party hashata (email, telefono, indirizzo postale) come audience di targeting/exclusion su Google Search, YouTube e Display. Base per seed lookalike e win-back; utile di solito da match rate 30 %+.
- Data warehouse
- Il deposito dati cloud in cui risiedono eventi raw e modellati (BigQuery, Snowflake, Redshift, Databricks).
- Event schema
- Definizione scritta e versionata di nomi, proprietà, tipi di dato e owner degli eventi; conservata nello schema registry.
- PII
- Personally Identifiable Information; dati che identificano una persona (email, telefono, IP, device ID). Gestiti con tagging + retention.
- Data governance
- L'insieme delle discipline di qualità, accesso, governance e conformità dei dati; RBAC + audit log + data contracts sono standard.
- GA4 Measurement Protocol
- Protocollo server-to-server che invia event direttamente a GA4 via HTTP. Genera signal di conversion da ambienti senza pixel web (CRM, IoT, app server); auth con api_secret + measurement_id, configurato per rispettare Consent Mode.
- Enhanced Conversions
- Layer di misurazione in Google Ads che lega la conversion all'utente tramite first-party data hashata (email, telefono). Recupera il 3-15 % di attribution persa per ITP e decadimento cookie; varianti web e lead-form.
- Offline Conversions
- Processo per restituire alla piattaforma ads le conversion avvenute nel CRM (lead-to-sale, chiusura in call, visita in store) tramite click ID (gclid/wbraid/fbclid). Il modo più affidabile per alimentare tROAS con revenue reale.
- First-party Data
- Dati che il brand raccoglie direttamente dalle proprie properties (web, app, CRM, call center, email, membership) con consenso utente. Il carburante più solido del performance dopo i third-party cookie; viene hashato e attivato in piattaforma.
- Data Clean Room
- Ambiente di calcolo sicuro in cui due parti (es. brand + piattaforma media) fanno match e aggregazione senza esporre i PII grezzi. Google Ads Data Hub, Amazon AMC, Snowflake/Databricks clean room — overlap, attribution e audience building.
- Identity Graph
- Grafo relazionale che collega una stessa persona attraverso device, email, telefono, identificativo di pagamento e ID hashati. Base per attribution cross-device, modelli di retention e qualità del seed LAL — il cuore del CDP.
- First-party Cookies
- Cookie impostati dal dominio stesso del sito e inviati solo nelle sue request. Dopo il blocco dei third-party, ITP ha accorciato anche questa categoria — cookie set server-side + policy di rotazione 1y+ diventano essenziali.
- Server-side Events
- Event di conversion inviati alla piattaforma ads via API dal tuo server (sGTM, backend) invece che dal browser. Immuni ad ad-blocker e limiti del browser; usano spec come CAPI (Meta), GA4 MP, TikTok Events API.
- Hashed PII
- Identificativo personale (email, telefono, nome) congelato tramite funzione crittografica one-way (di solito SHA-256). Obbligatorio per matching, upload custom audience ed Enhanced Conversions sulle piattaforme ads — requisito privacy e compliance.
- Privacy Sandbox
- Suite di API Chrome di Google pensata per misurazione pubblicitaria, retargeting e fraud detection senza third-party cookie: Topics, Protected Audience (FLEDGE), Attribution Reporting. Il lato Google del futuro cookieless.
— ALBERO DECISIONALE
Un'operazione di dati first-party è adatta a te?
Rispondi Sì/No a 4 domande; il risultato è una raccomandazione chiara.
01 / 04
Il tuo budget pubblicitario mensile supera i 30k USD?
Soglia perché il recupero del segnale sia economicamente rilevante.
— LET'S BEGIN
Quanto ti fidi davvero dei tuoi pixel?
Con un signal audit di 2 ore mettiamo in luce conversioni perse, problemi di consenso e opportunità sul warehouse.