Data mart

atlante – nuove tecnologie

Un data mart è un raccoglitore di dati specializzato che viene estratto e aggregato partendo da un data warehouse più generale. Un data warehouse viene progettato e creato per poter rispondere a diverse esigenze di knowledge management e di business intelligence, un data mart viene progettato e creato per rispondere ad un’esigenza specifica. La riduzione dei dati da trattare nel progetto specifico o per la risoluzione di un determinato genere di problemi permette accessi più rapidi e più facili e protezioni più sicure e meno costose.

I dati da trasferire in un data warehouse vengono estratti con cadenza periodica da archivi dati di vario tipo, e sono formattati, puliti, convalidati, riassunti e riorganizzati a vari livelli di dettaglio e di specificità. Il data warehouse diventa così uno spazio di archiviazione permanente per i dati usati per la creazione di report, l’analisi di problemi e tendenze, la presa di decisioni strategiche di medio e lungo periodo.

Tuttavia un unico data warehouse che rappresenti l’intera organizzazione è poco pratico per affrontare problemi specifici di gestione, per i quali si preferiscono i data-martdata mart, aggregati più piccoli e mirati che contengono solo i dati necessari all’analisi da fare. Se paragoniamo un data warehouse ad un mercato ortofrutticolo, il data warehouse corrisponde al banco di ortaggi e frutta, i data mart alle cassette di mele rosse, mele verdi, ecc.

Il processo che dal dato arriva alla decisione parte dal sistema transazionale che genera i dati (OLTP), prosegue con l’archivio operativo che li estrae e li ripulisce (ETL) aggregandoli per temi nei rispettivi data mart e cubi OLAP, e arriva al manager che compie le sue analisi e prende le sue decisioni o comunica le sintesi con relazioni, grafici e tabelle.

I data mart servono quindi a convertire enormi quantità di dati in un formato facile da usare, comprensibile, ma al tempo stesso aggiornato e preciso. I dati operativi di un sistema OLTP sono concisi e codificati, quelli aggregati in un data mart, essendo di quantità ridotta, possono essere descritti come si vuole per renderli immediatamente comprensibili a manager che non sono esperti di data base. I dati possono essere ordinati cronologicamente in base ai diversi punti di vista delle analisi da fare. Si possono prendere in considerazione periodi di tempo abbastanza lunghi per evidenziare tendenze con il confronto di dati storici. E’ possibile manipolare dati per ottenere simulazioni del tipo “se… allora”.

Un data mart non deve servire a tutta l’impresa, ma solo ad un gruppo di utilizzatori, per esempio quelli che si occupano di marketing relazionale. In tal senso un data mart non è al centro di un data base, è in periferia. Il flusso da un data warehouse ai data mart può avvenire in due direzioni: il data warehouse si suddivide nei datamart desiderati, oppure sono i data mart che nel loro insieme costituiscono il data warehouse. In ambedue i casi, il data mart è un estratto dell’insieme dei dati di un’impresa che contiene solo i dati necessari ad un certo scopo.

Per esempio, rispetto all’anagrafica completa dei clienti, un data mart di CRM permette di sapere subito quanto un certo tipo di cliente ha influito sul fatturato in un certo periodo di tempo. Oppure il data mart sui dipendenti può fornire al reparto HR il supporto per decidere politiche di licenziamenti e assunzioni. O ancora data mart sui flussi finanziari possono fornire elementi per valutare l’impatto delle insolvenze, i carichi salariali, i profitti prima e dopo le tasse.

Il data mart non va confuso con il cubo OLAP, perché si limita a fornire insiemi specifici e selezionati di dati, mentre il cubo permette di formulare richieste che possano rispondere a problemi e punti di vista particolari, come per esempio sapere se rendono di più i dipendenti giovani o gli anziani.