lunedì 27 ottobre 2008

Sistemi informativi aziendali: I Datawarehouse. Che cosa sono e cosa li differenzia dai sistemi OLTP


Come suggerisce in termine anglosassone, un data warehouse è letteralmente un magazzino di dati, ovvero un archivio informatico che contiene una determinata mole di dati. I DW sono progettati per gestire le informazioni e predisporle ad analisi e relazioni. Il data warehouse, quindi, descrive il processo di acquisizione, trasformazione e distribuzione di informazioni presenti all'interno o all'esterno delle aziende come supporto ai decision maker. Un DW comprende anche gli strumenti finalizzati alla estrazione, alla modifica e all’update dei dati, nonché quelli atti al recupero dei metadati e gli strumenti di business intelligence. Secondo la celebre definizione del pioniere di questa tipologia di immagazzinamento delle informazioni, William H. Inmon, un DW è una raccolta di dati integrata, orientata al soggetto, variabile nel tempo e non volatile, di supporto ai processi decisionali. L'integrazione dei dati costituisce la principale caratteristica distintiva del DW rispetto ad altri sistemi di supporto alle decisioni. Il termine integrazione si riferisce al fatto che in un dw convergono dati provenienti da diversi sistemi transazionali e da fonti esterne. Questa convergenza avviene mediante l'utilizzo di metodi di codifica uniformi, oppure attraverso il perseguimento di una omogeneità semantica di tutte le variabili, o ancora mediante l'utilizzo delle stesse unità di misura. Il DW è orientato a temi aziendali specifici. I dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. È facile comprendere come il polo dell’attenzione si sposti dalla eliminazione della ridondanza alla produzione efficace e veloce di informazioni strategicamente utili. I dati archiviati all'interno di un DW riguardano lassi temporali nettamente superiori rispetto a quelli dei dati archiviati in un sistema operativo. Difatti i dw contengono informazioni relative ad aree di interesse contingenti, con tutto il background di riferimento. Ciò comporta che i dati contenuti in un DW siano aggiornati fino ad una certa data che, nella maggior parte dei casi, è antecedente a quella in cui l'utente interroga il sistema. Ciò differisce da quanto si verifica in un sistema transazionale, nel quale i dati corrispondono sempre ad una situazione aggiornata, solitamente incapace di fornire un quadro storico del fenomeno analizzato. I dati contenuti nei dw non sono volatili, nella misura in cui non possono essere modificati dagli utenti, ma solo letti. Il data warehouse è un sistema OLAP (che sta per On-Line Analytical Processing, tecniche software per l'analisi interattiva e veloce di grandi quantità di dati) che differisce dai sistemi OLTP (On Line Transaction Processing), sebbene i dati provengano da questi ultimi. I sistemi OLAP sono sistemi orientati al soggetto, sono integrati, storici e permanenti. Non comprendono dati analitici e statici come i sistemi OLTP, inoltre i dati OLAP non sono adatti ad uso corrente, ma vengono usati per analisi.

Nessun commento: