mercoledì 15 ottobre 2008

Elementi teorici e strutturali del report:Dimensioni, Misure, Aggregazione, funzioni di aggregazione e formalizzazione dei concetti statistici di base


Un collettivo statistico o popolazione è costituito da un insieme di unità statistiche. Tali unità possono essere persone, oggetti, transazioni, o qualunque entità che rappresenti una fonte di interesse dal punto di vista del trattamento dei dati. Su ciascuna unità potranno essere rilevati K caratteri indicati generalmente con X1, X2...Xk. Rilevando K caratteri si otterranno K valori, le cosiddette osservazioni, che sono le determinazioni dei caratteri su quelle unità statistiche, che indicheremo con x minuscolo x1,x2...xk. Queste osservazioni dipendono dalle unità statistiche, che indicheremo invece con U1, U2...Un. Avremo dunque n osservazioni ciascuna costituita da un vettore di k elementi. Le osservazioni sono dette vettori k-dimensionali. In una matrice dei dati andremo a porre in riga l'unità i-esima e in colonna il carattere j-esimo. Dalla loro intersezione deriverà una osservazione xij-esima. I k caratteri (ad es nome, cognome, etc) sono caratterizzati ciascuno da un range di valori che possono assumere. Ad esempio se il carattere è il codice identificativo della cassiera, l'insieme dei valori distinti che esso potrà assumere, ovvero le sue modalità del carattere, sarà l'insieme dei codici utilizzati dal supermercato per identificare le cassiere. Le modalità possono essere formate da caratteri quantitativi oppure qualitativi.


I caratteri quantitativi sono discreti nel momento in cui l’insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme di numeri interi (ad esempio numero di figli). Sono invece continui quando l’insieme delle modalità assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme di numeri reali (peso, altezza, etc).




I caratteri qualitativi invece possono essere sconnessi e ordinati. Alla prima categoria appartengono quei caratteri per i quali date due o più modalità sarà possibile affermare solo se sono uguali o diverse (ad es. Luogo di nascita, Sesso.). Mentre per i caratteri ordinati è possibile stabilire un ordine tra le modalità (ad es. titolo di studio: senza titolo, licenza elementare, diploma di maturità, laurea di primo livello, etc).




Le funzioni di aggregazione eseguono un calcolo su un set di valori e restituiscono un valore singolo. Vediamo in che senso. La dimensione di un report si riferisce ad uno spazio K-dimensionale in cui si collocano le unità statistiche, è una forma di visualizzazione geometrica. Nel momento in cui più unità presentano le medesime modalità in più caratteri, sarà possibile aggregarle mediante una funzione che vada a sintetizzarle per poterle poi rappresentare in una semplice matrice di dati. La funzione di aggregazione è detta "misura", per ricondurre il tutto ad uno schema matriciale, io opero una misurazione di ciascuna modalità, per l’appunto metto in atto una sintesi, una aggregazione. Nei database, le funzioni di aggregazione più diffuse sono Count, Sum, Avg, Min, Max. Vediamo di cosa si tratta, illustrando un semplice esempio pescato dal web:




COUNT
Restituisce il numero di righe che soddisfano la condizione specificata nella clausola WHERE. Vediamo un esempio: voglio conoscere il numero di impiegati che appartengono al dipartimento produzione
SELECT COUNT (*)FROM IMPIEGATOWHERE DIPARTIMENTO = 'PRODUZIONE';


Risultato--> 2


SUM
Questa funzione somma tutti i valori di una colonna, vediamo un esempio: voglio ottenere la somma di tutti gli stipendi
SELECT SUM(STIPENDIO)FROM IMPIEGATO;

Risultato-->L.29.390.0000



La funzione SUM opera soltanto con i numeri, se viene applicata a un campo non numerico, si ottiene un messaggio di errore.



AVG (average)
Calcola la media aritmetica dei valori di una colonna. Vediamo un esempio: voglio conoscere lo stipendio medio della tabella IMPIEGATO.
SELECT AVG(STIPENDIO)FROM IMPIEGATO;

Risultato--> L. 3.673.750
La funzione AVG opera soltanto con i numeri.



MAX
Questa funzione serve a trovare il valore massimo di una colonna. Per esempio vogliamo sapere a quanto ammonta lo stipendio maggiore.
SELECT MAX(STIPENDIO)FROM IMPIEGATO;

Risultato-->L. 7.300.000


La funzione MAX opera anche con i caratteri.


MIN
Questa funzione opera in modo analogo a MAX, ad eccezione del fatto che restituisce il valore minimo di una colonna. Per trovare il minimo stipendio della tabella IMPIEGATO si usa la seguente espressione:
SELECT MIN(STIPENDIO)FROM IMPIEGATO;

Risultato-->L. 360.000



La funzione MIN opera anche con i caratteri: la stringa ‘AAA’ è minore della stringa ‘BB’.

Nessun commento: