DISPERSIONE: SCARTI, MISURE DELLA DISPERSIONE Benché la media possa essere la più importante caratteristica statistica del campione è necessario, soprattutto per i nostri scopi, conoscere come si dispongono i dati campionati.
La più semplice misura di variabilità è il campo di variazione che è semplicemente la distanza tra il valore più grande e quello più piccolo. Tuttavia tale indice fornisce scarsissime informazioni.
Un indice sicuramente più efficace è lo scarto medio. Questo si ottiene calcolando la differenza di ciascun valore osservato dalla media, facendo poi la media aritmetica di questi scarti; cioè sommandoli tra loro e dividendoli per n. Benché questa sembri a prima vista una buona soluzione non lo è per nulla perché la somma degli scarti positivi annulla quella degli scarti negativi dando sempre luogo ad una media nulla.
Questo inconveniente è superato elevando al quadrato ogni scarto.
 | | Equazione 6 |
Se usiamo i dati raggruppati, come nella Equazione 5
 | | Equazione 7 |
VARIANZA Se il nostro obiettivo è misurare solamente la dispersione del campione questo indicatore (media dei quadrati degli scarti) rappresenta una buona misura.
Ma solitamente vogliamo utilizzare questo dato per fare un'ulteriore passo, cioè vogliamo utilizzare la formula per compiere un'inferenza (previsione) statistica circa la popolazione; per fare ciò è preferibile utilizzare il divisore (n-1) piuttosto che n; ciò è giustificato dal fatto che il numero di gradi di libertà della stima è uno di meno di quello delle osservazioni, in quanto il valore medio è determinato a partire dalle osservazioni stesse, e non è quindi indipendente. La statistica campionaria che ne risulta è chiamata varianza:
 | | Equazione 8 |
Se eseguiamo il calcolo della varianza per l'esempio di cui alla Tabella 2 (pag. 3), otteniamo:
|