Statistica descrittiva: variabilità (range, varianza, deviazione standard)

[:it]

Rafel Olbinski

Rafal Olbinski

In assenza di variabilità, in una popolazione, la statistica non sarebbe necessaria: un singolo elemento o unità campionaria sarebbe sufficiente a determinare tutto ciò che occorre sapere su una popolazione.

Ne consegue, perciò, che nel presentare informazioni su un campione non è sufficiente fornire semplicemente una misura della media ma servono informazioni sulla variabilità.

Si considera la seguente tabella che mostra l’età di due gruppi

Soggetto I gruppo II gruppo
1 20 10
2 30 25
3 40 40
4 50 55
5 60 70
media 40 40

Si può subito notare che la media mi fornisce lo stesso valore, ma se suppongo di avere un ristorante e devo preparare dei menù, sapendo che hanno la stessa età media i due gruppi allora lo preparo uguale.

Sarebbe un grave errore se non prendessi in considerazione la variabilità. Infatti se nel primo gruppo potrebbe andare bene un menù per adulti nel secondo vi è un bambino a cui magari si dovrebbe adattarlo.

Allora si introducono tre misure di variabilità:

  • campo di variazione
  • varianza
  • deviazione standard

Il campo di variazione corrisponde alla differenza fra il valore più piccolo e quello più grande:

R=x_{max}-x_{min}

Il limite di tale valore è:

  • è influenzato dai valori estremi
  • tiene conto dei due soli valori estremi, trascurando tutti gli altri.

La varianza è data dalla somma dei quadrati degli scarti dalla media diviso per il numero degli elementi.

\sigma ^{2}=\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}

mentre  la deviazione standard è la radice quadrata della varianza ossia:

\sigma=\sqrt{\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}}

La varianza mi fornisce un indice di dispersione dei dati rispetto alla media ed ha il vantaggio che, essendo un quadrato, non è influenzata da dati negativi che sommandosi si annullerebbero.

Lo svantaggio è che essendo un quadrato non presenta la stessa unità di misura dei dati per cui si preferisce sempre la sua radice quadrata che è appunto la deviazione standard.

[:en]

Rafel Olbinski

Rafel Olbinski

In assenza di variabilità, in una popolazione, la statistica non sarebbe necessaria: un singolo elemento o unità campionaria sarebbe sufficiente a determinare tutto ciò che occorre sapere su una popolazione.

Ne consegue, perciò, che nel presentare informazioni su un campione non è sufficiente fornire semplicemente una misura della media ma servono informazioni sulla variabilità.

Si considera la seguente tabella che mostra l’età di due gruppi

Soggetto I gruppo II gruppo
1 20 10
2 30 25
3 40 40
4 50 55
5 60 70
media 40 40

Si può subito notare che la media mi fornisce lo stesso valore, ma se suppongo di avere un ristorante e devo preparare dei menù, sapendo che hanno la stessa età media i due gruppi allora lo preparo uguale.

Sarebbe un grave errore se non prendessi in considerazione la variabilità. Infatti se nel primo gruppo potrebbe andare bene un menù per adulti nel secondo vi è un bambino a cui magari si dovrebbe adattarlo.

Allora si introducono tre misure di variabilità:

  • campo di variazione
  • varianza
  • deviazione standard

Il campo di variazione corrisponde alla differenza fra il valore più piccolo e quello più grande:

R=x_{max}-x_{min}

Il limite di tale valore è:

  • è influenzato dai valori estremi
  • tiene conto dei due soli valori estremi, trascurando tutti gli altri.

La varianza è data dalla somma dei quadrati degli scarti dalla media diviso per il numero degli elementi.

\sigma ^{2}=\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}

mentre  la deviazione standard è la radice quadrata della varianza ossia:

\sigma=\sqrt{\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}}

La varianza mi fornisce un indice di dispersione dei dati rispetto alla media ed ha il vantaggio che, essendo un quadrato, non è influenzata da dati negativi che sommandosi si annullerebbero.

Lo svantaggio è che essendo un quadrato non presenta la stessa unità di misura dei dati per cui si preferisce sempre la sua radice quadrata che è appunto la deviazione standard.

[:de]

Rafel Olbinski

Rafel Olbinski

In assenza di variabilità, in una popolazione, la statistica non sarebbe necessaria: un singolo elemento o unità campionaria sarebbe sufficiente a determinare tutto ciò che occorre sapere su una popolazione.

Ne consegue, perciò, che nel presentare informazioni su un campione non è sufficiente fornire semplicemente una misura della media ma servono informazioni sulla variabilità.

Si considera la seguente tabella che mostra l’età di due gruppi

Soggetto I gruppo II gruppo
1 20 10
2 30 25
3 40 40
4 50 55
5 60 70
media 40 40

Si può subito notare che la media mi fornisce lo stesso valore, ma se suppongo di avere un ristorante e devo preparare dei menù, sapendo che hanno la stessa età media i due gruppi allora lo preparo uguale.

Sarebbe un grave errore se non prendessi in considerazione la variabilità. Infatti se nel primo gruppo potrebbe andare bene un menù per adulti nel secondo vi è un bambino a cui magari si dovrebbe adattarlo.

Allora si introducono tre misure di variabilità:

  • campo di variazione
  • varianza
  • deviazione standard

Il campo di variazione corrisponde alla differenza fra il valore più piccolo e quello più grande:

R=x_{max}-x_{min}

Il limite di tale valore è:

  • è influenzato dai valori estremi
  • tiene conto dei due soli valori estremi, trascurando tutti gli altri.

La varianza è data dalla somma dei quadrati degli scarti dalla media diviso per il numero degli elementi.

\sigma ^{2}=\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}

mentre  la deviazione standard è la radice quadrata della varianza ossia:

\sigma=\sqrt{\cfrac{\sum_{i=1}^{N}\left ( x_{i}-\bar{x} \right )^{2}}{N}}

La varianza mi fornisce un indice di dispersione dei dati rispetto alla media ed ha il vantaggio che, essendo un quadrato, non è influenzata da dati negativi che sommandosi si annullerebbero.

Lo svantaggio è che essendo un quadrato non presenta la stessa unità di misura dei dati per cui si preferisce sempre la sua radice quadrata che è appunto la deviazione standard.

[:]

Questa voce è stata pubblicata in Senza categoria. Contrassegna il permalink.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *