In questo campo la terminologia non e' particolarmente indicativa: spesso i concetti vengono invertiti o confusi.

Per tale motivo evitero' di fare discorsi lunghi e, senza la minima intenzione di "sentenziare", verranno tracciate le linee guida lasciando al lettore la liberta' di costruire il percorso logico.

Ogni test di significativita' implica l'uso di un modello d'urna, cioe' di un modello probabilistico in base al quale effettuare i calcoli statistici.

I test di significativita' vanno sotto il nome di statistiche test per 1 campione per due campioni ecc.

Si parla di statistica test z quando il numero di soggetti ( o di casi ) del campione e' maggiore di 25 e nei calcoli si fa riferimento alla DS della popolazione ... mentre i valori di z vengono confrontati con le tabelle per la curva normale.

Si parla di statistica test t quando il numero di soggetti ( o di casi ) del campione e' minore o uguale a 25 e nei calcoli si fa riferimento alla DS del campione ... mentre i valori di t vengono confrontati con le tabelle della t di Student.

L' esempio piu' semplice e' quello di una statistica test t per 1 campione .

Si tratta di confrontare il valore medio di una variabile della popolazione con quello di un campione.


Una volta effettuato un campionamento l'informazione a nostra disposizione e' ...
il valore osservato

La Ipotesi Nulla afferma che il valore osservato e' dovuto solo al caso

L' Ipotesi alternativa afferma invece che il valore osservato e' reale

Poniamo che il valore osservato sia una media e valga -440 ( in questo caso un valore negativo ).
La media del nostro campione e' -440!

... Vogliamo sostenere che la media della popolazione e' 0 ( zero ).

Ipotesi Nulla : la media -440 e' dovuta solo al caso, la media reale e' 0 (zero)
Ipotesi alternativa la media ottenuta dal campione e' in effetti quella reale ( della popolazione )

Misuriamo la differenza tra valore osservato e valore atteso
per farlo effettuiamo la statistica test z

  z = ( valore osservato - valore atteso ) / Errore standard (SE)

  Supponiamo che la deviazione standard del campione ( 100 casi ) sia 1450
  Lo (SE) della somma = radice( 100 ) * 1450 = 14500
  Lo (SE) della media ( che ci interessa in questo caso ) = 14500/100 = 145

z = -440 - 0 / 145 = circa -3

Il test z ci dice che tra il valore osservato e quello atteso ci sono ( ben) -3 SE

sulla tavola della curva normale troviamo
in corrispondenza del 3 ( sotto z ) un valore ( area ) di 99.730
che significa: tra -3 e +3 SE l'area sottesa alla curva normale e' del 99.730 %.
Per semplice sottrazione, la parte minore di -3 SE e maggiore di +3 SE
in totale corrisponde allo 0.270 %.
A noi interessa il valore in percentuale della sola parte < di -3 SE
che sara' esattamente la meta' di 0.270 cioe' 0.135 %.
Dunque un valore di -3 SE corrisponde ( in una distribuzione normale ) a una quota molto piccola ... solo lo 0.135 % che vuole dire piu' o meno 1 casi su 1000
Il livello di significativita' osservato ( P o P-Value ) in questo caso e' pari a 0.135 %.

La probabilita' che l' Ipotesi Nulla sia vera, cioe' che la media reale sia 0 (zero) e' ...
di 1 casi su 1000
E' assurdo ritenere vera l'ipotesi nulla: la si deve rifiutare

E' evidente che il test di significativita' dipende moltissimo dalla condizione posta sotto l' Ipotesi Nulla ... se l' Ipotesi Nulla fosse stata che la media reale e' -200 ad es. le cose sarebbero diverse perche' il calcolo diventa:

z = -440 - ( -200 ) / 145 = -220 / 145 circa   -1.517

sulla tavola della curva normale troviamo
in corrispondenza del -1.517 ( sotto z ) un valore ( area ) di 86.64
che significa un' area sottesa alla curva normale e' del 86.64 %.
Per semplice sottrazione la parte rimanente, in totale corrisponde allo 13.36 %.
A noi interessa il valore in percentuale della sola parte < di -1.517 SE
che sara' esattamente la meta' di 13.36 cioe' 6.680 %.
Dunque un valore di -1.517 SE corrisponde ( in una distribuzione normale ) a una quota maggiore ... lo 6.680 % che vuole dire piu' o meno 66 casi su 1000

La probabilita' che l' Ipotesi Nulla sia vera, cioe' che la media reale sia 0 (zero) e' aumentata a ...
66 casi su 1000
E' ancora assurdo ritenere vera l'ipotesi nulla: la rifiutiamo
( anche se, rispetto a prima la nostra " sicurezza " e' minore )

A parte i livelli di significativa' piu' utilizzati come quello < del 5%, ritenuto da molti un livello significativo e quello < dell'1% definito come altamente significativo e' importante capire come il punto fondamentale sia la distanza ( in termini di SE ) del valore osservato da quello atteso sotto l'ipotesi nulla.

L' interpretazione del P-value e' contorta ma, non puo' essere diversamente perche' P-value significa probabilita' ( P ) di ottenere un valore della statistica test cosi' grande o piu' grande di quello effettivamente ottenuto, supponendo che l'ipotesi nulla sia vera.
In questi termini il ragionamento e' molto simile a quello relativo al livello di confidenza .

Potenza del test