In statistica il test F per il confronto di due varianze è un test di ipotesi basato sulla distribuzione F di Fisher-Snedecor e volto a verificare l'ipotesi che due popolazioni che seguono entrambe distribuzioni normali abbiano la stessa varianza.
Procedimento
Se le popolazioni X e Y seguono rispettivamente le distribuzioni normali
e
, allora
- i campioni
e
si suppongono indipendenti, i primi isonomi a X e i secondi isonomi a Y;
- gli stimatori delle varianze osservate
e
sono variabili aleatorie indipendenti;
- le variabili aleatorie
e
seguono rispettivamente le distribuzioni chi quadro
e
;
- il rapporto
segue la distribuzione di Fisher-Snedecor
.
Variabile di decisione
Sotto l'ipotesi
, ovvero se le due popolazioni hanno la stessa varianza, allora la variabile aleatoria
![{\displaystyle F={\frac {S_{X}^{2}}{S_{Y}^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ca4dd5fb08a60b6a2000d07569e42eb324c2fbf6)
segue la distribuzione di Fisher-Snedecor
![{\displaystyle {\mathcal {F}}(n-1,m-1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4d63c904080b02ec26f77433d3296d1939f7bf6a)
di parametri n-1 e m-1, dove n e m sono le numerosità dei due campioni.
La scelta del numeratore non influenza il test: sotto l'ipotesi nulla la variabile aleatoria
segue la distribuzione
.
Il test
Come regione di accettazione, al livello di significatività α, viene preso l'intervallo compreso tra i quantili di ordine
e
, mentre la regione di rifiuto è quella esclusa:
![{\displaystyle {\mathcal {A}}=]f_{\frac {\alpha }{2}},f_{1-{\frac {\alpha }{2}}}[;\qquad {\mathcal {R}}=]0,f_{\frac {\alpha }{2}}[\ \cup \ ]f_{1-{\frac {\alpha }{2}}},\infty [}](https://wikimedia.org/api/rest_v1/media/math/render/svg/355b5a790e06101ec9814553ceef781a6d437e0e)
Un valore appartenente all'intervallo
suggerisce che la varianza di X sia minore della varianza di Y, mentre un valore appartenente all'intervallo
suggerisce l'inverso.
Econometria
In molti casi la statistica F può essere calcolata con un processo più diretto:
[1]
dove SSRi è la somma dei quadrati residui (dall'inglese Sum of Square Residuals) del modello i.
In econometria vale anche la seguente formula di moltiplicazioni tra matrici:
![{\displaystyle F={\frac {(R{\hat {\beta }}-r)({\hat {RVar({\widehat {\beta }})R'}})^{-1}(R{\hat {\beta }}-r)}{q}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9754050d8fa7887cce0789fef606fe5e3c8fc55e)
dove:
è la matrice dei vincoli;
è il parametro d'eguagliaza;
è l'inversa della matrice con le covarianze;
è il numero dei vincoli di
.
Solitamente gli strumenti sono rilevanti se F ≥ 10
Una tavola dei valori critici del test F può essere trovata qui.
Applicazione alla comparazione di diverse statistiche
In analisi dei dati il test F viene comunemente usato per confrontare i risultati ottenuti con due diversi metodi e valutati con l'estimatore
.[2] Se si hanno due variabili
e
che seguono la distribuzione di
a
e
gradi di libertà rispettivamente, si può costruire la variabile
:
che sarà distribuita secondo la Distribuzione F:
.
Per capire se
e
siano consistenti si usa, quindi, l'integrale della distribuzione di probabilità per
:
dove
è il particolare valore di
ottenuto.
Il valore di
fornisce la probabilità di trovare un valore di
pari a
o più alto da dati casuali se
e
sono in accordo.
Tipicamente il test F usato per i
confronta due fit applicati agli stessi dati per capire se uno è migliore dell'altro. Se il valore di
è minore del livello di confidenza scelto (ad es. 5%), si ha una significativa differenza nella bontà dei due fit.
Note
- ^ GraphPad Software Inc, How the F test works to compare models, su graphpad.com, GraphPad Software Inc, 2007/10/11.
- ^ Bevington, P.R. Robinson, D. K. - Data reduction and error analysis for physical sciences , Mc Graw Hill
Collegamenti esterni
- (EN) F-test, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
![Modifica su Wikidata](//upload.wikimedia.org/wikipedia/commons/thumb/7/73/Blue_pencil.svg/10px-Blue_pencil.svg.png)
Portale Matematica
Portale Statistica