Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.
La legge della varianza totale è un teorema della teoria della probabilità, che afferma che se
e
sono variabili casuali definite sul medesimo spazio di probabilità, e la varianza di
è finita, allora:
![{\displaystyle \ \sigma ^{2}(x)=\mathbb {E} [\sigma ^{2}(x|y)]+\sigma ^{2}(\mathbb {E} [x|y])}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4d340c3a3d74d127cc20529cce3828a762a47198)
dove
è il valore atteso condizionato di x, e
la varianza condizionata, ovvero:
![{\displaystyle \ \sigma ^{2}(x|y)=\mathbb {E} [(x-\mathbb {E} [x|y])^{2}|y]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2f21466fd76f0edc2cf861b1ea5c041f5e8b07a5)
Dal punto di vista della statistica più che della teoria della probabilità, il primo termine è detto componente non spiegata della varianza totale, e il secondo è la componente spiegata; tale suggestiva terminologia si ricollega all'analisi del modello lineare, e in particolare al coefficiente di determinazione, o R².
Dimostrazione
La legge della varianza totale può essere immediatamente dimostrata sfruttando la legge delle aspettative iterate, come segue.
![{\displaystyle \ \sigma ^{2}(x)=\mathbb {E} [x^{2}]-(\mathbb {E} [x])^{2}=}](https://wikimedia.org/api/rest_v1/media/math/render/svg/10eee23ecf34dfa14e52f6844def181d14a6af8a)
![{\displaystyle \ =\mathbb {E} [\mathbb {E} [x^{2}|y]]-(\mathbb {E} [\mathbb {E} [x|y]])^{2}=}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4a402a35fd6e656d84f69df2f5cae7a91567e6a2)
![{\displaystyle \ =\mathbb {E} [\sigma ^{2}(x|y)]+\mathbb {E} [(\mathbb {E} [x|y])^{2}]-(\mathbb {E} [\mathbb {E} [x|y]])^{2}=}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8b1845f144fbcc1e0e7834e24cb205ec341610c8)
![{\displaystyle \ =\mathbb {E} [\sigma ^{2}(x|y)]+\sigma ^{2}(\mathbb {E} [x|y])}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9219879c557b5929bb340d739b25fc801cd14d9f)
Relazione con il modello lineare
La legge della varianza totale presenta un'importante relazione con il modello di regressione lineare. Nel caso univariato, il modello lineare può essere enunciato come:
![{\displaystyle \ \mathbb {E} [x|y]=\alpha +\beta y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/25db7fb58035bd5e2c7b895742d05cfca2e0b6fa)
Si ha in tal caso che il rapporto di covarianza:
![{\displaystyle \ \beta ={\frac {\sigma (y,x)}{\sigma ^{2}(y)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2af148b31a8da5e70df03f709590873e65193fb0)
Ma allora, la componente spiegata della varianza totale altro non è che:
![{\displaystyle \ \sigma ^{2}(\mathbb {E} [x|y])=\beta ^{2}\sigma ^{2}(y)={\frac {\sigma ^{2}(y,x)}{\sigma ^{2}(y)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13a1ae6085075027de1ec11cda232a5b64c53979)
così che il rapporto tra l'espressione sopra e
è il quadrato del coefficiente di correlazione tra
e
:
![{\displaystyle \rho ^{2}(y,x)={\frac {\sigma ^{2}(\mathbb {E} [x|y])}{\sigma ^{2}(x)}}={\frac {\sigma ^{2}(y,x)}{\sigma ^{2}(y)\sigma ^{2}(x)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/208a73be55c31039e6023c831f6a490e837541c9)
Tale grandezza corrisponde in effetti al coefficiente di determinazione R². È possibile ottenere un'analoga relazione nel caso multivariato.
Estensioni ai momenti di ordine superiore
Esistono relazioni analoghe alla legge della varianza totale e alla legge delle aspettative iterate per i momenti centrali di ordine superiore. Ad esempio, con riferimento al momento centrale di ordine 3, si ha:
![{\displaystyle \ \mu _{3}(x)=\mathbb {E} [\mu _{3}(x|y)]+\mu _{3}(\mathbb {E} [x|y])+3\sigma (\mathbb {E} [x|y],\sigma ^{2}(x|y))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ef09647d9a641d572bdab5870c7436fd1e8a5f8e)
Voci correlate
Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica