Anscombe quartet

1. Imamo štiri skupine podatkov. V vsaki skupini se nahajata dve spremenljivki X in Y, vsaka spremenljivka ima 11 enot. Aritmetična sredina vsakega izmed X-ov znaša 9,0, aritmetična sredina vseh Y-ov znaša 7,5. Standardni odklon pri vsakem izmed X-ov znaša 3,31, SD pri vsakem izmed Y-ov znaša 2,03.


N aritm. sredina SD
X1 11 9,0 3,31
Y1 11 7,5 2,03
X2 11 9,0 3,31
Y2 11 7,5 2,03
X3 11 9,0 3,31
Y3 11 7,5 2,03
X4 11 9,0 3,31
Y4 11 7,5 2,03

 

2. Sedaj med spremenljivkama X in Y v vsaki skupini izračunamo regresijsko funkcijo. Naredimo torej štiri regresijske analize. Vrednost regresijskega koeficienta r je v vseh štirih primerih enaka 0,81, R2 ali odstotek pojasnjene variance znaša 0,66 standardna napaka regresijske ocene pa 1,23.
Regresijska ocena kaže naslednjo zvezo med spremenljivkama X in Y v vsaki izmed skupin:
Y = 3 + 0,5 X.

Tako konstantni člen, kot neodvisna spremenljivka X imata statistično značilen vpliv na odvisno spremenljivko Y (statistična značilnost konstantnega člena znaša 0,026, statistična značilnost neodvisne spremenljivke pa 0,002, vrednosti t-statistike v vseh štirih skupinah znašajo 2,6 za konstantni člen in 4,2 za neodvisno spremenljivko).

Prva regresija

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,816(a) ,667 ,629 1,2366
a Predictors: (Constant), X1

 

Coefficients(a)

Unstandardized Coefficients Standardized Coefficients t Sig.
Model B Std. Error Beta

1 (Constant) 3,000 1,125
2,667 ,026
X1 ,500 ,118 ,816 4,241 ,002
a Dependent Variable: Y1

 

Druga regresija

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,816(a) ,666 ,629 1,2372
a Predictors: (Constant), X2

 

Coefficients(a)

Unstandardized Coefficients Standardized Coefficients t Sig.
Model B Std. Error Beta

1 (Constant) 3,001 1,125
2,667 ,026
X2 ,500 ,118 ,816 4,239 ,002
a Dependent Variable: Y2

 

Tretja regresija

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,816(a) ,666 ,629 1,2363
a Predictors: (Constant), X3
Coefficients(a)

Unstandardized Coefficients Standardized Coefficients t Sig.
Model B Std. Error Beta

1 (Constant) 3,002 1,124
2,670 ,026
X3 ,500 ,118 ,816 4,239 ,002
a Dependent Variable: Y3

 

Četrta regresija

Model Summary
Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,817(a) ,667 ,630 1,2357
a Predictors: (Constant), X4
Coefficients(a)

Unstandardized Coefficients Standardized Coefficients t Sig.
Model B Std. Error Beta

1 (Constant) 3,002 1,124
2,671 ,026
X4 ,500 ,118 ,817 4,243 ,002
a Dependent Variable: Y4

 

3. Vprašanje je naslednje: ali so pari spremenljivk v vseh štirih skupinah enaki oz. ali gre za identične spremenljivke, glede na to da opisne statistike in regresijska analiza v vseh štirih primerih kažejo enako sliko.

Odgovor na to vprašanje najdete v nadaljevanju...