1 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę dispersinę analizę, taikant skaičiuoklės Microsoft Excel duomenų analizės posistemio Data Analysis uždavinį Anova: Single Factor.
1 lentelė
ANOVA duomenys
14 variantas
Faktoriaus A lygiai Atsitiktinės imtys
1 2 3 4
1 0,145 0,144 0,143 0,144
2 0,154 0,155 0,156 0,155
3 0,170 0,169 0,168 0,171
4 0,178 0,179 0,179 0,177
Norint patikrinti, ar yra statistiškai patikima priklausomybė tarp faktoriaus A lygių ir atsitiktinių imčių, keliama nulinė hipotezė, kad faktoriaus lygių vidurkiai yra lygūs:
H0 : 1 = 2 = 3=4.
Gauname tokius Anova: Single Factor skaičiavimų rezultatus:
SUMMARY
Groups Count Sum Average Variance
Row 1 4 0,58 0,144 0,000001
Row 2 4 0,62 0,155 0,000001
Row 3 4 0,68 0,1695 0,000002
Row 4 4 0,71 0,17825 0,000001
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0,002772 3 0,000924 943,5532 1,66E-14 3,4903
Within Groups 1,18E-05 12 9,79E-07
Total 0,002783 15
Šiuo atveju nulinę hipotezę H0 : 1 = 2 = 3=4 atmetame, nes F > Fα ir p<α (α=0,05).
Norint patikrinti, ar pakartojimai neturi įtakos rezultatinio rodiklio kitimui, keliama nulinė hipotezė:
H0 : µ1 = µ2 = µ3 = µ4
Gauname tokius Anova: Single Factor skaičiavimų rezultatus:
SUMMARY
Groups Count Sum Average Variance
Column 1 4 0,65 0,16 0,00022
Column 2 4 0,65 0,16 0,00024
Column 3 4 0,65 0,16 0,00024
Column 4 4 0,65 0,16 0,00023
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 1,88E-07 3 6,25E-08 0,000269 0,999994 3,4903
Within Groups 0,002783 12 0,000232
Total 0,002783 15
Šiuo atveju nulinės hipitezės H0 : 1 = 2 = 3=4 atmesti neturime pagrindo, nes F < Fα ir
p > α (α = 0,05).
2 DARBAS
Užduoties tikslas – išmokti atlikti dispersinę analizę, taikant Statsoft kompanijos programos STATISTICA modulį ANOVA/MANOVA.
2.1. Vienfaktorė dispersinė analizė
1 lentelė
ANOVA duomenys
14 variantas
Faktoriaus A lygiai Atsitiktinės imtys
1 2 3 4
1 0,145 0,144 0,143 0,144
2 0,154 0,155 0,156 0,155
3 0,170 0,169 0,168 0,171
4 0,178 0,179 0,179 0,177
Summary of all Effects; design: (new.sta)
GENERAL MANOVA 1-A
Effect df Effect MS
Effect Df Error MS
Error F p-level
1 3 0,000924 12 0,000001 943,5532 0,000000
Iš Summary of all Effect lentelėje gautų rezultatų galima teigti, kad nulinę hipotezę
H0 : µ1 = µ2 = µ3 = µ4 turime atmesti, nes F>Fα (p<α), t.y. pripažįstame faktoriaus įtaką rezultatiniam rodikliui.
Atlikę komandą Means/Graphs Table of All Effects Scrollsheet, ekrane matome priklausomojo kintamojo (atsitiktinės imties) vidurkius (jiems kėlėme nulinę hipotezę) pagal faktoriaus lygius.
Means
GENERAL MANOVA F(3,12)=943,55; p<,0000
A IMTYS
1 0,144000
2 0,155000
3 0,169500
4 0,178250
Kadangi nustatyta statistiškai reikšminga faktoriaus įtaka rezultatiniam rodikliui, tai turime nustatyti ir faktoriaus kiekvieno lygio įtaką..
Tukey HSD test; variable IMTYS
GENERAL MANOVA Probabilities for Post Hoc Tests
MAIN EFFECT: A
A {1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500
1 {1} 0,000199 0,000199 0,000199
2 {2} 0,000199 0,000199 0,000199
3 {3} 0,000199 0,000199 0,000199
4 {4} 0,000199 0,000199 0,000199
Statistiškai reikšmingai skiriasi, kai p<α.
Mūsų pavyzdyje statistiškai reikšmingai tarpusavyje skiriasi 1-2; 1-3; 1-4; 2-3; 2-4; 3-4 faktoriaus A lygiai.
Levene’s Test for Homogeneity of Variances (new.sta)
GENERAL MANOVA (ANOVA on absolute within-cell deviation scores)
Degrees of freedom for all F’s: 3,12
MS
Effect MS
Error F p-level
variable
IMTYS 0,000000 0,000000 0,785714 0,524611771
Matome lentelę, iš kurios rezultatų aišku, kad dispersijos lygios (išvados daromos remiantis p – reikšmėmis: jei p ≥α, tai neturime pagrindo atmesti nulinę hipotezę).
Means (new.sta) Standard Deviations (new.sta)
GENERAL MANOVA 1 Dependent Variable GENERAL MANOVA 1 Depend Variable
A IMTYS Valid N A IMTYS Valid N
G_1:1 0,144000 4 G_1:1 0,000816 4
G_2:2 0,155000 4 G_2:2 0,000816 4
G_3:3 0,169500 4 G_3:3 0,001291 4
G_4:4 0,178250 4 G_4:4 0,000957 4
All Groups 0,161687 16 All Groups 0,013622 16
Tai yra lentelės, kuriose yra pateikiami priklausamojo kintamojo vidurkiai (Means) ir standartiniai nuokrypiai (Standart Deviations) pagal faktoriaus kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje. Iš šių duomenų galime apskaičiuoti santykinį sklaidos apie vidurkį rodiklį – variacijos koeficientą.
2.2. Daugiafaktorė dispersinė analizė
2 lentelė
Dviejų faktorių ANOVA duomenys
Variantas 14
Faktorius B
B1 B2
Fak.A Atsitiktines imtys Fak.A Atsitiktines imtys
1 2 3 4 1 2 3 4
A1 0,145 0,144 0,143 0,144 A1 0,131 0,130 0,129 0,130
A2 0,154 0,155 0,156 0,155 A2 0,139 0,140 0,140 0,140
A3 0,170 0,169 0,168 0,171 A3 0,153 0,152 0,151 0,154
A4 0,178 0,179 0,179 0,177 A4 0,160 0,161 0,161 0,159
Pagal turimus duomenis keliamos 3 hipotezės:
1. Keliama nulinė hipotezė, kad faktoriaus A įtakos nėra, ir alternatyvi hipotezė
H0 : µ1. = µ2. = µ3. = µ4.
H1 : bent du
vidurkiai skiriasi
2. Keliama nulinė hipotezė,kad faktoriaus B įtakos nėra, ir alternatyvi hipotezė
H0 : µ.1 = µ.2 = µ.3 = µ.4
H1 : bent du vidurkiai skiriasi
3. Keliama nulinė hipotezė, kad faktorių A ir B tarpusavio sąveikos įtakos nėra, ir alternatyvi hipotezė
H0 : µ
Pagal turimus duomenis gauta Summary of all Effects lentelę:
Summary of all Effects; design: (new.sta)
GENERAL MANOVA 1-FAK_B, 2-FAK_A
df Effect MS Effect df Error MS Error F p- level
Effect
1 1 0,002064 24 0,000001 2226,371 0,000000
2 3 0,001637 24 0,000001 1766,056 0,000000
12 3 6,36E-06 24 0,000001 6,865169 0,001686
Iš joje esančių rezultatų galima teigti, kad abu faktoriai ir jų sąveika turi statistiškai reikšmingos įtakos rezultatiniam rodikliui, nes visais trimis atvejais p<α.
Toliau gaunamos trys lentelės, kuriose yra priklausomojo kintamojo atitinkami vidurkiai pagal pasirinkto faktoriaus lygius.
Means (unweighted) (new.sta)
GENERAL MANOVA F(1,24)=2226,37; p<,0000FAK_B FAK_A Y
B1 …. 0,161687
B2 …. 0,145625
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus B.
Means (unweighted) (new.sta)
GENERAL
MANOVA F(3,24)=1766,06; p<,0000FAK_B FAK_A Y
…. A1 0,137000
…. A2 0,147375
…. A3 0,161000
…. A4 0,169250
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktoriaus A.
Means (new.sta)
GENERAL
MANOVA F(3,24)=6,87; p<,0017FAK_A FAK_B Y
B1 A1 0,144000
B1 A2 0,155000
B1 A3 0,169500
B1 A4 0,178250
B2 A1 0,130000
B2 A2 0,139750
B2 A3 0,152500
B2 A4 0,160250
Šioje lentelėje parodyta, kaip priklauso Y veiksnys nuo faktorių A ir faktoriaus B.
Kadangi visas iškeltąsias hipotezes atmetame, todėl turime nustatyti pasirinktų faktorių ir jų sąveikos kiekvieno lygio įtaką. Pagal Tjukio HSD kriterijų gauname rezultatų lentelę:
Tukey HSD test; variable Y (new.sta)
GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_B{1} ,1616875 {2} ,1456250
FAK_B FAK_A
B1 …. {1} 0,000152
B2 …. {2} 0,000152
Čia statistiškai reikšmingi skirtumai tarp faktoriaus B: 1-2
Tukey HSD test; variable Y
GENERAL MANOVA Probabilities for Post Hoc Tests MAIN EFFECT: FAK_A{1} ,1370000 {2} ,1473750 {3} ,1610000 {4} ,1692500
FAK_B FAK_A
…. A1 {1} 0,000161 0,000161 0,000161
…. A2 {2} 0,000161 0,000161 0,000161
…. A3 {3} 0,000161 0,000161 0,000161
…. A4 {4} 0,000161 0,000161 0,000161
Čia statistiškai reikšmingi skirtumai tarp faktoriaus A: 1-2, 1-3, 1-4; 2-3, 2-4; 3-4.
Tukey HSD test; variable Y (new.sta)
GENERAL MANOVA Probabilities for Post Hoc Tests INTERACTION: 1×2{1} ,1440000 {2} ,1550000 {3} ,1695000 {4} ,1782500 {5} ,1300000 {6} ,1397500 {7} ,1525000 {8} ,1602500
FAK_B FAK_A
B1 A1 {1} 0,000147 0,000147 0,000147 0,000147 0,00018 0,000147 0,000147
B1 A2 {2} 0,000147 0,000147 0,000147 0,000147 0,000147 0,022536 0,000148
B1 A3 {3} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B1 A4 {4} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A1 {5} 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A2 {6} 0,00018 0,000147 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A3 {7} 0,000147 0,022536 0,000147 0,000147 0,000147 0,000147 0,000147
B2 A4 {8} 0,000147 0,000148 0,000147 0,000147 0,000147 0,000147 0,000147
Čia matome statistiškai reikšmingus skirtumus tarp 1-2; 1-3; 1-4; 1-5; 1-6; 1-7; 2-3; 2-4; 2-5; 2-6; 2-8; 3-4; 3-5; 3-6; 3-7; 3-8; 4-5; 4-6; 4-7; 4-8; 5-6; 5-7; 5-8; 6-7; 6-8; 7-8 grupių.
Patikrinsime ar atsitiktinių imčių dispersijos yra lygios. Tam skaičiuosime pagal Levene‘s kriterijų:
Levene’s Test for Homogeneity of Variances (new.sta)
GENERAL MANOVA (ANOVA on absolute within-cell deviation scores) Degrees of freedom for all F’s: 7,24MS Effect MS Error F p-level
variable
Y 0,000000 0,000000 0,896103 0,525183
Iš gautos Levene’s Test Homogeneity of Variances lentelės rezultatų aišku, kad bandymų schema sudaryta teisingai, nes atsitiktinių imčių dispersijos lygios (p>α).
Standard Deviations (new.sta)
GENERAL MANOVA 1 Depend VariableFAK_B FAK_A Y Valid N
B1 A1 0,000816 4
B1 A2 0,000816 4
B1 A3 0,001291 4
B1 A4 0,000957 4
B2 A1 0,000816 4
B2 A2 0,000500 4
B2 A3 0,001291 4
B2 A4 0,000957 4
All
Groups 0,015045 32
Toliau gaunamos Means ir Standart deviations lentelės:
Means (new.sta)
GENERAL MANOVA 1 Depend VariableFAK_B FAK_A Y Valid N
B1 A1 0,144000 4
B1 A2 0,155000 4
B1 A3 0,169500 4
B1 A4 0,178250 4
B2 A1 0,130000 4
B2 A2 0,139750 4
B2 A3 0,152500 4
B2 A4 0,160250 4
All Groups 0,153656 32
Šiose lentelėse yra pateikiami priklausomojo kintamojo vidurkiai ir standartiniai nuokrypiai pagal abiejų faktorių sąveikos kiekvieną lygį, taip pat atsitiktinių imčių skaičius kiekviename lygyje.
Analizė bus išsamesnė ir akivaizdesnė, jei panaudosime ir kitus Descriptive statistics & Graphs dialogo skygelyje nurodytus grafikus, pavyzdžiui, ūselinę diagramą (Categorized box – whisker plot):
3 UŽDUOTIS
Užduoties tikslas – išmokti atlikti vienfaktorę ir daugiafaktorę regresinę analizę, taikant skaičiuoklės Microsoft Excel statistines funkcijas TREND ir LINEST bei GROWTH ir LOGEST.
3.1. Vienfaktorė regresinė analizė
y x1 TREND LINEST GROWTH LOGEST
2,59 47,00 2,0422293 0,0483719 -0,2312519 2,0039375 1,027794 0,552468
1,66 38,90 1,6504166 0,0133583 0,5507255 1,6048942 0,008294 0,341948
1,53 32,50 1,3408362 0,4214544 0,3346109 1,3466312 0,377692 0,207761
2,20 47,50 2,0664153 13,1125009 18,0000000 2,0315950 10,92459 18
1,65 47,30 2,0567409 1,4681344 2,0153606 2,0204865 0,471557 0,776966
1,99 50,90 2,2308799 2,2300632
1,55 33,60 1,3940453 1,3878584
2,13 40,20 1,7133001 1,6631219
2,04 48,20 2,1002756 2,0709578
1,77 41,10 1,7568348 1,7046663
1,03 37,50 1,5826959 1,5444653
1,65 36,60 1,5391611 1,5068251
2,51 48,20 2,1002756 2,0709578
1,02 37,50 1,5826959 1,5444653
1,76 45,20 1,9551598 1,9074518
1,70 33,20 1,3746965 1,3727226
1,97 40,20 1,7133001 1,6631219
1,56 35,20 1,4714404 1,4500888
1,16 37,00 1,5585099 1,5234395
1,42 39,10 1,6600910 1,6137178
46 1,9938574 1,9497471
Iš statistinėmis funkcijomis gautų skaičiavimų, sudarome suvestinę lentelę.