rr (35K)
Príklad 1
Chceme zistiť aká je súvislosť medzi váhou [kg] človeka a obvodom drieku [cm]. Máme k dispozícii 62 meraní, tu uvádzame len prvých 20. (Tab.1).

Vaha (23K)

Korelácia a regresná analýza

Korelácia vyjadruje lineárnu závislosť dvoch intervalových premenných
          x a y, Y=f(x)

Veličiny sú vzájomne štatisticky korelované (závislé). Pritom nepoznáme typ a konštanty funkcie, ktoré dodatočne určujeme metódou najmenších štvorcov na podklade empiricky zistených údajov. Tento druh riešenia  problému nazývame regresná analýza. Ak vyhodnocované kvantitatívne vzťahy riešime lineárnou funkciou o niekoľkých neznámych parametroch (regresných koeficientoch), riešený problém nazývame lineárna regresia. Korelačný koeficient r nezávisí od mierky, v ktorej boli premenné merané. Metóda najmenších štvorcov znamená, že súčet umocnených vzdialeností meraných bodov od regresnej priamky je najmenší možný. Ak r umocníme, získame koeficient determinácie, ktorý reprezentuje proporciu spoločného rozptylu, teda na koľko percent zmena jednej premennej ovplyvní druhú.
Na základe údajov o váhe a obvode drieku bola zistená závislosť týchto údajov. Pearsonov korelačný koeficient R = 0,91 teda korelácia je vysoká, meranými bodmi sa dala dobre preložiť regresná priamka metódou najmenších štvorcov. Pomocou regresnej a korelačnej analýzy sa zistí, ako závisí váha y od obvodu drieku x . Bola zostrojená XY závislosť (iba body grafu) a z grafu bolo zrejmé, že závislosť je aproximovatelná lineárnou funkciou. Najlepší regresný model je lineárny. Radom údajov bola preložená trendová línia. Pearsonov koeficient korelácie je vysoký = 0,91, premenné X, Y sú lineárne závislé. Hodnota spoľahlivosti R2 = 0,83. Táto hodnota udáva, že 83% vzrastu váhy je závislý od vzrastu obvodu drieku . Štatistický odhad rovnice regresie: Y = b0 +b1 X; Y =-23,24 + 1,1446X
regres3 (19K)
Interpretácia koeficientov jednoduchej lineárnej regresnej funkcie
bo =-23,24 je lokujúca konštanta, ktorá vyjadruje očakávanú úroveň závisle premennej pri nulovej hodnote nezávisle premennej.
b1 = 1,1446 je regresný koeficient, ktorý vyjadruje o koľko merných jednotiek sa zmení závislé premenná pri zmene nezávisle premennej o jednu mernú jednotku
ak b1 > 0 ide o pozitívnu závislosť
ak b1 < 0 ide o negatívnu závislosť
regres2 (41K)
Okrem bodových odhadov parametrov lineárnej regresnej funkcie
Y =b0 + b1X = -23,24 + 1,14*X
boli zistené aj intervaly spolahlivosti parametrov b0 aj b1, ktoré nám poskytuje program Excel
pod analýza dát - regresia. Hodnoty zistíme v tabulke ANOVA :
parameter b0 je v intervale [-35,52;-10,96]
parameter b1 je v intervale [1,01;1,28]
F-test štatistickej významnosti modelu
H0: Model nie je štatisticky významný
HA: Model je štatisticky významný
Čím väčšia je vysvetlená variabilita (suma štvorcov modelu) v porovnaní s nevysvetlenou variabilitou (reziduálna suma štvorcov), tým lepšie odhadnutá priamka modeluje závislosť premenných. Hodnota Ftab sa zistí pomocou štatistickej funkcie Excelu
FINV(0,05;1;60)=4,00

Pretože F=301,77 > Ftab=4,0 považujeme regresný model za štatisticky významný.

Testovanie významnosti parametrov modelu

Yi = b0 + b1 Xi + ei
H0: parametre regresnej funkcie sú štatisticky nevýznamné
HA: parametre regresnej funkcie sú štatisticky významné
p > α platí H0 parametre nie sú štatisticky významné
p < α platí HA parametre sú štatisticky významné
hodnota ( parameter b0) p v limite = 0 , α = 0,05 to znamená, že platí HA
hodnota ( parameter b1) p v limite = 0, α = 0,05 to znamená, že platí HA
Teda parametre b0 aj b1 regresnej funkcie sú štatisticky významné. Ešte použijeme testovaciu charakteristiku

Výpočet intervalu spoľahlivosti

Interval spoľahlivosti je odvodený z náhodnej premennej, ktorá má Studentovo rozdelenie s n-2 stupňami volnosti. Intervalový odhad ľubovolného parametra pre regresnú priamku

rer (2K)
je daný vzťahom

reri (5K)

v tomto vzťahu najprv dosadíme za b=b0=-23,242 a potom b=b1=1,145
t1-α/2 zistíme pomocou funkcie EXCELU TINV(0,05;60)

ru (5K)

    1,01 < b1 < 1,28
-35,52 < b0 <-10,96

Výpočet

b0=-23,24;
-23,24-2*6,14 < b0<-23,24+2*6,14
b1=1,144
1,144-2*0,0659< b1<1,144+2*0,0659

Celý súbor (62 meraní) môžete mať za poplatok 5 €.
Veľkosť súboru je 61Kb.
Požiadajte súbor mailom: labrador@mail.t-com.sk
Valid HTML 4.01 Transitional



Domov

©  Klára Mrázová