Štatistické metódy - analýza údajov

bst (5K)

Príklad 1

Obchodník s mobilmi má desať zamestnancov, ktorí mu zabezpečujú komisionálny predaj. Na obr. 1 je tabuľka, v ktorej je uvedená dĺžka praxe zamestnanca, vek, a cena predaných mobilov za pracovný týždeň. Obchodník chce vedieť, či úspešnosť predaja úzko súvisí s vekom, alebo dĺžkou praxe, prípadne s oboma premennými. Pre riešenie príkladu použijeme viacnásobnú regresnú analýzu. Tento nástroj poskytuje lineárnu regresiu údajov preložením priamky cez pozorované údaje pomocou metódy najmenších štvorcov. Umožňuje analyzovať vplyv hodnôt jednej alebo viacerých nezávislých premenných na hodnoty závisle premennej veličiny: napríklad v tomto príklade vplyv veku a dĺžky praxe na úspešnosť predaja. Na základe vypočítaných parametrov môžete každému z uvedených faktorov priradiť zodpovedajúci podiel na úspešnosti predajcu a zo získaných hodnôt môžete predpovedať úspešnosť iného netestovaného predajcu. Najprv zistíme vplyv veku predajcu na úspešnosť (vyjadrenú v tisícoch Sk).



  1. vytvoríme graf XY - vek je nezávisle premenná obr. 2
  2. v grafe zobrazíme koeficient korelácie
  3. vypočítame koeficient determinácie (R2)
  4. koeficient neurčitosti (1-R2)
  5. chybu strednej hodnoty
Vek-predaj

Pre výpočet faktorov v zozname, pod bodmi 3 - 6 zadajte nástroje-analýza údajov-regrese. Do kolonky vstupní oblastY zadáme $C$1:$C$11, a pre vstupní oblast X $B$1:$B$11 (obr. 1). Zadajte tiež odkaz na bunku, kde chcete mať začiatok oblasti s výsledkami. Výsledky sa zobrazia tak, ako to ukazujú obr. 3 - 6.

Regrese

Z analýzy zisťujeme, že koeficient korelácie=0,90755 (násobné R= Multiple R) je vysoký. Koeficient determinácie R2 = 0,82365 interpretujeme tak, že 82,4% zmien komisionálneho predaja sa prisudzuje veku. 17,6% zmien v komisionálnom predaji nie je spôsobené vekom. Chyba strednej hodnoty udáva, že priemerná chyba v predpovedi výšky komisionálneho predaja je 2 319,2 Sk. Chyba strednej hodnoty sa vypočíta podľa vzorca (1), S0 udáva vzorec (2).

Vzorec1
Vzorec2
Anova
Anova
Priamka

Z obr. 3 b zisťujeme rovnicu priamky (3), preloženej metódou najmenších štvorcov. V ďalšom by sme chceli zistiť, aká časť kolísania výšky komisionálneho predaja sa dá pripísať dĺžke praxe a napokon, chceme zistiť očakávanú výšku komisionálneho predaja osoby veku=X2 s dĺžkou praxe =X1.Teraz vezmeme v úvahu aj dĺžku praxe, teda sa jedná o regresnú funkciu dvoch nezávisle premenných (X1=prax, X2=vek). Znovu zvolíme Nástroje - analýza údajov - regrese. Do kolonky vstupní oblast Y zadáme $C$1:$C$11, a pre vstupní oblast X: $A$1:$B$11.


Dve nezávisle premenné
Anova(multi)
Anova(multi)

Zisťujeme, že koeficient korelácie sa zvýšil z 0,908 na 0,986. Zvýšil sa aj koeficient determinácie z hodnoty 0,824 na 0,973. To znamená, že 97,3% zmeny komisionálneho predaja sa dá prisúdiť veku a dĺžke praxe. Chyba strednej hodnoty klesla na 971 Sk. Regresná rovnica bude teraz:

Y = 48,63241 + 0,5267351 * X1 - 0,959679 * X2
(za X1 dosadíme prax, za X2 vek.)
Ak teda chceme vypočítať výšku sumy komisionálneho predaja pre zamestnanca, ktorého vek je napr. 26 rokov a má dĺžku praxe 13 mesiacov, dostávame po dosadení do regresnej rovnice:
48,63241 + 0,5267351 * 13 - 0,959679 * 26 = 30,5
t.j. zamestnanec predá mobily za týždeň v priemere za 30 500.- Sk.

Príklady boli vypracované v Excel 2000 pod OS Windows XP.
Príklady si môžete stiahnuť.


stat.zip    Veľkosť: 3 kB
© Klára Mrázová
Výuka latinčiny

Valid HTML 4.01 Transitional
Stránka je v súlade s aktuálnymi normami.


e-Slovníky.cz = profi on-line slovníky