Tag Archive for słownik statystyczny

Kurs spss – Test U Manna Whitneya

Kiedy wykorzystujemy test U Manna Whitneya ?

Test U Manna Whitneya stosujemy wtedy gdy chcemy porównać ze sobą dwie próby niezależne. Warto również dodać, że jest on uważany za nieparametryczny odpowiednik testu t Studenta dla prób niezależnych. Statystykę U Manna Whitneya wykorzystujemy zazwyczaj w przypadku gdy nasza zmienna zależna wyrażona jest na skali porządkowej bądź też ilościowej, jednak nie spełnia założeń wymaganych przez testy parametryczne (takie jak np. test t Studenta dla prób niezależnych).

testy nieparametryczne

Testy nieparametryczne to zbiór analiz statystycznych, które stosujemy m.in. wtedy gdy nasze zmienne nie spełniają założeń testów parametrycznych. Analizując zastosowanie poszczególnych testów nieparametrycznych łatwo możemy stwierdzić, iż niektóre z nich mają swe odpowiedniki w grupie testów parametrycznych. Do testów nieparametrycznych zaliczamy m.in. statystyki takie jak test U Manna Whitneya, Test Kruskala Wallisa, Test Wilcoxona, Korelacja Tau Kendalla, Korelacja Spearmana. Oczywiście to nie wszystkie testy nieparametryczne, ale w niniejszym artykule skupimy się właśnie na nich.

Test U Manna Whitneya to analiza statystyczna, która jest nieparametrycznym odpowiednikiem testu t studenta dla prób niezależnych. Test U Manna Whitneya wykorzystywany jest do porównywania dwóch prób niezależnych. Warto również zaznaczyć, że opisywana statystyka opiera się na porównywaniu rangowym (w przypadku testu t Studenta porównujemy średnie).

Test Kruskala Wallisa to analiza statystyczna, której parametrycznym odpowiednikiem jest jednoczynnikowa analiza wariancji (ANOVA). Test Kruskala Wallisa służy do porównywania wielu prób. Warto jednak dodać, że minusem opisywanej statystyki jest niemożność zidentyfikowania pomiędzy, którymi z grup występują istotne różnice (w przypadku ANOVY możemy tego dokonać przeprowadzając dodatkowo testy post hoc lub analizę kontrastów).

Test Wilcoxona to analiza statystyczna, która pozwala nam porównać ze sobą dwie próby zależne. Testem parametrycznym, który jest odpowiednikiem opisywanej statystyki jest test t studenta dla prób zależnych. Tak jak w przypadku pozostałych testów nieparametrycznych tak i w tym aparat obliczeniowy oparty jest na porównaniu rang.

Korelacja Tau Kendalla to analiza statystyczna dla zmiennych porządkowych lub rangowanych. Jej aparat obliczeniowy również opiera się na powiązaniach rang. Korelacja Tau Kendalla może przyjmować wartości od -1 do 1, interpretacja opisywanej analizy statystycznej jest więc taka sama jak chociażby w przypadku korelacji Pearsona czy Spearmana.

Korelacja Spearmana to nieparametryczny odpowiednik współczynnika korelacji Pearsona. Stosujemy go zazwyczaj wtedy gdy nasze zmienne nie spełniają założeń przeznaczonych dla testów nieparametrycznych. Warto dodać, że i ta analiza statystyczna opiera się na rangach.

Podsumowując powyżej opisane testy nieparametryczne mają swoje odpowiedniki wśród testów parametrycznych.

 

 

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne oparte na korelacjach to jedne z najczęściej wykorzystywanych statystyk podczas analizy różnego rodzaju danych. Obliczenia statystyczne tego typu wykorzystuje się zarówno w projektach naukowych jak i komercyjnych, ponadto są to testy bardzo proste w wykonaniu jak i interpretacji. Należy również powiedzieć o właściwościach owych analiz statystycznych. Po pierwsze na podstawie wyników korelacji nie możemy sobie pozwolić na wnioskowanie przyczynowo skutkowe – jedyne co możemy stwierdzić to związek pomiędzy zmiennymi. Po drugie analiza korelacji taka jak r Pearsona, Rho Spearmana czy Tau Kendalla pozwala jedynie na wykrycie związku pomiędzy dwiema zmiennymi.

Interpretacja korelacji

Analizy statystyczne oparte na korelacji przyjmują wartości od -1 do 1. Analizując wyniki korelacji mówimy o jej kierunku oraz sile. O kierunku zależności mówi nam znak wartości korelacji. Jeżeli nasza wartość jest ujemna oznacza to, że związek pomiędzy zmiennymi jest odwrotnie proporcjonalny (korelacja ujemna), natomiast jeżeli wartość jest dodatnia mówimy w takim przypadku o zależności dodatniej. O korelacji ujemnej mówimy wówczas gdy wartości jednej zmiennej rosną a drugiej  maleją, natomiast w przypadku korelacji dodatniej wartości obu zmiennych rosną.

Przykład korelacji ujemnej

Wraz ze wzrostem wagi badanych maleje ich wytrzymałość w biegu na 10 km.

Przykład korelacji dodatniej

Wraz ze wzrostem liczby treningów rośnie wytrzymałość w biegu na 10 km.

Siła korelacji zależy od jej wartości. Czym bliższa wartość liczby -1 bądź 1 tym siła naszej korelacji jest wyższa. Prowadząc analizy statystyczne z wykorzystaniem testów korelacyjnych najczęściej przyjmuje się za wysoką korelację wartość powyżej 0,6 bądź też poniżej -0,6. Za średnią siłę korelacji uważamy te 0,4 do 0,6 bądź -0,4 do -0,6.

Miary tendencji centralnej

Miary tendencji centralnej to statystyki, które pozwalają określić wartości centralne danego zbioru. Do miar tendencji centralnych zaliczamy statystyki między innymi  takie jak dominanta, mediana, średnia arytmetyczna.

Dominanta – jest to wartość najczęściej pojawiająca się w zbiorze danych. Dominantę możemy policzyć dla zmiennych wyrażonych na skali nominalnej, porządkowej, ilościowej.

Mediana – jest to wartość dzieląca zbiór danych na dwie równe części. Dzięki statystyce mediany możemy stwierdzić, który element w naszym zbiorze dzieli nasze wyniki dokładnie na dwie części po 50%. Wartość Mediany jest bardzo często wykorzystywana do dychotomizacji zmiennej ilościowej. Medianę możemy policzyć dal zmiennych wyrażonych na skali ilościowej oraz porządkowej.

Średnia arytmetyczna – najpopularniejsza z miar tendencji centralnej. By obliczyć średnią arytmetyczną należy zsumować wszystkie wartości znajdujące się w naszym zbiorze a następnie podzielić tą wartość prze liczbę elementów. Średnią arytmetyczną możemy policzyć jedynie dla zmiennych wyrażonych na skali ilościowej. Warto również zaznaczyć, że średnia arytmetyczna jest podatna na wyniki dewiacyjne.

Średnia arytmetyczna

Średnia arytmetyczna to najczęściej wykorzystywana statystyka w różnego rodzaju raportach, zestawieniach itp. Średnia arytmetyczna należy do grupy statystyk zwanych miarami tendencji centralnej. Należy pamiętać, że średnią arytmetyczną możemy policzyć jedynie dla danych ilościowych – w przypadku gdy nasza zmienna ma charakter porządkowy bądź nominalny średniej arytmetycznej nie da się policzyć. Warto również zaznaczyć, że średnia arytmetyczna nie jest odporna na wyniki dewiacyjne tzn. znacząco odstające od pozostałych elementów znajdujacych się w zbiorze.

Aby policzyć średnią arytmetyczną należy zsumować wszystkie wartości znajdujące się w naszym zbiorze a następnie podzielić uzyskaną sumę przez liczbę elementów (naszego zbioru).

 

Przykład:

W naszym zbiorze znajdują się dane wzrostu pięciu koszykarzy

 

Koszykarz pierwszy – 195 cm

Koszykarz drugi – 205 cm

Koszykarz trzeci – 190 cm

Koszykarz czwarty – 188 cm

Koszykarz piąty – 179 cm

 

By obliczyć średnią arytmetyczną wzrostu  pięciu koszykarzy w pierwszej kolejności musimy zsumować wszystkie wyniki:

 

195 cm + 205 cm + 190 cm + 188 cm + 179 cm = 957 cm

 

Kolejny krok to podzielenie uzyskanej sumy wzrostu przez liczbę elementów znajdujących się w zbiorze. W naszym zbiorze znajdują są dane pięciu koszykarzy a więc uzyskaną przez nas sumę musimy podzielić przez 5.

 

957 / 5 = 191,4

 

Średnia arytmetyczna dla wzrostu koszykarzy znajdujących się w naszym zbiorze wynosi 191,4 cm.

Dominanta

Dominanta (moda, wartość modalna) to najprościej mówiąc wartość najczęściej pojawiająca się w zbiorze. Wartość dominanty możemy policzyć dla zmiennych wyrażonych na wszystkich skala (nominalnej, porządkowej, ilościowej).

 

Przykład:

W zbiorze o wartościach 1, 1, 2, 3, 3, 3, 3, 4, 4, 5, 6, 7 dominantą będzie wartość 3, ponieważ tego typu elementów jest najwięcej w naszym zbiorze (są cztery 3).

Odchylenie standardowe

Odchylenie standardowe informuje nas o rozproszeniu obserwacji wokół średniej. Czym mniejsza wartość odchylenia standardowego tym nasze obserwacje są ciaśniej skupione wokół średniej. Za pomocą odchylenia standardowego jesteśmy w stanie wyliczyć przedział wartości w których znajduje się 66,7% wszystkich wartości naszego zbioru. W praktyce istnieją rodzaje odchyleń standardowych ze względu na właściwości naszych zbiorów.

 

Odchylenie standardowe z próby – jest to wartość wyliczana na podstawie jednostek wchodzących w skład naszej próby. Bardzo często prowadząc badania naukowe czy też komercyjne wyliczamy odchylenie standardowe z próby po to by stało się ono estymatorem wartości tej statystyki w populacji.

 

Odchylenie standardowe z populacji – jest to bardzo rzadko wyliczana wartość. By móc wyliczyć odchylenie standardowe tego typu, w naszym zbiorze musiałyby znaleźć się wszystkie elementy tworzące  populację – co w praktyce jest bardzo rzadko spotykane.

Korelacja Spearmana

Jest to analiza statystyczna, która pozwala zmierzyć zależności między dwiema zmiennymi. Analiza ta nazywana jest też korelacją rangową, gdyż cały aparat obliczeniowy opiera się właśnie na nich. Korelacja Spearmana należy do grupy testów nieparametrycznych a wykorzystujemy ją zazwyczaj w przypadku gdy obie zmienne (bądź tylko jedna z nich) w naszej analizie statystycznej nie posiadają rozkładu normalnego.

PODOBNE ARTYKUŁY:

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne – korelacja

Na czym polega analiza korelacji ?

Kurs spss – korelacja Spearmana

Kurs spss – korelacja Pearsona

Test U-Manna Whitneya

Test U Manna Whitneya jest to test nieparametryczny, który pozwala porównywać miedzy sobą dwie grupy niezależne. Jest on odpowiednikiem testu t Studenta dla prób niezależnych a stosujemy go zazwyczaj wtedy gdy nasza zmienna zależna nie spełnia założeń związanych z normalnością rozkładu, bądź też jest wyrażona na skali porządkowej. Przeprowadzając analizę statystyczną za pomocą testu U Manna Whitneya nie porównujemy ze sobą średnich tak jak to się dzieje w przypadku testu t lecz średnie rangi.

PODOBNE ARTYKUŁY:

Kurs spss – Test U Manna Whitneya

Testy nieparametryczne

Zastosowanie testu U Manna Whitneya