Tag Archive for Korelacja Pearsona

Kurs spss – korelacja Pearsona

Kiedy wykorzystujemy korelację Pearsona ?

Korelacja Pearsona to analiza statystyczna, która wykorzystujemy w celu sprawdzenia czy pomiędzy dwiema zmiennymi występuje liniowa zależność. Jako, że korelacja liniowa Pearsona zaliczana jest do grupy testów parametrycznych, nasze zmienne powinny spełniać następujące założenia.

– rozkłady testowanych zmiennych powinny być normalne

– testowane zmienne powinny być wyrażone na skali ilościowej

W przypadku gdy nasze zmienne nie spełniają powyższych założeń do naszych obliczeń statystycznych możemy wykorzystać korelacje nieparametryczne; Tau Kendalla bądź Rho Spearmana.

testy nieparametryczne

Testy nieparametryczne to zbiór analiz statystycznych, które stosujemy m.in. wtedy gdy nasze zmienne nie spełniają założeń testów parametrycznych. Analizując zastosowanie poszczególnych testów nieparametrycznych łatwo możemy stwierdzić, iż niektóre z nich mają swe odpowiedniki w grupie testów parametrycznych. Do testów nieparametrycznych zaliczamy m.in. statystyki takie jak test U Manna Whitneya, Test Kruskala Wallisa, Test Wilcoxona, Korelacja Tau Kendalla, Korelacja Spearmana. Oczywiście to nie wszystkie testy nieparametryczne, ale w niniejszym artykule skupimy się właśnie na nich.

Test U Manna Whitneya to analiza statystyczna, która jest nieparametrycznym odpowiednikiem testu t studenta dla prób niezależnych. Test U Manna Whitneya wykorzystywany jest do porównywania dwóch prób niezależnych. Warto również zaznaczyć, że opisywana statystyka opiera się na porównywaniu rangowym (w przypadku testu t Studenta porównujemy średnie).

Test Kruskala Wallisa to analiza statystyczna, której parametrycznym odpowiednikiem jest jednoczynnikowa analiza wariancji (ANOVA). Test Kruskala Wallisa służy do porównywania wielu prób. Warto jednak dodać, że minusem opisywanej statystyki jest niemożność zidentyfikowania pomiędzy, którymi z grup występują istotne różnice (w przypadku ANOVY możemy tego dokonać przeprowadzając dodatkowo testy post hoc lub analizę kontrastów).

Test Wilcoxona to analiza statystyczna, która pozwala nam porównać ze sobą dwie próby zależne. Testem parametrycznym, który jest odpowiednikiem opisywanej statystyki jest test t studenta dla prób zależnych. Tak jak w przypadku pozostałych testów nieparametrycznych tak i w tym aparat obliczeniowy oparty jest na porównaniu rang.

Korelacja Tau Kendalla to analiza statystyczna dla zmiennych porządkowych lub rangowanych. Jej aparat obliczeniowy również opiera się na powiązaniach rang. Korelacja Tau Kendalla może przyjmować wartości od -1 do 1, interpretacja opisywanej analizy statystycznej jest więc taka sama jak chociażby w przypadku korelacji Pearsona czy Spearmana.

Korelacja Spearmana to nieparametryczny odpowiednik współczynnika korelacji Pearsona. Stosujemy go zazwyczaj wtedy gdy nasze zmienne nie spełniają założeń przeznaczonych dla testów nieparametrycznych. Warto dodać, że i ta analiza statystyczna opiera się na rangach.

Podsumowując powyżej opisane testy nieparametryczne mają swoje odpowiedniki wśród testów parametrycznych.

 

 

testy parametryczne

Testy parametryczne to grupa analiz statystycznych, które możemy stosować po uprzednim sprawdzeniu określonych założeń względem naszych zmiennych.  Założenia te najczęściej dotyczą normalności rozkładu testowanych zmiennych, ich charakteru (na jakiej skali są wyrażone) oraz liczebności grup. Do testów parametrycznych zaliczamy statystyki takie jak test t Studenta, Analiza korelacji Pearsona, Analiza Regresji, Analiza wariancji ANOVA, MANOVA itp. Poniżej w wielkim skrócie opiszemy testy parametryczne najczęściej wykorzystywane podczas prowadzenia różnorakich analiz statystycznych.

Test t Studenta dla prób niezależnych to analizy statystyczne służące do porównania dwóch grup niezależnych.  Musimy jednak pamiętać by przed zastosowaniem testu t Studenta sprawdzić czy nasze zmienne spełniają pewne założenia. Po pierwsze nasza zmienna zależna ( czyli wzrost) powinna być wyrażona na skali ilościowej a jej rozkład powinien być normalny. Ponadto  przed analizą statystyczną powinniśmy zwrócić uwagę na liczebność poszczególnych grup (dobrze by grupa mężczyzn  była podobna do grupy kobiet pod względem liczebności).

Test t Studenta dla prób zależnych to analizy statystyczne służące do porównania dwóch grup  zależnych. Np. Jeżeli chcemy sprawdzić czy trening na siłowni zmniejszy poziom wagi u badanych test t Studenta dla prób zależnych będzie do tego celu dobrą statystyką. Oczywiście najpierw powinniśmy sprawdzić założenia dotyczące normalności rozkładu obu pomiarów wagi( a więc waga przed treningiem na siłowni oraz po treningu na siłowni). Oprócz normalności rozkładu powinniśmy sprawdzić czy nasze zmienne (w tym przypadku poziom wagi mierzony przed treningiem oraz poziom wagi mierzony po treningu) są wyrażone na skali ilościowej ( w naszym przypadku waga wyrażona w kg. jest z pewnością wyrażona na skali ilościowej).

Test t Studenta dla jednej próby to analiza statystyczna pozwalająca zbadać czy średnia uzyskana wśród badanych z naszej próby różni się istotnie od wartości testowanej. Np. Jeżeli chcemy sprawdzić czy uczniowie z klasy II b różnią się istotnie poziomem inteligencji od populacji drugoklasistów test t Studenta dla jednej próby będzie idealnym rozwiązaniem. Oczywiście  jak w przypadku każdego innego testu parametrycznego musimy sprawdzić czy rozkład naszej próby ( w naszym przypadku chodzi o uczniów z II b) jest normalny oraz czy parametr, który badamy (a więc współczynnik inteligencji) wyrażony jest na skali ilościowej. Warto zaznaczyć również, że analizy statystyczne z wykorzystaniem testu t Studenta dla jednej próby wymagają od nas znajomości tzw. wartości testowane (a więc w naszym przypadku współczynnika inteligencji dla populacji drugoklasistów).

Korelacja Pearsona to analiza statystyczna, która służy do wykrywania związków liniowych pomiędzy dwoma zmiennymi. Musimy przy tym pamiętać, że na podstawie analiz korelacyjnych nie możemy wysnuwać wniosków przyczynowo skutkowych (jedynie możemy stwierdzić związek pomiędzy dwoma zmiennymi). W przypadku testu parametrycznego jakim jest korelacja Pearsona w pierwszej kolejności powinniśmy sprawdzić czy nasze zmienne posiadają rozkład normalny oraz  czy są wyrażone na skali ilościowej.

Jednoczynnikowa analiza wariancji (ANOVA) to analizy statystyczne pozwalające porównać ze sobą średnie dowolnej liczby grup. Np. jeżeli chcemy porównać czy studenci z różnych uczelni (np. politechnika, uniwersytet, akademia rolnicza) różnią się poziomem inteligencji to ANOVA jest do tego celu idealną analizą statystyczną. Testy parametryczne tego typu tak jak i pozostałe również muszą spełniać pewne założenia. Po pierwsze zmienna zależna (w naszym przypadku poziom inteligencji) musi posiadać rozkład normalny oraz mieć charakter ilościowy. Ponadto warto też zwrócić uwagę na liczbę osób w poszczególnych grupach (dobrze jeżeli liczba studentów politechniki, uniwersytetu i akademii rolniczej jest podobna).

Analiza wariancji z powtarzanymi pomiarami to test parametryczny służący do porównywania ze sobą dowolnej liczby prób zależnych. Np. jeżeli chcemy sprawdzić czy poziom inteligencji wzrasta wraz z wiekiem osób badanych analiza wariancji z powtarzanymi pomiarami będzie do tego celu dobrą statystyką. Załóżmy, że dokonujemy trzech pomiarów inteligencji w naszej próbie (powiedzmy pierwszy pomiar dokonujemy gdy badani mają 15 lat, drugi gdy mają 16 lat i trzeci gdy mają 17 lat). Następnie porównując średnie wyniki uzyskane w poszczególnych pomiarach (odstępach czasu) sprawdzamy czy rzeczywiście wraz z wiekiem badanych rośnie ich poziom inteligencji. By móc wykorzystać analizę wariancji z powtarzanymi pomiarami powinniśmy sprawdzić czy nasze pomiary posiadają rozkład normalny oraz czy zmienna, którą badamy ma charakter ilościowy.

Analiza regresji to test parametryczny, który pozwala sprawdzić wpływ predyktorów (zmiennych niezależnych) na zmienną zależną. Np. Jeżeli chcemy sprawdzić czy zmienne takie jak poziom inteligencji emocjonalnej (zmienna niezależna) i ilość lat nauki (zmienna niezależna) wpływają na poziom zarobków osób badanych (zmienna zależna) – analiza regresji może pomóc w odpowiedzi na to pytanie. Założenia jakie muszą spełniać nasze zmienne to rozkład normalny zarówno predyktorów jak i zmiennej zależnej oraz ich charakter ilościowy (założenia te nie dotyczą regresji logistycznej).

korelacja Pearsona

Korelacja Pearsona Jest to statystyka pozwalająca na wykrycie zależności liniowej pomiędzy dwiema zmiennymi. By móc zastosować korelację r – Pearsona nasze zmienne powinny mieć charakter ilościowy, ponadto ich rozkład powinien być normalny. Jeżeli np. chcemy sprawdzić czy istnieje związek pomiędzy wagą człowieka a jego wzrostem korelacja r Pearsona jest do tego idealną analizą statystyczną (oczywiście tylko wtedy gdy zmienne spełniają wyżej wymienione założenia).

 

PODOBNE ARTYKUŁY:

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne – korelacja

Na czym polega analiza korelacji ?

Kurs spss – korelacja Spearmana

Kurs spss – korelacja Pearsona