Archive for Korelacja

Korelacja

Korelacja to miara współwystępowania dwóch zmiennych. Mimo, iż stwierdzenie „miara związku między zmiennymi” brzmi bardzo naukowo i poważnie, tak naprawdę z korelacją w naszym codziennym życiu mamy do czynienia częściej niż nam się wydaje. Któż z nas bowiem, nie słyszał narzekań typu: „kiedy wychodzi się z domu bez parasola, to zaraz zaczyna padać deszcz”? Takie współwystępowanie dwóch zmiennych: brak parasola- opad deszczu to właśnie jest korelacja. Innym książkowym przykładem obrazującym współczynnik korelacji jest stwierdzenie: „im ktoś jest wyższy, tym więcej waży”.  Oczywiście, już na pierwszy rzut oka, można zauważyć, iż w obu przywołanych przykładach mamy do czynienia z odmienną skalą pomiarową, na której są mierzone zmienne.  W pierwszym przypadku (brak parasola- opad deszczu) odwołujemy się do zmiennych nominalnych, w przypadku wagi i wzrostu zmienne są mierzone na skali ilościowej. Dobór współczynnika korelacji zależy właśnie od tego na jakiej skali pomiarowej mierzone są analizowane zmienne.

Najczęściej wykorzystywaną miarą określająca współwystępowanie dwóch zmiennych jest  współczynnik korelacji r- Pearsona. Za pomocą owego współczynnika jesteśmy w stanie określić korelację pomiędzy zmiennymi mierzonymi na skali ilościowej.  To właśnie za pomocą współczynnika r- Pearsona możemy zweryfikować stwierdzenie: „im ktoś jest wyższy, tym więcej waży”. Korelację r- Pearsona interpretujemy za pomocą dwóch wymiarów: siły i kierunku związku. Siła związku określa nam stopień istniejącej współzmienności. Współczynnik korelacji może przyjmować wartości od -1 do 1. Jeśli wartość współczynnika zbliża się do 1 lub -1, to mamy do czynienia z silną zależnością. Natomiast korelacja poniżej 0,3 uznawana jest za bardzo słabą lub w ogóle nie istniejącą. Kierunek korelacji informuje nas zaś o tym, w jaki sposób wartości jednej zmiennej są uporządkowane względem wartości drugiej zmiennej.  Możemy mieć do czynienia z korelacją dodatnią- wraz ze wzrostem wartości jednej zmiennej wzrastają wartości drugiej zmiennej, z korelacją ujemną – wraz ze wzrostem wartości jednej zmiennej maleją wartości drugiej zmiennej lub z korelacją równą 0 – brak związku liniowego między analizowanymi zmiennymi.

Oprócz współczynnika r- Pearsona istnieją jeszcze inne miary związku między zmiennymi dostosowane do skal pomiarowych, na których mierzone są analizowane zmienne. W przypadku skal porządkowych zastosujemy współczynnik korelacji tau – Kendalla oraz rho- Spearmana. Interpretacja tych dwóch współczynników jest identyczna jak w przypadku korelacji r- Pearsona. Wielkość współczynnika, który może przyjmować wartość  od -1 do 1, informuje nas o sile związku, a kierunek mówi w jaki sposób wartości jednej zmiennej są uporządkowane względem drugiej.

Nieco inaczej sytuacja wygląda w przypadku zmiennych nominalnych. Określając współwystępowanie zmiennych nominalnych możemy zastosować albo statystykę Phi (zmienne dwukategorialne) albo statystykę V Cramera (zmienne o większej liczbie kategorii). O ile wartość współczynnika Phi, podobnie jak pozostałych współczynników korelacji może zawierać się w przedziale od -1 do 1, to już w przypadku statystyki V Cramera współczynnik przybiera wartości od 0 do 1. W tym przypadku analizujemy bezwzględną wartość związku, nie mamy tutaj do czynienia ze związkiem ujemnym.

Współczynniki korelacji to bardzo proste do obliczenia i interpretacji miary związku, dlatego też cieszą się ogromną popularnością. Należy jednak podchodzić z dużą ostrożnością do ich stosowania i nie popadać w skrajność korelowania wszystkiego ze wszystkim,  można bowiem bardzo łatwo popaść w pułapkę korelacji pozornej.

PODOBNE ARTYKUŁY

Interpretacja wyników korelacji

Korelacja Spearmana

Korelacja Pearsona

Korelacja Tau Kendalla

Kurs spss – korelacja Spearmana

Kiedy wykorzystujemy Współczynnik korelacji rang Spearmana ?

Współczynnik korelacji rang Spearmana pozwala sprawdzić czy pomiędzy dwiema zmiennymi istnieje związek (współzależność). Korelacja Spearmana należy do grupy testów nieparametrycznych, jej parametrycznym odpowiednikiem jest korelacja Pearsona. stosujemy ją najczęściej wtedy gdy nasze zmienne nie spełniają założeń testów parametrycznych takich jak normalność rozkładu oraz ilościowy charakter testowanych zmiennych.

Kurs spss – korelacja Pearsona

Kiedy wykorzystujemy korelację Pearsona ?

Korelacja Pearsona to analiza statystyczna, która wykorzystujemy w celu sprawdzenia czy pomiędzy dwiema zmiennymi występuje liniowa zależność. Jako, że korelacja liniowa Pearsona zaliczana jest do grupy testów parametrycznych, nasze zmienne powinny spełniać następujące założenia.

– rozkłady testowanych zmiennych powinny być normalne

– testowane zmienne powinny być wyrażone na skali ilościowej

W przypadku gdy nasze zmienne nie spełniają powyższych założeń do naszych obliczeń statystycznych możemy wykorzystać korelacje nieparametryczne; Tau Kendalla bądź Rho Spearmana.

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne oparte na korelacjach to jedne z najczęściej wykorzystywanych statystyk podczas analizy różnego rodzaju danych. Obliczenia statystyczne tego typu wykorzystuje się zarówno w projektach naukowych jak i komercyjnych, ponadto są to testy bardzo proste w wykonaniu jak i interpretacji. Należy również powiedzieć o właściwościach owych analiz statystycznych. Po pierwsze na podstawie wyników korelacji nie możemy sobie pozwolić na wnioskowanie przyczynowo skutkowe – jedyne co możemy stwierdzić to związek pomiędzy zmiennymi. Po drugie analiza korelacji taka jak r Pearsona, Rho Spearmana czy Tau Kendalla pozwala jedynie na wykrycie związku pomiędzy dwiema zmiennymi.

Interpretacja korelacji

Analizy statystyczne oparte na korelacji przyjmują wartości od -1 do 1. Analizując wyniki korelacji mówimy o jej kierunku oraz sile. O kierunku zależności mówi nam znak wartości korelacji. Jeżeli nasza wartość jest ujemna oznacza to, że związek pomiędzy zmiennymi jest odwrotnie proporcjonalny (korelacja ujemna), natomiast jeżeli wartość jest dodatnia mówimy w takim przypadku o zależności dodatniej. O korelacji ujemnej mówimy wówczas gdy wartości jednej zmiennej rosną a drugiej  maleją, natomiast w przypadku korelacji dodatniej wartości obu zmiennych rosną.

Przykład korelacji ujemnej

Wraz ze wzrostem wagi badanych maleje ich wytrzymałość w biegu na 10 km.

Przykład korelacji dodatniej

Wraz ze wzrostem liczby treningów rośnie wytrzymałość w biegu na 10 km.

Siła korelacji zależy od jej wartości. Czym bliższa wartość liczby -1 bądź 1 tym siła naszej korelacji jest wyższa. Prowadząc analizy statystyczne z wykorzystaniem testów korelacyjnych najczęściej przyjmuje się za wysoką korelację wartość powyżej 0,6 bądź też poniżej -0,6. Za średnią siłę korelacji uważamy te 0,4 do 0,6 bądź -0,4 do -0,6.

Analizy statystyczne – korelacja

Planując przeprowadzenie analiz statystycznych tak naprawdę mamy do wyboru dwie drogi. Pierwsza z nich to grupa analiz statystycznych opartych na korelacjach a więc testach badających związek pomiędzy dwoma bądź większa liczbą zmiennych. Druga droga służy do weryfikacji hipotez dotyczących różnic pomiędzy grupami bądź pomiarami prowadzonymi w różnym czasie. W poniższym artykule skupimy się jednak na analizach statystycznych opartych na metodach korelacyjnych.

Obliczenia statystyczne z wykorzystaniem analiz korelacyjnych to grupa testów pozwalająca zbadać czy pomiędzy testowanymi zmiennymi występują istotne zależności. Należy jednak pamiętać, że testy oparte na korelacjach nie pozwalają na wyciąganie wniosków przyczynowo skutkowych tzn. nie możemy stwierdzić, która ze zmiennych pełni rolę zmiennej wyjaśniającej a która wyjaśnianej. Jedyne co w przypadku analiz statystycznych opartych na korelacjach możemy stwierdzić z całą pewnością to fakt wystąpienia związku pomiędzy zmiennymi.

Najpopularniejsze testy oparte na korelacjach pozwalające zbadać zależność pomiędzy dwiema zmiennymi to współczynnik korelacji r Pearsona, współczynnik korelacji Rho Spearmana oraz współczynnik korelacji Tau Kendalla. Oczywiście każdy z tych testów stosowany jest w pewnych warunkach, dlatego też poniżej znajduje się krótka charakterystyka każdego z wyżej wymienionych testów.

Korelacja r Pearsona – obliczenia statystyczne z wykorzystaniem tegoż testu możemy przeprowadzić jedynie w przypadku gdy nasze zmienne wyrażone są na skali ilościowej a ich rozkłady są bliskie rozkładowi normalnemu. Korelacja r Pearsona pozwala zbadać związek liniowy pomiędzy dwiema zmiennymi.

Korelacja Rho Spearmana – obliczenia statystyczne z wykorzystaniem tej statystyki przeprowadzamy zazwyczaj wtedy gdy przynajmniej jedna z naszych zmiennych wyrażonych na skali ilościowej nie spełnia założenia dotyczącego normalności rozkładu. Warto również zaznaczyć, że analizy statystyczne z wykorzystaniem testu Rho Spearmana opiera się na analiza rang, jednak jej wynik odczytuje się w identyczny sposób jak korelacje r Pearsona.

Korelacja Tau Kendalla – obliczenia statystyczne z wykorzystaniem tego testu stosujemy wtedy gdy nasze zmienne (bądź przynajmniej jedna z nich) jest wyrażona na skali porządkowej. Należy również zaznaczyć, że opiera się na analizie rang – tak jak to jest w przypadku korelacji Rho Spearmana.

PODOBNE ARTYKUŁY:

Interpretacja wyników korelacji

Korelacja Spearmana

Korelacja Pearsona

Korelacja Tau Kendalla

korelacja tau Kendalla

Analiza statystyczna wykonana za pomocą korleacji Tau Kendalla pozwala stwierdzić czy istnieje zależności pomiędzy dwiema zmiennymi. Korelacje Tau Kendalla wykorzystujemy wtedy gdy jedna bądź obie testowane zmienne wyrażone są na skali porządkowej.  W przypadku gdy chcemy sprawdzić czy wykształcenie (skala porządkowa) jest istotnie powiązane np. z odczuwaną samooceną (skala ilościowa) wtedy naszą analizę statystyczną powinniśmy przeprowadzić właśnie za pomocą korelacji Tau Kendalla.

Korelacja Spearmana

Jest to analiza statystyczna, która pozwala zmierzyć zależności między dwiema zmiennymi. Analiza ta nazywana jest też korelacją rangową, gdyż cały aparat obliczeniowy opiera się właśnie na nich. Korelacja Spearmana należy do grupy testów nieparametrycznych a wykorzystujemy ją zazwyczaj w przypadku gdy obie zmienne (bądź tylko jedna z nich) w naszej analizie statystycznej nie posiadają rozkładu normalnego.

PODOBNE ARTYKUŁY:

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne – korelacja

Na czym polega analiza korelacji ?

Kurs spss – korelacja Spearmana

Kurs spss – korelacja Pearsona

korelacja Pearsona

Korelacja Pearsona Jest to statystyka pozwalająca na wykrycie zależności liniowej pomiędzy dwiema zmiennymi. By móc zastosować korelację r – Pearsona nasze zmienne powinny mieć charakter ilościowy, ponadto ich rozkład powinien być normalny. Jeżeli np. chcemy sprawdzić czy istnieje związek pomiędzy wagą człowieka a jego wzrostem korelacja r Pearsona jest do tego idealną analizą statystyczną (oczywiście tylko wtedy gdy zmienne spełniają wyżej wymienione założenia).

 

PODOBNE ARTYKUŁY:

Analizy statystyczne – interpretacja wyników korelacji

Analizy statystyczne – korelacja

Na czym polega analiza korelacji ?

Kurs spss – korelacja Spearmana

Kurs spss – korelacja Pearsona

analiza korelacji

Odpowiednie analizy statystyczne są dostępne do różnych zastosowań i do stwierdzania różnych zależności. Jedną ze znanych i często używanych analiz jest korelacja. Do przeprowadzenia tej analizy potrzebne są zmienne, a badana będzie zależność między nimi – czy w ogóle istnieje, w jakim jest kierunku itd. Chodzi oczywiście o zależność liniową. W przypadku korelacji można określić zależność liniową o wartości w zakresie od -1 do +1. Za pomocą oznaczeń oraz liczb można określić, jaką wartość przyjmują analizy statystyczne i w jakim kierunku występuje istniejąca zależność. Analiza statystyczna nazywana korelacją używana jest w różnych odmianach, na przykład jako współczynnik korelacji Spearmana, współczynnik korelacji Tau Kendalla czy też współczynnik korelacji r Pearsona. Trzeba odpowiednio rozłożyć zmienne oraz użyć właściwej skali, dzięki czemu wyniki mogą być prawidłowe i wiele mówiące. Wybór odnośnie tego, jakie analizy statystyczne zostaną wykorzystane, można uzależnić od rodzaju zmiennych. Na przykład zmienne wyrażone dzięki skali ilościowej oraz posiadające normalny rozkład można analizować za pomocą współczynnika korelacji r Pearsona. W przypadku, gdy zmienne nie znajdują się w rozkładzie normalnym (choćby jedna z nich), należy użyć korelacji Spearmana. Ostatni z omówionych współczynników, współczynnik Tau Kendalla, przydatny jest w przypadku skali porządkowych oraz znajdujących się na nich zmiennych.

Na czym polega analiza korelacji ?

Korelacja to analiza statystyczna, która pozwala nam sprawdzić czy pomiędzy dwiema zmiennymi istnieje zależność liniowa. Analizy statystyczne oparte na korelacjach przyjmują zazwyczaj wartości od -1 do 1. Znak (-/+) korelacji informuje nas o kierunku naszej zależności, natomiast wartość o jej sile (czym bliżej wartości -1 bądź 1 tym nasza korelacja jest silniejsza). Do najpopularniejszych odmian analiz korelacyjnych zaliczamy współczynnik korelacji r Pearsona, współczynnik korelacji Spearmana oraz współczynnik korelacji Tau Kendalla. To którą z wyżej wymienionych analiz statystycznych wykorzystamy zależy od wielu czynników związanych miedzy innymi z charakterystyką rozkładu naszych zmiennych oraz z tym na jakiej skali są one wyrażone. Współczynnik korelacji Pearsona wykorzystujemy wtedy gdy nasz obie zmienne są wyrażone na skali ilościowej, ponadto ich rozkład powinien być normalny. Korelację Spearmana wykorzystujemy zazwyczaj wtedy gdy jedna bądź obie nasze zmienne nie spełniają założeń związanych z normalnością rozkładu. Współczynnik Tau Kendalla jest przeznaczony do analiz zmiennych wyrażonych na skalach porządkowych. Podsumowując analiza statystyczna oparta na korelacji to bardzo prosta w interpretacji statystyka wykorzystywana do tego by sprawdzić czy dwie zmienne są względem siebie zależne.