Korelacja

Korelacja to miara współwystępowania dwóch zmiennych. Mimo, iż stwierdzenie „miara związku między zmiennymi” brzmi bardzo naukowo i poważnie, tak naprawdę z korelacją w naszym codziennym życiu mamy do czynienia częściej niż nam się wydaje. Któż z nas bowiem, nie słyszał narzekań typu: „kiedy wychodzi się z domu bez parasola, to zaraz zaczyna padać deszcz”? Takie współwystępowanie dwóch zmiennych: brak parasola- opad deszczu to właśnie jest korelacja. Innym książkowym przykładem obrazującym współczynnik korelacji jest stwierdzenie: „im ktoś jest wyższy, tym więcej waży”.  Oczywiście, już na pierwszy rzut oka, można zauważyć, iż w obu przywołanych przykładach mamy do czynienia z odmienną skalą pomiarową, na której są mierzone zmienne.  W pierwszym przypadku (brak parasola- opad deszczu) odwołujemy się do zmiennych nominalnych, w przypadku wagi i wzrostu zmienne są mierzone na skali ilościowej. Dobór współczynnika korelacji zależy właśnie od tego na jakiej skali pomiarowej mierzone są analizowane zmienne.

Najczęściej wykorzystywaną miarą określająca współwystępowanie dwóch zmiennych jest  współczynnik korelacji r- Pearsona. Za pomocą owego współczynnika jesteśmy w stanie określić korelację pomiędzy zmiennymi mierzonymi na skali ilościowej.  To właśnie za pomocą współczynnika r- Pearsona możemy zweryfikować stwierdzenie: „im ktoś jest wyższy, tym więcej waży”. Korelację r- Pearsona interpretujemy za pomocą dwóch wymiarów: siły i kierunku związku. Siła związku określa nam stopień istniejącej współzmienności. Współczynnik korelacji może przyjmować wartości od -1 do 1. Jeśli wartość współczynnika zbliża się do 1 lub -1, to mamy do czynienia z silną zależnością. Natomiast korelacja poniżej 0,3 uznawana jest za bardzo słabą lub w ogóle nie istniejącą. Kierunek korelacji informuje nas zaś o tym, w jaki sposób wartości jednej zmiennej są uporządkowane względem wartości drugiej zmiennej.  Możemy mieć do czynienia z korelacją dodatnią- wraz ze wzrostem wartości jednej zmiennej wzrastają wartości drugiej zmiennej, z korelacją ujemną – wraz ze wzrostem wartości jednej zmiennej maleją wartości drugiej zmiennej lub z korelacją równą 0 – brak związku liniowego między analizowanymi zmiennymi.

Oprócz współczynnika r- Pearsona istnieją jeszcze inne miary związku między zmiennymi dostosowane do skal pomiarowych, na których mierzone są analizowane zmienne. W przypadku skal porządkowych zastosujemy współczynnik korelacji tau – Kendalla oraz rho- Spearmana. Interpretacja tych dwóch współczynników jest identyczna jak w przypadku korelacji r- Pearsona. Wielkość współczynnika, który może przyjmować wartość  od -1 do 1, informuje nas o sile związku, a kierunek mówi w jaki sposób wartości jednej zmiennej są uporządkowane względem drugiej.

Nieco inaczej sytuacja wygląda w przypadku zmiennych nominalnych. Określając współwystępowanie zmiennych nominalnych możemy zastosować albo statystykę Phi (zmienne dwukategorialne) albo statystykę V Cramera (zmienne o większej liczbie kategorii). O ile wartość współczynnika Phi, podobnie jak pozostałych współczynników korelacji może zawierać się w przedziale od -1 do 1, to już w przypadku statystyki V Cramera współczynnik przybiera wartości od 0 do 1. W tym przypadku analizujemy bezwzględną wartość związku, nie mamy tutaj do czynienia ze związkiem ujemnym.

Współczynniki korelacji to bardzo proste do obliczenia i interpretacji miary związku, dlatego też cieszą się ogromną popularnością. Należy jednak podchodzić z dużą ostrożnością do ich stosowania i nie popadać w skrajność korelowania wszystkiego ze wszystkim,  można bowiem bardzo łatwo popaść w pułapkę korelacji pozornej.

PODOBNE ARTYKUŁY

Interpretacja wyników korelacji

Korelacja Spearmana

Korelacja Pearsona

Korelacja Tau Kendalla

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *