Wnioskowanie statystyczne

Analiza statystyczna to jeden z najtrudniejszych etapów procesu badawczego. Nawet doświadczonym badaczom zrozumienie struktury danych zajmuje sporo czasu. Przystępując do pacy nad danymi musimy więc uzbroić się w cierpliwość i pamiętać, iż nie da się tego zrobić błyskawicznie. Już samo przygotowanie danych do analizy statystycznej wymaga sporo pracy, nie wspominając o wykonaniu odpowiednich obliczeń statystycznych.

            Aby etap analiz statystycznych został wykonany prawidłowo należy skorzystać ze schematu wnioskowania statystycznego będącego swoistego rodzaju kompasem metodologicznym mającym doprowadzić nas do wyboru odpowiednich obliczeń statystycznych, które w konsekwencji pozwolą na adekwatny opis zebranych danych.

            Przystępując do analizy statystycznej koncentrujemy się na sformułowanej hipotezie badawczej, która przewiduje jakiego układu wyników oczekujemy. Hipotezy badawcze mogą mieć charakter zależnościowy lub różnicowy. Hipotezy zależnościowe mówią o związkach między zmiennymi np. istnieje związek między płcią a lękiem. Hipotezy różnicowe wskazują natomiast na różnice między grupami i mogą mieć postać jednostronną (poziom lęku jest wyższy u kobiet niż u mężczyzn) lub dwustronną (kobiety i mężczyźni różnią się poziomem lęku).

            Mimo, iż te dwa rodzaje hipotez wzajemnie się nie wykluczają (z jednej hipotezy wynika druga), to ich postać jest bardzo ważna dla dalszych analiz statystycznych. To z jaką hipotezą będziemy mieli do czynienia będzie warunkowało wybór odpowiednich technik, obliczeń statystycznych weryfikujących zakładane oczekiwania.    Kiedy będziemy weryfikować związek między zmiennymi, sięgniemy po testy zależnościowe -korelacje np. współczynnik korelacji r- Pearsona, rho – Spearmana lub tau-b Kendalla. Jeśli nasza hipoteza będzie miała postać hipotezy różnicowej, wykorzystamy któryś z testów istotności różnic np. test F analizy wariancji, test Kruskala – Walisa, test t – Studenta, test U Manna – Whitneya, test Wilcoxona, czy  test chi- kwadrat Fishera.

Na tym etapie analiz statystycznych powinniśmy skorzystać z algorytmu doboru testu. Najważniejsze kryteria wyboru testu statystycznego to skala pomiarowa, na której mierzone są zmienne, liczba analizowanych zmiennych, a w przypadku testów istotności różnic również schemat badawczy (międzygrupowy vs. wewnątrzgrupowy).

Analizy statystyczne mogą być przeprowadzone na danych nominalnych, porządkowych lub interwałowych, ilorazowych.  Jeśli nasze zmienne będą mierzone na skali interwałowej lub ilorazowej, a weryfikowana hipoteza będzie miała charakter zależnościowy, to przeprowadzając obliczenia statystyczne sięgniemy po współczynniki r- Pearsona. Najpierw jednak musi sprawdzić, czy analizowane przez nas zmienne mają rozkład normalny. W tym celu należy wykonać test Kołomogorowa – Smirnowa. Jeśli założenie o normalności rozkładu nie zostanie spełnione bezpieczniej jest sięgnąć po porządkowy odpowiednik owej statystyki tj. współczynnik tau- b Kendalla lub rho – Spearmana. W przypadku hipotez różnicowych sprawa jest jeszcze bardziej skomplikowana.

Dokonując analiz statystycznych dotyczących hipotez różnicowych oprócz skali pomiarowej musimy wziąć pod uwagę liczbę porównywanych grup. Na przykład jeśli zależy nam na sprawdzeniu, czy rozkład naszej zmiennej jest dziełem przypadku, czy też  kategorie analizowanej zmiennej rozkładają się nierównolicznie w sposób systematyczny lub chcemy po prostu porównać średnią obliczoną dla danej próby ze znanym, z wcześniejszych badań lub danych teoretycznych, kryterium, to będziemy dysponowali jedną próbą, grupą badawczą (k=1). Przystępując wtedy do obliczeń statystycznych sięgniemy np. po test chi – kwadrat dla jednej zmiennej (dane nominalne) lub test t dla jednej zmiennej (dane interwałowe, ilorazowe), oczywiście przed uprzednim zweryfikowaniem założenia o normalności rozkładu.

W przypadku dwóch grup badawczych i większej ich liczby przed przystąpieniem do analiz statystycznych musimy również sprawdzić z jakim schematem badawczym mamy do czynienia. Jeśli porównywane przez nas grupy mają charakter niezależny np. porównujemy wyniki dwóch odrębnych populacji – kobiet i mężczyzn, możemy zastosować test t dla danych niezależnych (dane ilorazowe, interwałowe), test Manna –Whitneya (dane porządkowe) lub test chi – kwadrat Fischera (dane nominalne). Kiedy porównujemy więcej niż dwie grupy niezależne (k>2), wykonując  obliczenia statystyczne będziemy korzystać z testu F analizy wariancji (dane interwałowe, ilorazowe), testu Kruskala – Wallisa (dane porządkowe) lub testu chi – kwadrat (dane nominalne).

Natomiast w sytuacji, kiedy będziemy mieli do czynienia z danymi zależnościowymi (dobór do odpowiednich grup będzie przebiegał parami), przeprowadzając analizy statystyczne posłużymy się takimi testami jak: test t  dla danych zależnych (dane ilorazowe, interwałowe; k=2), test Wilcoxona (dane porządkowe; k=2), test McNemara (dane nominalne; k=2) lub test F analizy wariancji (dane interwałowe, ilorazowe, k>2), test Friedmana (dane porządkowe, k>2), test Cochrana (dane nominalne, k>2).

W przypadku zastosowania testów istotności różnic dla danych interwałowych, ilorazowych przed wykonaniem obliczeń statystycznych oprócz sprawdzenia normalności rozkładu analizowanych zmiennych, jesteśmy zobowiązani również do zweryfikowania założenia dotyczącego homogeniczności wariancji (dane niezależne) lub równości i symetryczności macierzy wariancji (dane zależne).

Podsumowując po ustaleniu charakteru hipotezy badawczej (różnicowa, zależnościowa), doborze odpowiedniego testu w oparciu o algorytm odwołujący się do 3 kryteriów (skala pomiarowa, liczba analizowanych grup, schemat badania) i zweryfikowaniu wszystkich założeń, możemy wreszcie  rozpocząć obliczenia statystyczne.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *