Tag Archive for wariancja

Wariancja

Aby przekonać się jak istotna w analizach statystycznych jest wariancja, wystarczy wziąć do ręki kilka wiodących czasopism poruszających np. tematykę badań eksperymentalnych w naukach społecznych. Kartkując zamieszczone tam artykuły bez trudu znajdziemy zdania typu: „Celem weryfikacji niniejszej hipotezy przeprowadzono jednoczynnikową  analizę wariancji…”. Takie stwierdzenia dla większości czytelników brzmią dość tajemniczo. Na czym polega owa jednoczynnikowa analiza wariancji?  By odpowiedzieć na powyższe pytanie najlepiej zacząć od początku, czyli od wyjaśnienia czym jest wariancja i jak ją obliczyć.

Wariancja to miara dyspersji, czyli inaczej zróżnicowania, rozproszenia danych. Dzięki wariancji jesteśmy w stanie określić, jakie jest rozproszenie wyników wokół średniej. Załóżmy, że chcemy obliczyć wariancję dla następującego zbioru wyników: 2,4,6. W pierwszej kolejności musimy wyliczyć średnią arytmetyczną dla owego zbioru (M=4). Następnie odejmujemy średnią od poszczególnych wyników (X-M). Uzyskaną różnicę podnosimy do kwadratu ( [X-M] 2).  Teraz dodajemy do siebie kwadraty różnic. Otrzymaną sumę dzielimy przez liczbę wyników pomniejszoną o jeden. Wariancja w analizowanym przykładzie wynosi 4. Aby łatwiej nam było zinterpretować uzyskany wynik należy obliczyć odchylenie standardowe, czyli  pierwiastek kwadratowy z wariancji. Interpretacja odchylenia standardowego jest o tyle prostsza, iż jest ono wyrażone w jednostkach pomiaru, a nie w kwadratowych jednostkach pomiaru tak jak wariancja. Odchylenie standardowe dla analizowanego zbioru wyników wynosi 2. Oznacza, to iż przeciętna odległość wyników od średniej to 2 jednostki.

Wariancja to jedna z   najpopularniejszych miar testów parametrycznych.  Przykładem może być wspomniana na wstępie jednoczynnikowa analiza wariancji (ANOVA) w schemacie międzygrupowym. Po ten rodzaj testu parametrycznego sięgniemy, kiedy będziemy chcieli zweryfikować hipotezę mówiącą o wpływie jednej zmiennej niezależnej (mającej dwie lub więcej wartości) na zmienną zależną. Wyobraźmy sobie, iż chcemy sprawdzić, czy kolor kubka (czerwony, niebieski, żółty) ma wpływ na ocenę smaku (skala ilościowa) podawanego napoju. Głównym celem analizy wariancji jest ustalenie jaki jest stosunek zmienności wyników, ich wariancji spowodowany manipulacją eksperymentalną (kolorem kubka) do zróżnicowania  (wariancji) oceny smaku, które spowodowane jest wszystkimi innymi czynnikami np. upodobaniami smakowymi osób badanych.  Aby potwierdzić naszą hipotezę (kolor kubka wpływa na ocenę smaku testowanego napoju) musimy po pierwsze udowodnić, że wyniki wewnątrz   każdej grupy badanej („grupa kubka czerwonego”, „grupa kubka niebieskiego”, „grupa kubka żółtego”) są jak najbardziej do siebie podobne, czyli wariancja wewnątrzgrupowa jest jak najmniejsza. Po drugie powinniśmy też  wykazać, iż różnice pomiędzy średnimi obliczonymi z wyników w poszczególnych grupach a ogólną średnią oceną smaku (wariancja międzygrupowa) są duże. Jeśli udałoby się nam  spełnić każdy z powyższych warunków, to oznaczałoby, że nasza manipulacja (kolor kubka) sprawiła, że grupy różnią się między sobą w ocenie smaku napoju.

Podsumowując , jednoczynnikowa analiza wariancji  to zestawienie wielkości wariancji międzygrupowej z wariancją wewnątrzgrupową. Wariancja natomiast to miara dyspersji (należąca do grupy statystyk opisowych) określająca rozproszenie wyników wokół średniej.

PODOBNE ARTYKUŁY

Zastosowanie jednoczynnikowej analizy wariancji (ANOVA)

 

Jednoczynnikowa analiza wariancji ANOVA

Jest to analiza statystyczna, która pozwoli nam wykryć różnice pomiędzy grupami. Anove stosujemy zazwyczaj gdy chcemy porównać średnie uzyskane przez więcej niż dwie grupy. Z racji tego iż opisywana analiza statystyczna zaliczana jest do testów parametrycznych, by móc ją zastosować muszą być spełnione pewne założenia.

– zmienna zależna wykorzystywana w analizie statystycznej powinna charakteryzować się rozkładem normalnym

– zmienna zależna wykorzystana w analizie statystycznej powinna być wyrażona na skali ilościowej

– grupy badawcze (tworzące tzw. czynnik) powinny mieć zbliżone liczebności