Tag Archive for analiza regresji

testy parametryczne

Testy parametryczne to grupa analiz statystycznych, które możemy stosować po uprzednim sprawdzeniu określonych założeń względem naszych zmiennych.  Założenia te najczęściej dotyczą normalności rozkładu testowanych zmiennych, ich charakteru (na jakiej skali są wyrażone) oraz liczebności grup. Do testów parametrycznych zaliczamy statystyki takie jak test t Studenta, Analiza korelacji Pearsona, Analiza Regresji, Analiza wariancji ANOVA, MANOVA itp. Poniżej w wielkim skrócie opiszemy testy parametryczne najczęściej wykorzystywane podczas prowadzenia różnorakich analiz statystycznych.

Test t Studenta dla prób niezależnych to analizy statystyczne służące do porównania dwóch grup niezależnych.  Musimy jednak pamiętać by przed zastosowaniem testu t Studenta sprawdzić czy nasze zmienne spełniają pewne założenia. Po pierwsze nasza zmienna zależna ( czyli wzrost) powinna być wyrażona na skali ilościowej a jej rozkład powinien być normalny. Ponadto  przed analizą statystyczną powinniśmy zwrócić uwagę na liczebność poszczególnych grup (dobrze by grupa mężczyzn  była podobna do grupy kobiet pod względem liczebności).

Test t Studenta dla prób zależnych to analizy statystyczne służące do porównania dwóch grup  zależnych. Np. Jeżeli chcemy sprawdzić czy trening na siłowni zmniejszy poziom wagi u badanych test t Studenta dla prób zależnych będzie do tego celu dobrą statystyką. Oczywiście najpierw powinniśmy sprawdzić założenia dotyczące normalności rozkładu obu pomiarów wagi( a więc waga przed treningiem na siłowni oraz po treningu na siłowni). Oprócz normalności rozkładu powinniśmy sprawdzić czy nasze zmienne (w tym przypadku poziom wagi mierzony przed treningiem oraz poziom wagi mierzony po treningu) są wyrażone na skali ilościowej ( w naszym przypadku waga wyrażona w kg. jest z pewnością wyrażona na skali ilościowej).

Test t Studenta dla jednej próby to analiza statystyczna pozwalająca zbadać czy średnia uzyskana wśród badanych z naszej próby różni się istotnie od wartości testowanej. Np. Jeżeli chcemy sprawdzić czy uczniowie z klasy II b różnią się istotnie poziomem inteligencji od populacji drugoklasistów test t Studenta dla jednej próby będzie idealnym rozwiązaniem. Oczywiście  jak w przypadku każdego innego testu parametrycznego musimy sprawdzić czy rozkład naszej próby ( w naszym przypadku chodzi o uczniów z II b) jest normalny oraz czy parametr, który badamy (a więc współczynnik inteligencji) wyrażony jest na skali ilościowej. Warto zaznaczyć również, że analizy statystyczne z wykorzystaniem testu t Studenta dla jednej próby wymagają od nas znajomości tzw. wartości testowane (a więc w naszym przypadku współczynnika inteligencji dla populacji drugoklasistów).

Korelacja Pearsona to analiza statystyczna, która służy do wykrywania związków liniowych pomiędzy dwoma zmiennymi. Musimy przy tym pamiętać, że na podstawie analiz korelacyjnych nie możemy wysnuwać wniosków przyczynowo skutkowych (jedynie możemy stwierdzić związek pomiędzy dwoma zmiennymi). W przypadku testu parametrycznego jakim jest korelacja Pearsona w pierwszej kolejności powinniśmy sprawdzić czy nasze zmienne posiadają rozkład normalny oraz  czy są wyrażone na skali ilościowej.

Jednoczynnikowa analiza wariancji (ANOVA) to analizy statystyczne pozwalające porównać ze sobą średnie dowolnej liczby grup. Np. jeżeli chcemy porównać czy studenci z różnych uczelni (np. politechnika, uniwersytet, akademia rolnicza) różnią się poziomem inteligencji to ANOVA jest do tego celu idealną analizą statystyczną. Testy parametryczne tego typu tak jak i pozostałe również muszą spełniać pewne założenia. Po pierwsze zmienna zależna (w naszym przypadku poziom inteligencji) musi posiadać rozkład normalny oraz mieć charakter ilościowy. Ponadto warto też zwrócić uwagę na liczbę osób w poszczególnych grupach (dobrze jeżeli liczba studentów politechniki, uniwersytetu i akademii rolniczej jest podobna).

Analiza wariancji z powtarzanymi pomiarami to test parametryczny służący do porównywania ze sobą dowolnej liczby prób zależnych. Np. jeżeli chcemy sprawdzić czy poziom inteligencji wzrasta wraz z wiekiem osób badanych analiza wariancji z powtarzanymi pomiarami będzie do tego celu dobrą statystyką. Załóżmy, że dokonujemy trzech pomiarów inteligencji w naszej próbie (powiedzmy pierwszy pomiar dokonujemy gdy badani mają 15 lat, drugi gdy mają 16 lat i trzeci gdy mają 17 lat). Następnie porównując średnie wyniki uzyskane w poszczególnych pomiarach (odstępach czasu) sprawdzamy czy rzeczywiście wraz z wiekiem badanych rośnie ich poziom inteligencji. By móc wykorzystać analizę wariancji z powtarzanymi pomiarami powinniśmy sprawdzić czy nasze pomiary posiadają rozkład normalny oraz czy zmienna, którą badamy ma charakter ilościowy.

Analiza regresji to test parametryczny, który pozwala sprawdzić wpływ predyktorów (zmiennych niezależnych) na zmienną zależną. Np. Jeżeli chcemy sprawdzić czy zmienne takie jak poziom inteligencji emocjonalnej (zmienna niezależna) i ilość lat nauki (zmienna niezależna) wpływają na poziom zarobków osób badanych (zmienna zależna) – analiza regresji może pomóc w odpowiedzi na to pytanie. Założenia jakie muszą spełniać nasze zmienne to rozkład normalny zarówno predyktorów jak i zmiennej zależnej oraz ich charakter ilościowy (założenia te nie dotyczą regresji logistycznej).

testy parametryczne i nieparametryczne

Testy parametryczne

Są to statystyki, które możemy zastosować jedynie wtedy gdy spełnione są pewne założenia, które są jednak różne w zależności od rodzaju testu. Testy parametryczne posiadają większą moc niż testy zaliczane do grupy nieparametrycznych. Do grupy testów parametrycznych zliczamy; testy t Studenta, korelację Pearsona, Analizę wariancji, Regresję.

 

Testy nieparametryczne

Jest to grupa analiz statystycznych, charakteryzująca się mniejszą mocą niż testy parametryczne. Wykorzystujemy je wtedy gdy nasze zmienne nie spełniają założeń niezbędnych do zastosowania testów parametrycznych. Do testów nieparametrycznych zaliczamy test U Mann Whitneya dla dwóch prób niezależnych(odpowiednik parametryczny test t dla prób niezależnych), test Wilcoxona służący do porównywania dwóch prób zależnych (odpowiednik parametryczny test t dla prób zależnych), test Kruskala Wallisa służący do porównywania wielu grup niezależnych (odpowiednik  jednoczynnikowa analiza wariancji ANOVA) oraz współczynniki korelacji takie jak Rho Spearmana czy Tau Kendalla.

 

 

Analiza regresji

Regresja liniowa

Na czym polega analiza regresji ?

Jest to analiza statystyczna służąca do przewidywania  wartości zmiennej zależnej na podstawie zmiennej bądź zmiennych niezależnych zwanych też predyktorami. Budując model regresji to my określamy, która z naszych zmiennych będzie predyktorem a która zmienną zależną. Analiza statystyczna jaką jest regresja pozwala uzyskać znacznie więcej informacji niż analiza korelacji, obie badają związek liniowy, jednak korelacja pozwala przeprowadzić analizę statystyczną wykorzystując jedynie dwie zmienne, natomiast w modelu regresji możemy możemy wykorzystać (jako predyktory) ich więcej. Założenia jakie powinny spełniać nasze zmienne by móc przeprowadzić analizę statystyczną za pomocą regresji liniowej to:

– predyktory nie powinny być ze sobą skorleowane (co jednak w

rzeczywistości jest bardzo trudne do osiągnięcia)

– wszystkie zmienne muszą mieć charakter ilościowy

– wszystkie zmienne powinny cechować się rozkładem normalnym

 

PODOBNE ARTYKUŁY:

Testy parametryczne

Na czym polega analiza regresji ?

Na czym polega analiza regresji

Analiza regresji

Regresja to zaawansowana analiza statystyczna, opierająca się na korelacji. Analiza regresji pozwala nam stworzyć model liniowy,  dzięki któremu jesteśmy w stanie sprawdzić jak zmienne niezależne zwane też predyktorami oddziaływują na zmienną zależną. Tworząc model regresji to my decydujemy, które zmienne będą naszymi predyktorami, a która zmienna stanie się zmienną zależną (w modelu może być tylko jedna zmienna zależna). By móc wykorzystać zmienne w opisywanej analizie statystycznej muszą one spełniać następujące założenia:

-wszystkie zmienne wykorzystane w analizie statystycznej wyrażone są na skali ilościowej

-wszystkie zmienne wykorzystane w analizie statystycznej charakteryzują się rozkładem normalnym

Podsumowując, analizę regresji stosujemy wtedy gdy chcemy na podstawie zmiennych niezależnych (bądź jednej zmiennej niezależnej) przewidywać wartość zmiennej zależnej.