Regresja

Właśnie skończyłeś liceum i zastanawiasz się, czy warto iść na studia? Chciałbyś wiedzieć, jakie będą Twoje zarobki, gdy na naukę poświęcisz 19 lat, a ile będziesz zarabiać po 24 latach edukacji? Nic prostszego. Wystarczy, że wykonasz analizę regresji, w której zmienną zależną będą zarobki, natomiast zmienną niezależną tzw. predyktorem liczba lat nauki. I nie martw się, skąd weźmiesz bazę danych z zarobkami osób mających za sobą 25- letni etap edukacji. Nie będzie Ci potrzebna.

Termin „analiza regresji” zarezerwowany jest dla dość szerokiej kategorii analiz statystycznych umożliwiających między innymi weryfikację zależności nieliniowych oraz wpływu zmiennych jakościowych. Najpopularniejsze są jednak modele, w których badacze zakładają liniowy związek między predyktorem tj. zmienną niezależną a zmienną zależną, a zmienne mierzone są na skalach ilościowych. Taka forma analizy regresji nazywana jest fachowo regresją liniową i stanowi swoistego rodzaju rozszerzenie korelacji- miary liniowego związku między zmiennymi. Co zyskujemy rezygnując z korelacji na rzecz analizy regresji? Po pierwsze na podstawie  regresji liniowej możemy przewidzieć, o ile zmienni się wartość zmiennej zależnej (np. zarobków), wtedy gdy wartość zmiennej niezależnej zmieni się o jedną jednostkę (np. dodatkowy rok nauki). Ponadto ogromnym atutem regresji liniowej na tle zwykłej korelacji jest możliwość prognozowania wartości zmiennej zależnej na podstawie większej ilości predykatorów niż jeden. Jak cenny jest to atut, można zorientować się już na podstawie przytoczonego powyżej przykładu odwołującego się do zarobków i liczby lat nauki. Doskonale wiadomo przecież, że oprócz lat edukacji na  wysokość zarobków wpływ mają również inne zmienne np. staż pracy, czy inteligencja. Analiza regresji  umożliwia nam uwzględnienie wszystkich tych predyktorów, co przekłada się na bardziej dokładną prognozę zmiennej zależnej. Decydując się na włączenie więcej niż jednej zmiennej do naszego modelu sięgniemy po analizę regresji wielozmiennową, w przypadku prostego modelu (jeden predykator- jedna zmienna zależna) wykonamy regresję jednozmiennową.

Na koniec warto przytoczyć kilka założeń teoretycznych, które muszą zostać spełnione za nim przystąpimy do wykonania analizy regresji. Po pierwsze zarówno zmienna zależna, jak i wszystkie analizowane predyktory muszą mieć rozkłada normalny. Po drugie muszą być mierzone na skali ilościowej. Warto również zadbać o to by na każdy analizowany predyktor przypadało co najmniej 15 osób badanych. W przypadku zaś regresji wielozmiennowej zmienne niezależne nie mogą być ze sobą skorelowane. Kiedy powyższe założenia są spełnione, możemy rozpoczynać analizę regresji, dzięki której dowiemy ile jeszcze lat musimy poświęcić na naukę by uzyskać satysfakcjonujące nas zarobki.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *