Archive for Słownik statystyczny

Miary tendencji centralnej

Miary tendencji centralnej to statystyki, które pozwalają określić wartości centralne danego zbioru. Do miar tendencji centralnych zaliczamy statystyki między innymi  takie jak dominanta, mediana, średnia arytmetyczna.

Dominanta – jest to wartość najczęściej pojawiająca się w zbiorze danych. Dominantę możemy policzyć dla zmiennych wyrażonych na skali nominalnej, porządkowej, ilościowej.

Mediana – jest to wartość dzieląca zbiór danych na dwie równe części. Dzięki statystyce mediany możemy stwierdzić, który element w naszym zbiorze dzieli nasze wyniki dokładnie na dwie części po 50%. Wartość Mediany jest bardzo często wykorzystywana do dychotomizacji zmiennej ilościowej. Medianę możemy policzyć dal zmiennych wyrażonych na skali ilościowej oraz porządkowej.

Średnia arytmetyczna – najpopularniejsza z miar tendencji centralnej. By obliczyć średnią arytmetyczną należy zsumować wszystkie wartości znajdujące się w naszym zbiorze a następnie podzielić tą wartość prze liczbę elementów. Średnią arytmetyczną możemy policzyć jedynie dla zmiennych wyrażonych na skali ilościowej. Warto również zaznaczyć, że średnia arytmetyczna jest podatna na wyniki dewiacyjne.

Średnia arytmetyczna

Średnia arytmetyczna to najczęściej wykorzystywana statystyka w różnego rodzaju raportach, zestawieniach itp. Średnia arytmetyczna należy do grupy statystyk zwanych miarami tendencji centralnej. Należy pamiętać, że średnią arytmetyczną możemy policzyć jedynie dla danych ilościowych – w przypadku gdy nasza zmienna ma charakter porządkowy bądź nominalny średniej arytmetycznej nie da się policzyć. Warto również zaznaczyć, że średnia arytmetyczna nie jest odporna na wyniki dewiacyjne tzn. znacząco odstające od pozostałych elementów znajdujacych się w zbiorze.

Aby policzyć średnią arytmetyczną należy zsumować wszystkie wartości znajdujące się w naszym zbiorze a następnie podzielić uzyskaną sumę przez liczbę elementów (naszego zbioru).

 

Przykład:

W naszym zbiorze znajdują się dane wzrostu pięciu koszykarzy

 

Koszykarz pierwszy – 195 cm

Koszykarz drugi – 205 cm

Koszykarz trzeci – 190 cm

Koszykarz czwarty – 188 cm

Koszykarz piąty – 179 cm

 

By obliczyć średnią arytmetyczną wzrostu  pięciu koszykarzy w pierwszej kolejności musimy zsumować wszystkie wyniki:

 

195 cm + 205 cm + 190 cm + 188 cm + 179 cm = 957 cm

 

Kolejny krok to podzielenie uzyskanej sumy wzrostu przez liczbę elementów znajdujących się w zbiorze. W naszym zbiorze znajdują są dane pięciu koszykarzy a więc uzyskaną przez nas sumę musimy podzielić przez 5.

 

957 / 5 = 191,4

 

Średnia arytmetyczna dla wzrostu koszykarzy znajdujących się w naszym zbiorze wynosi 191,4 cm.

Dominanta

Dominanta (moda, wartość modalna) to najprościej mówiąc wartość najczęściej pojawiająca się w zbiorze. Wartość dominanty możemy policzyć dla zmiennych wyrażonych na wszystkich skala (nominalnej, porządkowej, ilościowej).

 

Przykład:

W zbiorze o wartościach 1, 1, 2, 3, 3, 3, 3, 4, 4, 5, 6, 7 dominantą będzie wartość 3, ponieważ tego typu elementów jest najwięcej w naszym zbiorze (są cztery 3).

Odchylenie standardowe

Odchylenie standardowe informuje nas o rozproszeniu obserwacji wokół średniej. Czym mniejsza wartość odchylenia standardowego tym nasze obserwacje są ciaśniej skupione wokół średniej. Za pomocą odchylenia standardowego jesteśmy w stanie wyliczyć przedział wartości w których znajduje się 66,7% wszystkich wartości naszego zbioru. W praktyce istnieją rodzaje odchyleń standardowych ze względu na właściwości naszych zbiorów.

 

Odchylenie standardowe z próby – jest to wartość wyliczana na podstawie jednostek wchodzących w skład naszej próby. Bardzo często prowadząc badania naukowe czy też komercyjne wyliczamy odchylenie standardowe z próby po to by stało się ono estymatorem wartości tej statystyki w populacji.

 

Odchylenie standardowe z populacji – jest to bardzo rzadko wyliczana wartość. By móc wyliczyć odchylenie standardowe tego typu, w naszym zbiorze musiałyby znaleźć się wszystkie elementy tworzące  populację – co w praktyce jest bardzo rzadko spotykane.

Mediana wzór

Mediana to statystyka opisowa zaliczana do tzw. miar tendencji centralnej. Jest to wartość, która dzieli rozkład wyników dokładnie na dwie równe części – dokładnie powyżej oraz poniżej wartości mediany znajduje się po 50% obserwacji. Medianę możemy policzyć jedynie w przypadku gdy nasza zmienna wyrażona jest na skali porządkowej bądź też ilościowej. Mediana to statystyka bardzo często wykorzystywana przy dychotomizacji zmiennych ilościowych – staje się ona punktem podziału zbioru danych na dwie części. Mediana zwana jest również wartością środkową.

 

mediana wzór

By móc obliczyć wartość mediany z pewnej liczby obserwacji n, musimy w pierwszej kolejności posortować nasze dane od najmniejszej do największej wartości gdzie n będzie oznaczać wartość największą. Następnie w zależności od tego czy nasza wartość n jest parzysta czy też nie stosujemy następujące wzory .

 

n (nieparzyste) – (n + 1)/2

n (parzyste) – w przypadku gdy n jest parzyste medianą jest średnia arytmetyczna dwóch środkowych obserwacji, które można wyliczyć w następujący sposób

Obserwacja 1 – n/2

Obserwacja 2 – (n/2)+1

 

Po wyliczeniu obserwacji nr 1 i 2 obliczamy na ich podstawie średnią arytmetyczną i to właśnie ona stanowi naszą medianę.

Chcesz policzyć medianę ? zrób to w excelu