Statystyka

Statystyka
Elementy statystyki opisowej. Podstawowe pojęcia, takie jak średnia arytmetyczna, średnia ważona, mediana, dominanta.
/ 16.11.2009 16:00
Statystyka

Statystyka jako nauka zajmuje się weryfikacją hipotez statystycznych oraz estymacją (szacowaniem) punktową lub przedziałową parametrów.

Statystyka to również dział matematyki, zajmujący się metodami wnioskowania statystycznego. Polega ono na tym, że dane zebrane na podstawie prób lub obserwacji pozwalają sformułować ogólne wnioski. Statystyka zajmuje się zbieraniem i porządkowaniem danych poprzez ich analizę. Statystyka matematyczna korzysta m. in. z teorii prawdopodobieństwa (zdarzenia i próby losowe).

Z punktu widzenia statystyki rzut kostką może po pewnym czasie zacząć wykazywać pewne prawidłowości, pozwalające na obliczenie wzorów statystycznych. Próba statystyczna jest to zbiór informacji statystycznych wybranych losowo z populacji.

Próba losowa to podzbiór elementów populacji podlegający badaniu statystycznemu.

Dobór losowy to taki dobór elementów z populacji do próby statystycznej, w którym wszystkie elementy populacji mają równe szanse dostania się do próby (takie samo prawdopodobieństwo). Dobór losowy jest obarczony błędem wynikającym z przybliżenia (tzn. że wyniki będą tylko zbliżone do prawdy), oraz błędem systematycznym (nieunikniona niedoskonałość pomiaru). Dobór losowy nie polega na ślepym losowaniu, ale na prawdopodobieństwie każdego z elementów do znalezienia się w próbie. Jest to jeden z podstawowych sposobów dokonywania eksperymentów statystycznych.

Etapy badania statystycznego

1. Planowanie i przygotowanie badania,
2. Zebranie materiału statystycznego (danych statystycznych) i przygotowanie go do opracowania,
3. Opracowanie i prezentacja zebranego materiału statystycznego,
4. Analiza statystyczna.

Dane statystyczne to wynik badania statystycznego. Dane surowe to dane, uzyskane bezpośrednio z badania.

Liczebność przedziału lub czystość bezwzględna to liczba elementów populacji znajdujących się w danym przedziale liczbowym.
Częstość względna w danym przedziale to ułamek wskazujący, jaką część wszystkich danych stanowi liczba danych występujących w tym przedziale.

Indukcja matematyczna

Zasada indukcji matematycznej pozwala na przeprowadzenie dowodów twierdzeń , które dotyczą liczb naturalnych. Odpowiedni dowód indukcyjny dzieli się na dwie podstawowe części:

  • pierwsza część polega na sprawdzeniu prawdziwości tezy, którą chcemy dowieść, dla liczby n;
  • po udowodnieniu prawdziwości tezy, można przystąpić do drugiej części, w której zakłada się, że jeśli teza jest prawdziwa dla liczby n, to również i dla liczby k ≥ n oraz dla liczby k1, czyli kolejnej po k;

Przykład:

Teza: dla każdej liczby n ≥ 3 prawdziwa jest nierówność 2n > 2n

Sprawdzamy prawdziwość tezy dla n = 3:

2n > 2n
23 > 2 • 3
8 > 6

Udowodniliśmy, że teza przykładu dla n = 3 jest prawdziwa.

Założenie:

2n + 1 > 2 (n + 1)

Dowód:

24 > 2 • 4
16 > 8

Udowodniliśmy, że teza przykładu jest prawdziwa dla liczb n ≥ 3.

Średnia arytmetyczna

Średnia arytmetyczna n liczb to . Jest to iloraz sumy n liczb i n. Średnia arytmetyczna to potocznie – średnia, a więc wzór ten może posłużyć np. do obliczenia Twojej szkolnej średniej.

Jeśli Twoje oceny w tym semestrze to 2, 4, 4, 5, 3, wzór będzie wyglądał tak: .

Średnia ważona

Średnia ważona n liczb , którym przypisano odpowiednio dodatnie wagi to 

Oceny z klasówek wynoszą 5, 1 i 3, z kartkówek 4 i 6, z testu końcowego 3. Klasówki są średnio ważne (waga 2), kartkówki mało ważne (waga 1), a test – najważniejszy (waga 3). Liczymy: .

Średnia geometryczna

Średnią geometryczną n liczb nieujemnych a1, a2,…, an jest liczba Gn, którą wyrażamy wzorem: .

Mediana

Mediana (inaczej wartość lub liczba środkowa) to wartość cechy w szeregu uporządkowanym, poniżej i powyżej której znajduje się jednakowa liczba obserwacji. Aby ją ustalić, sortujemy obserwacje w kolejności od najmniejszej do największej, po czym:

  • Jeśli n jest nieparzyste, medianą jest środkowy wyraz ciągu.
  • Jeśli n jest parzyste, medianą będzie średnia arytmetyczna środkowych wyrazów ciągu.

Mediana daje z reguły wynik statystyczny bliższy prawdzie, gdyż skrajne elementy obserwacji nie wpływają na jej wynik.

Dominanta

Dominanta (wartość modalna lub moda) to liczba, która pojawia się w zestawie danych najczęściej. Wskazuje na wartość o największym prawdopodobieństwie wystąpienia. Jest użyteczna, gdy zaobserwowane wartości nie są liczbami. Np. dla zbioru {jabłko, gruszka, jabłko, banan, pomarańcza, gruszka, jabłko} dominantą będzie jabłko.

Przedział modalny to taki przedział liczbowy, do którego należy moda.

Rozstęp

Rozstęp to różnica między największą i najmniejszą wartością cechy statystycznej w zbiorze. Jako, że opiera się tylko na dwóch zaobserwowanych wartościach zmiennej, jest miarą mało precyzyjną. Jest to dobra metoda na sprawdzenie np. krańcowych wyników egzaminu (by mieć pojęcie o rozpiętości ocen).

Diagram

Diagram to graficzne przedstawienie danych statystycznych. Diagram kołowy to graficzne przedstawienie danych, w którym całość stanowi koło, a poszczególne jego wycinki oznaczają części danych.

Redakcja poleca

REKLAMA