A leíró statisztika alapfogalmai
A statisztika a valóság tömeges jelenségeinek megfigyelésével, az adatok gyűjtésével, rendszerezésével és elemzésével foglalkozó tudomány. A leíró statisztika célja a meglévő adathalmazok tömör jellemzése, strukturálása és vizuális megjelenítése anélkül, hogy valószínűségszámítási modellekre (pl. konfidenciaintervallumokra) támaszkodva általánosítana egy nagyobb sokaságra.
Alapvető fogalmak:
- Statisztikai sokaság (populáció): A vizsgált egyedek, elemek összessége.
- Minta: A sokaságból kiválasztott elemek halmaza. Ahhoz, hogy a mintából reális következtetéseket lehessen levonni, a mintavételnek reprezentatívnak és véletlenszerűnek kell lennie.
- Ismérv: A sokaság egyedeinek vizsgált tulajdonsága (pl. testmagasság, fizetés, hajszín). Az ismérv lehet minőségi (kategóriák) vagy mennyiségi (számszerűsíthető).
- Gyakoriság és relatív gyakoriság: A gyakoriság ($f_i$) megmutatja, hogy egy adott ismérvérték hányszor fordul elő a mintában. A relatív gyakoriság ($p_i$) ennek aránya a minta teljes $N$ elemszámához viszonyítva: $p_i = \frac{f_i}{N}$.
- Osztályba sorolás: Folytonos vagy nagy elemszámú adathalmaz esetén az adatokat diszjunkt intervallumokba (osztályokba) soroljuk a könnyebb kezelhetőség érdekében.