8. tétel

Adatsokaságok jellemzői, a valószínűségszámítás elemei.

Adatsokaságok jellemzői

Számsokaságnak nevezzük az olyan statisztikai adathalmazt, amelyben az adatok számok. (Ez nem valódi halmaz, mivel egyes elemek többször is szerepelhetnek benne.) Az ilyen számsokaságot statisztikai mutatókkal tudjuk jellemezni. A statisztikai mutatók két nagy csoportja a középértékek és a szórások.

Középértékek

1.      Átlag (= számtani közép)

Def. :Egy számsokaság számtani közepe úgy kapható meg, hogy az adatokat összeadjuk, és az összeget elosztjuk az adatok számával.

Azaz:  (x1, x2, …, xn a számsokaság elemei)

Pl: 1, 3, 6, 7, 8, 9, 15 sokaság számtani közepe 7.

Ha x1, x2, …, xn rendre k1, k2, …, kn-szer szerepelnek a sokaságban, akkor egyszerűbb a súlyozott átlaggal számolni:

2.      Medián

Def. : Egy számsokaság mediánjának nevezzük a nagyság szerint rendezett adatok közül a középsőt, ha az adatok száma páratlan, vagy a két középső szám számtani közepét, ha az adatok száma páros.

Azaz: Ha n = 2k + 1, akkor a medián xk+1, ha n = 2k, akkor pedig xk és xk+1 számtani közepe. (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)

Pl: 1, 1, 2, 3, 46, 5007, 6015, 766748, 89879576 sokaság mediánja 46.

3.      Módusz

Def. : Egy számsokaság móduszának nevezzük a leggyakrabban előforduló adatot.

Pl: 1, 2, 2, 3, 3, 3, 3, 3, 3, 4, 55, 87 sokaság módusza 3.

Szóródási mértékek

Középértékek gyakran félrevezető információt adhatnak (ld: a második sokaságról nem sokat mond el a mediánja), a szóródási mértékek arról adnak információt, hogy az adatok hogyan helyezkednek el a középértékek körül.

1.      Maximum, minimum

Def.: Egy számsokaság maximumának (minimumának) nevezzük a számsokaság legnagyobb (legkisebb) elemét.

Azaz: xn (x1) (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)

2.      Terjedelem

Def.: Egy számsokaság terjedelmének nevezzük a számsokaság legnagyobb és legkisebb elemének a különbségét.

Azaz: xn - x1 (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)

3.      Átlagos abszolút eltérés, átlagos minimális eltérés

Def. : Egy számsokaság adott x valós számtól való átlagos abszolút eltérésének nevezzük azt az értéket, amelyet úgy kapunk, hogy a számhalmaz valamennyi értékének és x számnak a különbségének vesszük az abszolút értékét, majd ezeknek az értékeknek vesszük a számtani közepét.

Azaz:

 

Tétel: Az átlagos abszolút eltérés a mediántól a legkisebb, azaz . (x tetszőleges valós szám).

Bizonyítás:

1. Ha az adatok száma páratlan (n = 2k + 1):

Legyen x mediánnál (továbbiakban xk+1) e-nal kisebb! Ekkor  összegnek legfeljebb k darab tagja lesz e-nal kisebb és legalább

(k + 1) darab tagja lesz e-nal nagyobb a  összeg megfelelő tagjainál. Így a mediántól való átlagos abszolút

eltérés legalább -nel kisebb, mint az x-től való átlagos abszolút eltérés. Hasonlóan okoskodhatunk a mediánnál e-nal nagyobb x érték esetében. Tehát , ha .

2. Ha az adatok száma páros, akkor a bizonyítás hasonló, csak , ha  és  egyébként.

 

Def.: Az Sn(medián) számot a sokaság átlagos minimális eltérésének nevezzük.

4.      Átlagos négyzetes eltérés, szórásnégyzet, szórás

Def.: Egy számsokaság x valós számtól való átlagos négyzetes eltérésének nevezzük azt az értéket, amelyet úgy kapunk, hogy a számhalmaz valamennyi értékének és x-nek a különbségét négyzetre emeljük, a kapott értékeket összeadjuk, majd elosztjuk a számhalmaz elemeinek számával.

Azaz:

 

Bizonyítható, hogy az átlagos négyzetes eltérés a számtani középtől a legkisebb.

Def.: Az átlagtól való átlagos négyzetes eltérést a számsokaság szórásnégyzetének nevezzük.

Azaz:

 

Def.: A szórásnégyzet a négyzetgyökét a számsokaság szórásának nevezzük.

A valószínűségszámítás elemei

Def.: Egy kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük.

Def.: Az elemi események halmazát eseménytérnek nevezzük. Jele: Ω.

Műveletek eseményekkel

Def.: A és B esemény összege az az esemény, amely pontosan akkor következik be, ha A és B esemény közül legalább az egyik bekövetkezik.

Jelölés: A + B

Def.: A és B esemény szorzata az az esemény, amely pontosan akkor következik be, ha A és B események egyszerre következnek be.

Jelölés: AB

Def.: Ha A és B események egyszerre sohasem következnek be, akkor A és B eseményeket egymást kizáró eseményeknek nevezzük.

Def.: Egy A esemény komplementer eseményének nevezzük azt az eseményt, amely pontosan akkor következik be, amikor A nem.

Jelölés:

A valószínűség axiómái

1. axióma: Az adott Ω eseménytér minden eseményéhez tartozik egy p(A) szám, amelyet az A esemény valószínűségének nevezünk azt az értéket, és erre a számra teljesül, hogy .

2. axióma: A biztos esemény valószínűsége 1, azaz .

3. axióma: Egymást páronként kizáró események összegének valószínűsge, az egyes események valószínűségének összegével egyenlő, azaz , ha A1, A2, …, An egymást páronként kizáró események.

Tétel:

Bizonyítás: Egy esemény és a komplementere egymást kizáró események és az egyikük biztosan bekövetkezik, így  ((1) a 3. axióma, (2) a komplementer esemény definíciója, (3) pedig a 2. axióma miatt teljesül.) A fenti egyenletet rendezve kapjuk a tételt.

Tétel: p(A + B) = p(A) + p(B) - p(AB)

A feltételes valószínűség, események függetlensége

Def.: A esemény B-re vonatkozó feltételes valószínűsége: , ha p(B) > 0. (Ez annak a valószínűsége, hogy az A esemény bekövetkezik azon feltétel mellett, hogy B

esemény bekövetkezett.)

A feltételes valószínűség definíciójából adódik: . Kézenfekő hogy, ha A esemény független B-től, akkor p(A | B) = p(A). Ennek felhasználásával adódik a következő definíció:

Def.: Az A és B eseményeket függetlennek nevezünk, ha .

 

A valószínűségi változó

Def.: Ω véges eseménytér esetén valószínűségi változónak nevezzük azt a függvényt, amely Ω minden eleméhez egy valós számot rendel.

Jele: ξ

Def.: ξ valószínűségi változó lehetséges értékei x1, x2, … xn. Ezeket rendre p1, p2, … pn valószínűséggel veszi fel. Ekkor ξ várható értéke: M(ξ) = p1x1 + p2x2 + … + pnxn; ξ szórása:

A nagy számok törvénye

Def.: Ha egy kísérletet n-szer azonos körülmények között megismételve A esemény k-szor bekövetkezik, (n - k)-szor pedig nem, akkor k-t A esemény gyakoriságának nevezzük, -t pedig A esemény relatív gyakoriságának.

Jelölés: k(A) - A esemény gyakorisága

A kísérletek azt mutatják, hogy ha növeljük a kísérletek számát, akkor A esemény relatív gyakorisága tart egy meghatározott értékhez, A esemény valószínűségéhez. Ezt nevezzük a nagy számok tapasztalati törvényének.

Bernoulli tétele:  (n a független kísérletek száma, k(A) az A esemény gyakorisága, p(A) az A esemény bekövetkezésének valószínűsége, e

 

tetszőleges pozitív egész szám)

Alkalmazások

·         példák a leíró statisztika alkalmazásaira:

o       népszámlálás

o       a matematikai statisztikát segíti (pl: a társadalom egészét nem lehet felmérni, az adatok alapján igyekeznek megbecsülni a társadalom összetételét - közvéleménykutatások, választási előrejelzések)

·         példák a valószínűségszámítás alkalmazásaira:

o       mindennapi élet

o       szerencsejátékok

o       kockázatbecslés