8. tétel
Adatsokaságok jellemzői, a valószínűségszámítás elemei.
Adatsokaságok jellemzői
Számsokaságnak nevezzük az olyan statisztikai adathalmazt, amelyben az adatok számok. (Ez nem valódi halmaz, mivel egyes elemek többször is szerepelhetnek benne.) Az ilyen számsokaságot statisztikai mutatókkal tudjuk jellemezni. A statisztikai mutatók két nagy csoportja a középértékek és a szórások.
Középértékek
1. Átlag (= számtani közép)
Def. :Egy számsokaság számtani közepe úgy kapható meg, hogy az adatokat összeadjuk, és az összeget elosztjuk az adatok számával.
Azaz:
(x1,
x2, …, xn a számsokaság elemei)
Pl: 1, 3, 6, 7, 8, 9, 15 sokaság számtani közepe 7.
Ha x1, x2, …, xn rendre
k1, k2, …, kn-szer
szerepelnek a sokaságban, akkor egyszerűbb a súlyozott átlaggal számolni:
2. Medián
Def. : Egy számsokaság mediánjának nevezzük a nagyság szerint rendezett adatok közül a középsőt, ha az adatok száma páratlan, vagy a két középső szám számtani közepét, ha az adatok száma páros.
Azaz: Ha n = 2k + 1, akkor a medián xk+1, ha n = 2k, akkor pedig xk és xk+1 számtani közepe. (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)
Pl: 1, 1, 2, 3, 46, 5007, 6015, 766748, 89879576 sokaság mediánja 46.
3. Módusz
Def. : Egy számsokaság móduszának nevezzük a leggyakrabban előforduló adatot.
Pl: 1, 2, 2, 3, 3, 3, 3, 3, 3, 4, 55, 87 sokaság módusza 3.
Szóródási mértékek
Középértékek gyakran félrevezető információt adhatnak (ld: a második sokaságról nem sokat mond el a mediánja), a szóródási mértékek arról adnak információt, hogy az adatok hogyan helyezkednek el a középértékek körül.
1. Maximum, minimum
Def.: Egy számsokaság maximumának (minimumának) nevezzük a számsokaság legnagyobb (legkisebb) elemét.
Azaz: xn (x1) (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)
2. Terjedelem
Def.: Egy számsokaság terjedelmének nevezzük a számsokaság legnagyobb és legkisebb elemének a különbségét.
Azaz: xn - x1 (x1, x2, …, xn a számsokaság elemei nagyság szerint rendezve)
3. Átlagos abszolút eltérés, átlagos minimális eltérés
Def. : Egy számsokaság adott x valós számtól való átlagos abszolút eltérésének nevezzük azt az értéket, amelyet úgy kapunk, hogy a számhalmaz valamennyi értékének és x számnak a különbségének vesszük az abszolút értékét, majd ezeknek az értékeknek vesszük a számtani közepét.
Azaz:
Tétel: Az átlagos abszolút
eltérés a mediántól a legkisebb, azaz
.
(x tetszőleges valós szám).
Bizonyítás:
1. Ha az adatok száma páratlan (n = 2k + 1):
Legyen x mediánnál
(továbbiakban xk+1)
e-nal kisebb! Ekkor
összegnek
legfeljebb k darab tagja lesz e-nal
kisebb és legalább
(k + 1) darab tagja lesz
e-nal nagyobb a
összeg
megfelelő tagjainál. Így a mediántól való átlagos abszolút
eltérés legalább
-nel
kisebb, mint az x-től való átlagos abszolút eltérés. Hasonlóan
okoskodhatunk a mediánnál e-nal
nagyobb x érték esetében. Tehát
,
ha
.
2. Ha az adatok száma páros,
akkor a bizonyítás hasonló, csak ,
ha
és
egyébként.
Def.: Az Sn(medián) számot a sokaság átlagos minimális eltérésének nevezzük.
4. Átlagos négyzetes eltérés, szórásnégyzet, szórás
Def.: Egy számsokaság x valós számtól való átlagos négyzetes eltérésének nevezzük azt az értéket, amelyet úgy kapunk, hogy a számhalmaz valamennyi értékének és x-nek a különbségét négyzetre emeljük, a kapott értékeket összeadjuk, majd elosztjuk a számhalmaz elemeinek számával.
Azaz:
Bizonyítható, hogy az átlagos négyzetes eltérés a számtani középtől a legkisebb.
Def.: Az átlagtól való átlagos négyzetes eltérést a számsokaság szórásnégyzetének nevezzük.
Azaz:
Def.: A szórásnégyzet a négyzetgyökét a számsokaság szórásának nevezzük.
A valószínűségszámítás elemei
Def.: Egy kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük.
Def.: Az elemi események halmazát eseménytérnek nevezzük. Jele: Ω.
Műveletek eseményekkel
Def.: A és B esemény összege az az esemény, amely pontosan akkor következik be, ha A és B esemény közül legalább az egyik bekövetkezik.
Jelölés: A + B
Def.: A és B esemény szorzata az az esemény, amely pontosan akkor következik be, ha A és B események egyszerre következnek be.
Jelölés: AB
Def.: Ha A és B események egyszerre sohasem következnek be, akkor A és B eseményeket egymást kizáró eseményeknek nevezzük.
Def.: Egy A esemény komplementer eseményének nevezzük azt az eseményt, amely pontosan akkor következik be, amikor A nem.
Jelölés:
A valószínűség axiómái
1. axióma: Az adott Ω eseménytér minden eseményéhez
tartozik egy p(A) szám, amelyet az A esemény
valószínűségének nevezünk azt az értéket, és erre a számra teljesül, hogy
.
2. axióma: A biztos esemény valószínűsége 1, azaz
.
3. axióma: Egymást páronként
kizáró események összegének valószínűsge, az egyes események valószínűségének
összegével egyenlő, azaz ,
ha A1, A2, …, An egymást
páronként kizáró események.
Tétel:
Bizonyítás: Egy esemény
és a komplementere egymást kizáró események és az egyikük biztosan bekövetkezik,
így ((1)
a 3. axióma, (2) a komplementer esemény definíciója, (3) pedig a 2. axióma miatt
teljesül.) A fenti egyenletet rendezve kapjuk a tételt.
Tétel: p(A + B) = p(A) + p(B) - p(AB)
A feltételes valószínűség, események függetlensége
Def.: A esemény B-re vonatkozó
feltételes valószínűsége: ,
ha p(B) > 0. (Ez annak a valószínűsége, hogy az A esemény
bekövetkezik azon feltétel mellett, hogy B
esemény bekövetkezett.)
A feltételes valószínűség definíciójából adódik:
.
Kézenfekő hogy, ha A esemény független B-től, akkor p(A
| B) = p(A). Ennek felhasználásával adódik a következő definíció:
Def.: Az A és B eseményeket
függetlennek nevezünk, ha .
A valószínűségi változó
Def.: Ω véges eseménytér esetén valószínűségi változónak nevezzük azt a függvényt, amely Ω minden eleméhez egy valós számot rendel.
Jele: ξ
Def.: ξ valószínűségi változó lehetséges értékei x1, x2, … xn. Ezeket rendre p1, p2, … pn valószínűséggel veszi fel. Ekkor ξ várható értéke: M(ξ) = p1x1 + p2x2 + … + pnxn; ξ szórása:
A nagy számok törvénye
Def.: Ha egy kísérletet n-szer azonos körülmények
között megismételve A esemény k-szor bekövetkezik, (n -
k)-szor pedig nem, akkor k-t A esemény gyakoriságának
nevezzük, -t
pedig A esemény relatív gyakoriságának.
Jelölés: k(A) - A esemény gyakorisága
A kísérletek azt mutatják, hogy ha növeljük a kísérletek számát, akkor A esemény relatív gyakorisága tart egy meghatározott értékhez, A esemény valószínűségéhez. Ezt nevezzük a nagy számok tapasztalati törvényének.
Bernoulli tétele:
(n
a független kísérletek száma, k(A) az A esemény
gyakorisága, p(A) az A esemény bekövetkezésének
valószínűsége, e
tetszőleges pozitív egész szám)
Alkalmazások
· példák a leíró statisztika alkalmazásaira:
o népszámlálás
o a matematikai statisztikát segíti (pl: a társadalom egészét nem lehet felmérni, az adatok alapján igyekeznek megbecsülni a társadalom összetételét - közvéleménykutatások, választási előrejelzések)
· példák a valószínűségszámítás alkalmazásaira:
o mindennapi élet
o szerencsejátékok
o kockázatbecslés