Képzeljünk el egy valószínűségi kísérletet, aminek lehetséges eredményei alkotják a véges U eseményteret. Az A1, A2, ..., An események (U részhalmazai) alkossanak teljes eseményrendszert. X valószínűségi változó rendelje az eseményekhez rendre x1, x2, ..., xn valós számokat. Az egyes események bekövetkezésének valószínűségét az alábbi módon jelöljük:
Visszafelé olvasva: pi annak a valószínűsége, hogy X valószínűségi változó xi értéket veszi fel, magyarul a hozzá tartozó Ai esemény következik be. A valószínűségekre teljesül, hogy összegük 1.
A fenti pi értékeket együtt az X valószínűségi változó eloszlásának nevezzük. Az eloszlásokat oszlop- vagy vonaldiagrammal ábrázoljuk. Ekkor jól látható az értékek egymáshoz viszonyított értéke. A (*)-gal jelölt eloszlásoknál látunk rá konkrét példákat.
A valószínűségi változó M(X) várható értékének és D2(X) szórásnégyzetének nevezzük a következő kifejezéseket:

Az alábbiakban megpróbálom elmagyarázni ezeket a fogalmakat és jelentésüket. A várható értéket és szórást (a szórásnégyzet négyzetgyökét) az egyszerűség kedvéért M-mel és D-vel, nem pedig M(X)-szel és D(X)-szel fogom jelölni, bár természetesen mindketten X-től függnek.
Folytassuk le többször a valószínűségi kísérletet. (Feltesszük, hogy a kísérletek egymástól függetlenül történnek.) A várható érték "köznyelven" azt jelenti, hogy a kísérletek eredményei valahol e körül az érték körül szóródnak, azaz "várhatóan" a kísérlet eredménye M lesz. Ez az érték általában valahol a legnagyobb valószínűségű eseményhez rendelt xi körül keresendő - ha van, de nem mindig.
A jobb megértés érdekében ábrázoljuk a kísérleteket és a bekövetkező eseményeket (a hozzájuk rendelt xi értékeket) egy derékszögű koordinátarendszerben, ahol a vízszintes tengelyen a kísérletek sorszámai szerepelnek, a függőleges tengelyen pedig maguk az események (a hozzájuk rendelt xi-k). Ekkor a pontokra ránézve általában azt láthatjuk, hogy azok egy érték körül sűrűsödnek. No ez lesz M. Úgy szoktuk jelölni, hogy húzunk M magasságban egy vízszintes vonalat. Így a pontok tulajdonképpen ezt a vonalat "ugrálják körül". Persze a "körülugrálásból" nem lehet matematikai definíciót alkotni, hiszen valaki egy picit lejjebb, más egy picit feljebb gondolná M-t.

A várható érték azonban önmagában nem jelent sokat. Ugyanis az "ugráló" pontok lehetnek sűrűn a vonal körül, illetve eshetnek ritkábban, attól távolabb is. Ezért fontos mérnünk, hogy a pontok nagyjából milyen távol vannak M-től. Erre alkalmas a szórás: ez a valószínűségi változó (X) várható értéktől (M) vett eltéréseinek (X-M) várható értékét adja meg (pontosabban négyzeteik: (X-M)2 várható értékének négyzetgyökét M0,5((X-M)2) ). Logikus, ugye? Az ábrát nézve: azt próbáljuk megsaccolni a szórással, hogy a pontok "várhatóan" milyen messze esnek a vonaltól, azaz M-től. Tulajdonképpen azt mondhatjuk, hogy a kísérletet elvégezve az eredményt nagy valószínűséggel valahol az (M-D, M+D) sávban kell keresnünk. (Azért számítunk négyzetet, majd az eredményből gyököt, mert egyrészt minket a távolság érdekel előjel nélkül - azaz a kivonásnál mindegy, melyik a nagyobb: X vagy M -, másrészt így az eltéréseket kicsit "széthúzzuk": a kicsiket még kisebbé tesszük, a nagyokat pedig felnagyítjuk. Ennek akkor van igazán értelme, ha standardizáljuk X-t.)
Így már mérhetjük a várható érték információtartalmát: ha kicsi a szórás, akkor a várható érték jól jellemzi a valószínűségi kísérletünk eredményét. Ha a szórás nagy, akkor a várható érték kevesebbet mond a kísérlet kimeneteléről.
Lássunk egy "életszerű" példát a fentiekre!
Példa.
Bújjunk egy irodaház üzemeltetőjének bőrébe és foglalkozzunk a világítás kérdésével. Az irodaház helységeit azonos típusú takarékos neoncsövekkel szerelték fel nemrég. A csövekről ismert, hogy az első évben 0,03, a második évben 0,2, a harmadikban 0,67 és a negyedikben 0,1 valószínűséggel hibásodnak meg. (A negyedik évben biztosan tönkre mennek.) Hogyan gazdálkodjunk a pénzünkkel, mikor válik esedékessé a neoncsövek cseréje?
Megoldás.
A valószínűségi kísérlet, hogy megfigyelünk egy neont és felírjuk, hányadik évben romlott el. Így a valószínűségi változó lehetséges értékei: X = 1, 2, 3, 4, a hozzájuk tartozó valószínűségek pedig P(X=1)=0,03; P(X=2)=0,2; P(X=3)=0,67; P(X=4)=0,1. Ránézésre nyilván azt várjuk, hogy a neonok valahol a harmadik év környékén fognak nagy számban tönkremenni. Azonban egyáltalán nem mindegy, hogy pontosan mikor, illetve nyilván nem mind egyszerre adja meg magát. Van egy tól-ig határ, amin belül a neonok túlnyomó többsége elromlik. (Az sem mellékes, hogy ez egy hosszabban elnyúló folyamat, vagy néhány hónapon belül játszódik le!)
A számítások:
Ebből a szórás kb. 0,628. Azaz eredményeink szerint a neoncsövek "várhatóan" a (2,84-0,628; 2,84+0,628) = (2,212; 3,468) intervallumban mondják fel a szolgálatot. Tehát ha január elsején készült el az új világítás, akkor többségük a második év márciusa és a harmadik év júniusa között fog tönkremenni: akkorra kell bekalkulálni a költségvetésbe a neoncseréket.
A továbbiakban összegyűjtöttem néhány nevezetes diszkrét eloszlást. Ezek tulajdonképpen "problémacsaládok", amiket az eloszlás azonossága - azaz a valószínűség kiszámítására alkalmazandó azonos formula - kapcsol össze. Így ha egyszer levezetjük a valószínűségekből az eloszláshoz tartozó várható értéket és a szórást, azt nem kell újra és újra meghatározni, csak számolni. A feladatok leegyszerűsödnek a "szortírozásra": ez a probléma ilyen eloszlásra vezet, az a probléma olyanra. A nehézséget leginkább az okozza, hogyan ismerjük fel a különböző feladatokban, mikor melyiket kell alkalmaznunk.
Kaposvár, 2005. január
T.Cs.