nedeľa 23. septembra 2012

Normálne rozdelenie - 2. diel

 
Praktické využitie normálneho rozdelenia vyžaduje poznatok viacrozmerného modelu. Ak by sme mali riešiť chyby  objemu náplne alkoholu do fliaš, je logické, že potrebujeme brať v úvahu nielen čas plnenia, ale aj tlak trysky a iné náhodné faktory.
Otázka viac rozmernosti rozdelenia náhodných veličín je na mieste aj u iných rozdelení, nie len u normálneho. Avšak my si neskôr ukážeme, že niektoré rozdelenia (nie je ich málo) sa za splnenia istých podmienok nahradzujú normálnym!
To je jeden z hlavných dôvodov, prečo chcem normálne rozdelenie rozpísať do viacerých dielov!
Začnime teda modelom viacrozmerného rozdelenia, ktorý je podobný modelu jednorozmerného. Povedzme, že sa budeme hrať s vektormi stredných hodnôt, konkrétnych hodnôt veličín a nezaobídeme sa bez kovariančnej matice a jej determinantu.
1) Vektor hodnôt náhodných veličín a stredných hodnôt náhodných veličín (s-rozmerný vektor)
image
2) Kovariančná matica:
image
Ktorá má na diagonále rozptyly jednotlivých veličín a mimo diagonálu kovariančné koeficienty. Z toho vyplýva, že bude pozitívne definitná. Jej determinant označíme takto:

image
Takto pripravené hodnoty použijeme v nasledujúcom rozdelení:
image
My si ukážeme, ako zostrojiť takúto funkciu povedzme pre tri náhodné imageveličiny. Na začiatok si prosím stiahnite sample file a môžeme začať.
V liste INPUT máme k dispozícii v čase usporiadané hodnoty náhodných veličín.  Tieto veličiny môžu byť napríklad tlak, konzistencia tekutiny, čas procesu a iné. My potrebujeme definovať vzťahy medzi týmito veličinami.
Začneme charakteristikou polohy, ktorú definujeme priemerom, použijeme nasledujúcu funkciu:
=AVERAGE(Oblasť hodnôt náhodnej veličiny)
Ďalej potrebujeme určiť rozptyl jednotlivých veličín:
=VARA(Oblasť hodnôt náhodnej veličiny)
Stretávame sa tu s pojmom kovariančný koeficient, tento pojem bližšie budem opisovať pri regresnej analýze, nám bude pre túto časť stačiť vzorec:
=COVARIANCE.S(Oblasť hodnôt náhodnej veličiny A;Oblasť hodnôt náhodnej veličiny B)
Takto vytvorené údaje môžeme zoskupiť do vektora stredných hodnôt a kovariančnej matice a nesmieme zabudnúť na determinant matice:
=MDETERM(Oblasť matice)
Výsledok môže vyzerať taktoimage:
Teraz nám stačí nadefinovať rozumnú škálu konkrétnych hodnôt náhodných veličín (viď list OUTPUT). Z nich vytvoríme diferencie so strednými hodnotami a vypočítame separátne pravdepodobnosti:
=(1/((POWER(2*PI();1,5)*SQRT(INPUT!$F$28))))*EXP(1)^(-0,5*MMULT(MMULT(D2:F2;INPUT!$F$23:$H$25);TRANSPOSE(D2:F2)))
POZNÁMKA: pri súčine matíc je veľmi dôležité poznať metodiku počtu riadkov/stĺpcov. Taktiež ak násobíte matice, vektory alebo kombináciu matíc a vektorov, MUSÍTE použiť kombináciu klávesníc Ctrl + Shift + Enter. V opačnom prípade sa vám vyskytne chyba typu: #VALUE!
Výsledné pravdepodobnosti pre konkrétne hodnoty veličín X1, X2 a X3 sa dajú prakticky považovať za nulové. Dôvod? Uvažujeme spojité rozdelenie, t.z. že každá jednotlivá izolovaná hodnota(y) ako výsledok pokusu prakticky neprichádza v úvahu (nedokážete naliať do nádrže presne 1,00000… liter benzínu). Avšak, ak sčítame tieto skoro nulové pravdepodobnosti pre jednotlivé hodnoty a tento súčet budeme uvažovať ako pravdepodobnosť, že výsledok pokusu sa bude nachádzať v našom intervale, vtedy táto práca má zmysel!
Spojité rozdelenie má zmysel využívať pri analýze pravdepodobností, že sa výsledok bude nachádzať v intervale!
Nabudúce sa budeme zaoberať kovariančným a korelačným koeficientom ako vsuvkou pre praktickú ukážku 2-rozmerného normálneho rozdelenia.

1 komentár: