piatok 12. októbra 2012

Testovanie hypotéz

 

Po dlhodobom vysvetľovaní pravdepodobnostných rozdelení by nebolo na škodu definovať, kde v praxi sa tieto poznatky dajú využiť.

To je hlavný dôvod, prečo som začal písať o testovaní hypotéz! V praxi sa určite stretnete s otázkami typu:

Ako to bude vyzerať v budúcnosti? Čo môžeme očakávať? S čím máme počítať? …

Keďže nikto z nás nevlastní magickú guľu, ktorá nám ukáže budúcnosť, neostáva nám nič iné ako spoliehať sa na predpoklady, teda odhadovať! V tejto situácii si musíme vystačiť s tým čo máme: poznatkami z minulosti!

Dôvod? – Na základe minulosti dokážeme kvantifikovať kľúčové premenné, definujúce náš problém a zároveň určiť vzťah medzi nimi!

Ako ilustráciu by som uviedol plantážnika, ktorý spracúva kokaín. My vieme, že jeho plantáž má isté kapacity a výstup - úrodu! Na základe pozorovania dokážeme popísať výrobné možnosti plantáže!

Potom nastane situácia, že ho kontaktuje veľkoodberateľ a chce s ním dohodnúť kontrakt na isté množstvo kíl za určitú časovú jednotku (200 Kg mesačne) a cenu.

Otázka znie, či spracovateľ si môže dovoliť uzavrieť takýto obchod, resp. čo by urobil veľkoodberateľ ak by za svoje peniaze nedostal to čo chce??? Reklamoval by to? Sťažoval sa na Zväze ochrany spotrebiteľov? V tomto štádiu si každý môžete predstaviť vlastný scenár, no zhodneme sa, že by sme sa nechceli ocitnúť v takej situácii!

Týmto som chcel demonštrovať fakt, že testovanie hypotéz sa využíva všade – aj v zmienenom priemysle by malo opodstatnenie ak by niekto ovládal štatistiku Úsmev

Ako delíme hypotézy?

Parametrické testy vyšetrujú jednotlivé parametre rozdelenia (stredná hodnota – očakávané množstvo vyprodukovaného kokaínu; rozptyl – volatilita jeho produkcie apod..)

Neparametrické testy trápi problematika tvaru rozdelenia, závislosti premenných a iné.

Čo potrebujeme sformulovať?

1) musíme si nadefinovať predpoklad nulovú hypotézu H0 (očakávaná mesačná dodávka kokaínu je 100 Kg)

2) potrebujeme si položiť otázku typu: čo ak…? teda alternatívnu hypotézu H1

- Tá môže byť ľavostranná ( <80 kg ) ; pravostranná ( >120kg ) ; dvojstranná ( sa nerovná 100 kg )

Ako to funguje?

Celý test je o jednej jedinej záležitosti: potvrdiť/nepotvrdiť nulovú hypotézu na stanovenom intervale spoľahlivosti.

Ak si spomeniete na Normálne rozdelenie – viď článok, pamätáte sa na fakt že:

Normálne rozdelenie a obecne ak sa jedná o pravdepodobnostné rozdelenie – nemá uzavretý definičný obor. ( Koľkokrát padne na kocke číslo 6? My sme si empiricky overili, že to je 4-krát ale tá 6-tka nám môže padnúť aj 12x za sebou..aj 30x až….teoreticky to je možné aj keď prakticky s tým málokto počíta! ).

Práve to je dôvod, keď tvrdenie nemôžeme s istotou deklarovať ( vyprodukujeme 100 kg ), no môžeme ho podporiť istou mierou spoľahlivosti!

image

Tento obrázok porovnáva výsledok štatistického testu a skutočnosti. Pojem miera spoľahlivosti z predchádzajúcej vety je:

pravdepodobnosť, “istota alebo šanca” že náš test pravdivo potvrdí nulovú hypotézu, teda predpoklad.

Sila testu je niečo obdobné, akurát ňou ilustrujeme správne vyvrátenie nulovej hypotézy – potvrdenie alternatívnej

Ostatné možnosti sú chyby našej analýzy hypotéz. V praxi sa snažíme dospieť k vyváženému pomeru sily testu a miere spoľahlivosti. Obecne sa určuje miera spoľahlivosti 0,95 alebo 0,99.

Všeobecne sa označuje:

1) miera spoľahlivosti: 1-α

2) Sila testu 1-β

3) Chyba I. druhu: α (taktiež nazývame hladina významnosti)

4) Chyba II. druhu: β

Nabudúce si ukážeme niektoré vzorové príklady testovania hypotéz a možno použijem aj iný software ako Excel. Takže máte sa načo tešiť!