Týmto článkom by som si dovolil upozorniť na novú etapu, ktorá bude omnoho zaujímavejšia avšak bude vyžadovať aj sériu povedzme viac teoretických poznatkov, na ktorých by sme mohli stavať empirické znalosti. Práve preto som opustil série článkov o Exceli a prenášam tvorbu na nový blog.
Náhodná veličina
Ak sa zamyslíte nad životom, pochopíte, že existujú len dva typy javov, poprípade procesov. Deterministické a stochastické.
Ako deterministický jav by sme mohli považovať vodu, ktorá za vopred splnených podmienok (fyzikálne prostredie, varná kanvica) pri teplote 100 stupňov Celzia zovrie. Ňou si zalievate každé ráno kávu (čaj) a spomínate na nádherný včerajšok, alebo si hovoríte aký deň bude ten dnešný!
Stochastických javov je vo svete omnoho viac! Predstavte si situáciu, keď zbadáte pôvabnú slečnu a chcete sa zoznámiť. Neexistuje záruka, že pri splnení predpokladov (vhodný okamih, pekný outfit, nenásilný úsmev, vhodné slová …) sa s ňou skutočne dohodnete a skončíte trebárs niekde na večeri. Taktiež vám nikto nedá záruku, že ak vyštudujete VŠE alebo IES, tak budete úspešný človek, ktorý bude zarábať 60 000 Kč mesačne hneď po škole! Život skutočne pozostáva z momentov, ktoré viac menej pripomínajú ruletu v kasíne a vy často hráte vabank!
Avšak sú situácie, v ktorých rýdze intuitívne myslenie nemusí byť bezvýhradne to pravé orechové. V takýchto prípadoch môžeme využiť poznatky z minulosti a kvantifikovať možné následky konania. Práve preto potrebujeme dobre poznať náhodné javy, aby sme nemali problém analyzovať náhodné veličiny.
Náhodnou veličinou môžeme definovať napríklad počet predaných telefónnych paušálov zo všetkých produktov, ktorými disponuje Call centrum, pričom náhodný proces je predaj cez telefón. Možno sa vám to zdá tak trocha neopodstatnené, ale pre inštitúcie ako poisťovne a banky sú práve predpovede ekonomického kapitálu a dodržiavanie istých bezpečnostných opatrení alfou-omegou.
Dáta
V štatistike principiálne ide o čo najlepší popis náhodnej veličiny. V tomto prípade nám neostáva nič iné ako vychádzať z relevantných dát. Dáta a ich kvalita sú tou najdôležitejšou a súčasne najdrahšou záležitosťou. Predstavte si farmaceutickú spoločnosť, ktorá vytvorila nový liek a chce ho uviesť na trh. V tomto prípade ich produkt musí podstúpiť množstvo testov (efektivita a vedľajšie účinky), než si ho kúpite v lekárni. Taktiež samozrejme firma musí prejsť z testovania na krysách do štádia testovania na ľuďoch, čo nie je vôbec lacná záležitosť. Ak vezmeme v úvahu lacnejší scenár, predstavme si, že test lieku na pacientovi stojí cca. 300€ na deň. Tým pádom sa daná cifra dĺžkou liečby zvyšuje a taktiež minimálne množstvo ľudí, ktorí vytvárajú výberový súbor vplýva na rozpočet testovania. Preto sa kladie dôraz na optimalizáciu výberového súboru a tiež na správny výber štatistiky.
V konečnom dôsledku môžeme veličinu charakterizovať na základe výberového súboru. Tieto charakteristiky odhadujeme a to exaktne (Bodový odhad) alebo intervalovo (Intervalový odhad). Veľké množstvo ľudí kladie dôraz na hodnoty odhadovaných parametrov, no profesionálni analytici sa obávajú hlavne kvality odhadu. Takže v štatistike sa nevyhneme aj testovaniu kvality jednotlivých odhadov. K čomu by vám bol rozbor krvi, ak by ste vedeli že bol robený amatérom na 30 rokov starom zariadení? Boli by ste neoblomne presvedčení, že výsledná zvýšená hladina cholesterolu v krvi je fakt pravdivá? Tým pádom máte možnosť pouvažovať nad hodnotou určitých informácii a HLAVNE sa zamyslite nad jednotlivými článkami, kde sa autori pokúšajú niečo odhadovať a predpovedať. Používajú/nepoužívajú dostatočne kvalitné dáta? Sú oboznámení s nedostatkami jednotlivých analytických procesov natoľko aby mohli veštiť z krištáľovej gule? Akým spôsobom máme prihliadať na jednotlivé články a informácie o budúcich vývojoch?
V ďalšom článku budeme mať k dispozícii dáta a ukážeme si logiku jednotlivých charakteristík náhodných veličín.
Žiadne komentáre:
Zverejnenie komentára