Detail předmětu

Statistická analýza dat

CESA-SPSTAk. rok: 2020/2021

Předmět je věnován statistické analýze dat, včetně jejich teoretických (základní principy statistických odhadů a testů) a praktických aspektů (plánování experimentů, provádění jednovýběrových a dvouvýběrových testů, korelační a regresní analýzy, analýzy rozptylu). Teoretické znalosti se průběžně uplatňuji v rámci řešení praktických příkladů s pomocí běžně používaných softwarových nástrojů. Kurz připravuje posluchače k samostatnému využití statistických metod pro analýzu dat ve vlastní vědecké či rutinní práci.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Posluchač získá základní znalosti a dovednosti z oblasti statistické analýzy dat. Bude schopen je aplikovat v praxi při plánování studií, výběru vhodných statistických metod a interpretaci jejich výsledků.
Písemnou zkouškou se ověřuje, že absolvent předmětu je schopen:
- vysvětlit základní pojmy v oblasti statistické analýzy dat a jejich vztahy, popsat základní metody v této oblasti,
- vybrat a použít vhodné nástroje pro daný problém z této oblasti, interpretovat dosažené výsledky,
- graficky prezentovat statistická data, navrhnout studii zahrnující sběr a následnou analýzu dat.

Prerekvizity

Jsou požadovány znalosti na úrovni středoškolského studia matematiky, práce s PC, základy práce s MS Excel a Matlab.

Plánované vzdělávací činnosti a výukové metody

Metody vyučování zahrnují přednášky a cvičení na počítači. Předmět využívá e-learning. Student absolvuje dvě písemky.

Způsob a kritéria hodnocení

Podmínky pro úspěšné ukončení předmětu upřesňuje každoročně aktualizovaná vyhláška garanta předmětu;
 až 30 bodů za řešení zadaných úkolů v praktickém cvičení (pro postup ke zkoušce je nutný zisk minimálně 15 bodů)
 až 70 bodů za písemnou zkoušku (z písemné zkoušky je nutné získat minimálně 35 bodů)
Závěrečná zkouška je orientována na pochopení problematiky statistické analýzy dat a jejich aplikací.

Osnovy výuky

Předmět je věnován statistické analýze dat, včetně jejich teoretických (základní principy statistických odhadů a testů) a praktických aspektů (plánování experimentů, provádění jednovýběrových a dvouvýběrových testů, korelační a regresní analýzy, analýzy rozptylu). Teoretické znalosti se průběžně uplatňuji v rámci řešení praktických příkladů s pomocí běžně používaných softwarových nástrojů. Kurz připravuje posluchače k samostatnému využití statistických metod pro analýzu dat ve vlastní vědecké či rutinní práci.

1. Úvod do statistiky. Typy statistických úloh (odhady parametrů, testování hypotéz, predikce, klasifikace)
2. Statistika a pravděpodobnost. Bayesův teorém. Sensitivita, specificita, prediktivní hodnoty. ROC křivka
3. Spojitá, ordinální a nominální data. Základní a výběrový soubor. Popisné charakteristiky souboru. Grafická reprezentace dat. Identifikace odlehlých hodnot
4. Náhodná veličina. Rozložení diskrétních a spojitých náhodných veličin. Kontrola typu rozdělení pravděpodobnosti. Normální rozdělení pravděpodobnosti. Transformace náhodné veličiny a její význam pro zpracování dat
5. Odhady charakteristik náhodných veličin. Centrální limitní věta, interval spolehlivosti odhadu a jeho interpretace. Úvod do testování hypotéz. P-hodnota a její interpretace. Chyba I. a II. druhu, sila testu, velikost výběru
6. Jednovýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
7. Dvouvýběrové testy. Párová a nepárová data. Parametrické a neparametrické metody
8. Vícevýběrové testy I. Analýza rozptylu (ANOVA). Cíle a předpoklady. Zobecnění
9. Vícevýběrové testy II. Párová a nepárová data. Parametrické a neparametrické metody
10. Analýza binárních a ordinálních dat. Kontingenční tabulka. Jednovýběrový binomický test. Vícevýběrové testy: Fisherův exaktní test a Chi-kvadrát test pro nepárová data; McNemarův test pro párová data
11. Korelační analýza. Parametrická a pořadová korelace (kovariance, korelační koeficienty, koeficienty podobnosti). Korelační a kovarianční matice
12. Regresní analýza. Lineární regrese. Metoda nejmenších čtverců pro odhad koeficientů regresních koeficientů. Analýza reziduí regresních modelů
13. Úvod do plánování experimentů. Plánování velikosti souboru. Randomizační techniky. Zaslepení studie. Přehled experimentálních plánů

Učební cíle

Cílem předmětu je poskytnout studentům znalosti ke sběru dat a prezentovat základní metody statistické analýzy dat, včetně jejich výpočetní podstaty, předpokladů a možnosti aplikace při řešení reálných úloh z oblasti biologických a sportovních věd.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Vymezení kontrolované výuky a způsob jejího provádění stanoví každoročně aktualizovaná vyhláška garanta předmětu (viz Rozvrhové jednotky).
V zásadě:
- povinné počítačové cvičení (zmeškaná laboratorní cvičení musí být řádně omluvená a lze je nahradit po domluvě s vyučujícím)
- nepovinná přednáška

Základní literatura

MELOUN, M., MILITKÝ, J.: Statistická analýza experimentálních dat. Academia, Praha 2004, ISBN 80-200-1254-0. (CS)
BAŠTINEC, J., FAJMON, B., KOLÁČEK, J.: Pravděpodobnost, statistika a operační výzkum. Skripta VUT, Brno 2014. (CS)

Doporučená literatura

BUDÍKOVÁ, M., KRÁLOVÁ, M., MAROŠ, B.: Průvodce základními statistickými metodami. Grada Publishing, Praha 2010, ISBN 978-80-247-3243-5. (CS)
McDONALD, J.H.: Handbook of biological statistics. 3rd ed. Sparky House Publishing, Baltimore, Maryland 2015. (CS)

Zařazení předmětu ve studijních plánech

  • Program BPC-STC bakalářský, 3. ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Cvičení s počítačovou podporou

26 hod., povinná

Vyučující / Lektor

Ostatní aktivity

13 hod., nepovinná

Vyučující / Lektor