BookPDF Available

UNIVERZITA KOMENSKÉHO V BRATISLAVE
Jakub Rajčáni
Pavol Kačmár
Jozef Bavoľár a kolektív
© Autori, 2024
Mgr. Jakub Rajáni, PhD.1 [7,21 AH]
Mgr. Pavol Kamár, PhD.2 [8,57 AH]
doc. Ing. Mgr. Jozef Bavoár, PhD.2 [4,26 AH]
Mgr. Lenka Vargová, PhD.3 [1,86 AH]
PhDr. et Mgr. Lucia Koišová, PhD.4 [1,39 AH]
doc. PaedDr. Vladimíra avojová, PhD.5 [0,67 AH]
doc. Mgr. Marcel Martonik, PhD.6, 7 [1,32 AH]
Mgr. Matúš Adamkovi, PhD.6, 7, 8 [1,17 AH]
1 Univerzita Komenského v Bratislave, Filozo cká fakulta, Katedra psychológie
2 Univerzita Pavla Jozefa Šafárika v Košiciach, Filozo cká fakulta, Katedra psychológie
3 Prešovská univerzita v Prešove, Pedagogická fakulta, Katedra predškolskej a elementárnej pedagogiky
a psychológie
4 Trnavská univerzita, Pedagogická fakulta, Katedra pedagogických štúdií
5 Trnavská univerzita, Filozo cká fakulta, Katedra psychológie
6 Slovenská akadémia vied, Centrum spoloenských a psychologických vied, v.v.i.
7 University of Jyväskylä, Faculty of Humanities and Social Sciences
8 Univerzita Karlova, Pedagogická fakulta
Recenzenti
prof. PhDr. Tomáš Sollár, PhD.
doc. Mgr. Stanislav Ježek, Ph.D.
Publikácia je šírená pod licenciou Creative Commons CC BY-NC-ND 4.0 (vyžaduje sa: povinnos
uvádza pôvodného autora, len nekomerné použitie, nezasahova do diela). Viac informácií
o licencii a použití diela: https://creativecommons.org/licenses/by-nc-nd/4.0/
https://stella.uniba.sk/texty/FIF_kol_statistika_reprodukovatelny_vyskum_spol_ved.pdf
Vydavate
Univerzita Komenského v Bratislave
ISBN 978-80-223-5707-4 (tlač)
ISBN 978-80-223-5708-1 (online)
Online verzia tejto uebnice vznikla ako výstup grantu Kega 079UK-4/2021 – Rozvoj výuby štatistických metód
a praktík otvorenej vedy v spoloenských vedách.
OBSAH
ÚVOD – AKO ÍTA TÚTO UEBNICU ............................................................................................................ 8
1 REPRODUKOVATEĽNOSŤ, DÁTA, ŠTATISTIKA [1] ......................................................................... 12
1.1 Replikovatenos a reprodukovatenos [1] ......................................................................................... 13
1.2 Replikaná kríza a jej dôsledky pre vedeckú štatistiku [1] ................................................................... 14
1.3 Dáta, meranie, premenná [1] ................................................................................................................. 19
1.3.1 Škála merania premennej [1] .................................................................................................... 20
1.3.2 Vytváranie dátových súborov [1] .............................................................................................. 22
1.3.3 Codebook [2] ............................................................................................................................ 25
1.3.4 Preo zdiea dátové súbory [1] ............................................................................................... 26
1.4 Softvér pre reprodukovatenú štatistiku [1] .......................................................................................... 27
1.4.1 Otvorenie súborov v softvéri JASP [1] .................................................................................... 28
1.4.2 Dátové súbory, analýzy a výsledky [1] .................................................................................... 29
2 ZÁKLADY ŠTATISTIKY – OPIS DÁT, PRAVDEPODOBNOSŤ [1] ................................................... 32
2.1 Opis s využitím ísel [1] ........................................................................................................................ 32
2.1.1 Frekvenné tabuky [1]............................................................................................................. 32
2.1.2 Miery centrálnej tendencie [1] .................................................................................................. 33
2.1.3 Miery variability [1] .................................................................................................................. 34
2.1.4 Miery centrálnej tendencie a variability v programe JASP [1] ................................................ 36
2.2 Gra cké zobrazenie dát a tvar rozdelenia [1] ........................................................................................ 37
2.2.1 Grafy pri kategorických premenných [1] ................................................................................. 37
2.2.2 Grafy pri kvantitatívnych premenných [1] ............................................................................... 37
2.2.3 Vytváranie grafov v programe JASP [1] .................................................................................. 39
2.3 Tvar rozdelenia, pravdepodobnos [1] .................................................................................................. 39
2.3.1 Šikmos a špicatos [1] ............................................................................................................. 39
2.3.2 Normálne rozdelenie [1] ........................................................................................................... 40
2.3.3 Štandardné skóre a výpoet pravdepodobnosti [2] .................................................................. 43
3 ODHADY PARAMETROV, INTERVALY SPOĽAHLIVOSTI [1 – 2] ................................................. 46
3.1 Ako si kladieme výskumné otázky? [1] ................................................................................................ 46
3.2 Populácia, vzorka [1] ............................................................................................................................. 47
3.3 Parametre a štatistiky [1] ....................................................................................................................... 48
3.3.1 Štandardná chyba priemeru [1]................................................................................................. 49
3.4 Intervaly spoahlivosti a odhad parametrov [2] .................................................................................... 51
3.4.1 Výpoet hraníc intervalu spoahlivosti [2] ............................................................................... 52
3.4.2 Výpoet intervalu spoahlivosti pre priemer v programe JASP [2] ........................................ 54
3.4.3 Výhody reportovania intervalov spoahlivosti [2] ................................................................... 54
3.4.4 Chybové úseky (error bars) a štatistická inferencia „od oka“ [2] .......................................... 54
4 ÚLOHA TESTOVANIA HYPOTÉZ V RÁMCI VEDECKÉHO UVAŽOVANIA [1] .......................... 58
4.1 Svet okolo nás a jeho pozorovanie [1] .................................................................................................. 58
4.2 Budovanie teórie a hypoteticko-deduktívny proces [1] ........................................................................ 43
4.3 Rozdielová a vzahová inferenná štatistika [2] ................................................................................... 66
5 VEĽKOSŤ EFEKTU [2] .............................................................................................................................. 74
5.1 Efekt a jeho vekos [2] ......................................................................................................................... 74
5.2 Neštandardizovaný vs. štandardizovaný efekt [2] ................................................................................ 75
5.3 Rôzne druhy využitia vekosti efektu [3] .............................................................................................. 80
5.4 Slovné oznaenia a interpretácia vekosti efektu [3] ............................................................................ 81
5.4.1 Porovnávací prístup [3] ............................................................................................................. 83
5.4.2 Praktický prístup [3] ................................................................................................................. 85
5.5 Na záver [3] ............................................................................................................................................ 87
6 TESTOVANIE NULOVEJ HYPOTÉZY Z FREKVENTISTICKEJ PERSPEKTÍVY [2] ................ 88
6.1 Testovanie nulovej hypotézy [2] ............................................................................................................ 88
6.1.1 Fisherov prístup [2] ................................................................................................................... 89
6.1.2 Prístup Neymana a Pearsona [3] ............................................................................................... 95
6.1.3 Dva typy chýb – chyba prvého a druhého typu [2] .................................................................. 99
6.1.4 Porovnanie rozdielov medzi dvoma prístupmi k NHST [3] .................................................... 106
6.2 Výhody NHST a zaužívané slovné oznaenia [2] ................................................................................ 108
6.3 Intervaly spoahlivosti a ich rola v rámci inferencie [2] ....................................................................... 108
6.4 Limity NHST, asté omyly a odporúania dobrej praxe [3] ................................................................. 109
7 TESTOVANIE NULOVEJ HYPOTÉZY Z BAYESIÁNSKEHO POHĽADU (NHBT) [3] ................ 114
7.1 Bayesiánsky prístup [3] ......................................................................................................................... 115
7.2 Bayesov faktor [3].................................................................................................................................. 119
7.3 Subjektívnos [4] ................................................................................................................................... 122
7.4 Výhody NHBT a zaužívané slovné oznaenia [3] ................................................................................ 125
7.5 Testovanie vs. odhad parametrov z bayesiánskej perspektívy [3] ........................................................ 127
7.6 Limity NHBT, asté omyly a odporúania dobrej praxe [3] ................................................................ 128
8 POROVNANIE DVOCH PRIEMEROV [2] ............................................................................................. 132
8.1 T-test pre jeden výber [2] ....................................................................................................................... 132
8.1.1 Studentov t-test [2] .................................................................................................................... 133
8.1.2 Rozdiel priemerov na základe intervalu spoahlivosti [2] ....................................................... 134
8.1.3 Použitie štandardizovanej vekosti efektu – Cohenovo d [2] .................................................. 135
8.1.4 Výpoet t-testu v JASP [2] ....................................................................................................... 136
8.1.5 Neparametrická alternatíva t-testu [2] ...................................................................................... 137
8.2 Párový t-test [2] ...................................................................................................................................... 139
8.2.1 Výpoet párového testu v JASP [2] .......................................................................................... 140
8.3 T-test pre nezávislé výbery (independent samples) [2] ......................................................................... 140
8.3.1 Studentov t-test pre nezávislé výbery [2] ................................................................................. 142
8.3.2 Nezávislý Welchov t-test [2] ..................................................................................................... 142
8.3.3 Nezávislý t-test v JASP [2] ....................................................................................................... 143
8.4 Testy ekvivalencie a testy minimálnych efektov [4] ............................................................................. 145
8.4.1 Najmenší zmysluplný efekt (SESOI) [4] ................................................................................. 145
8.4.2 Interpretácia testov ekvivalencie [4]......................................................................................... 147
8.4.3 Testy ekvivalencie pre porovnanie dvoch priemerov v JASP [4] ............................................ 147
8.5 Bayesiánsky t-test [3] ............................................................................................................................. 149
8.5.1 Bayesiánsky párový test [3] ...................................................................................................... 149
8.5.2 Bayesiánsky t-test pre dva nezávislé výbery [3] ...................................................................... 150
9 VZŤAHY MEDZI PREMENNÝMI [2] ..................................................................................................... 152
9.1 Vzah dvoch kvantitatívnych premenných ilustrovaný v grafe [1] ...................................................... 152
9.2 Výpoet kovariancie a korelaného koe cientu [2] .............................................................................. 153
9.2.1 Testovanie korelaných hypotéz [2] ......................................................................................... 155
9.2.2 Výpoet korelácií v JASP [2] ................................................................................................... 155
9.2.3 Predpoklady testov korelaných hypotéz a neparametrické analýzy [2] ................................. 157
9.3 o nám korelácie hovoria a o nám nehovoria? [2] ............................................................................. 158
9.4 Koe cient determinácie a parciálne korelácie [3] ................................................................................. 160
9.5 Bayesiánske korelácie v JASP [3] ......................................................................................................... 161
10 LINEÁRNA REGRESIA [2] ........................................................................................................................ 164
10.1 Princíp lineárnej regresie [2] ................................................................................................................. 164
10.2 Posúdenie lineárnej regresie [3] ............................................................................................................ 169
10.3 Predpoklady lineárnej regresie [3] ......................................................................................................... 172
10.4 Lineárna regresia v JASP [3] ................................................................................................................. 173
10.5 Bayesiánska lineárna regresia v JASP [4] ............................................................................................. 176
11 ANALÝZA ROZPTYLU (ANOVA) [2] ...................................................................................................... 180
11.1 Preo nemožno porovna viac skupín prostredníctvom t-testov [2] .................................................... 180
11.2 Princíp analýzy rozptylu (ANOVA) [2] ................................................................................................ 182
11.2.1 Vekos efektu [2] ..................................................................................................................... 185
11.3 Medziskupinové porovnania [3] ............................................................................................................ 185
11.4 Predpoklady analýzy rozptylu [2] ......................................................................................................... 187
11.5 ANOVA v JASP [2] ............................................................................................................................... 188
11.6 Bayesiánska ANOVA [4] ....................................................................................................................... 189
11.7 Neparametrická alternatíva analýzy rozptylu pre nezávislé výbery – Kruskalov-Wallisov test [3] .... 192
11.7.1 Kruskalov-Wallisov test v JASP [3] ......................................................................................... 194
12 TESTOVANIE HYPOTÉZ O FREKVENCIÁCH [2] ............................................................................. 196
12.1 Rozdelenie jednej premennej [2] ........................................................................................................... 196
12.1.1 Test jednej proporcie [2] ........................................................................................................... 196
12.1.2 Test dobrej zhody [2] ................................................................................................................ 198
12.2 Rozdiely medzi nezávislými výbermi [2] ............................................................................................. 200
12.2.1 Chí-kvadrátový test nezávislosti [2] ......................................................................................... 201
12.2.2 Vzťah kategorických premenných [3] ...................................................................................... 203
12.2.3 Testovanie vzťahu pri tabuľke s väčším počtom kategórií [3] ................................................ 204
12.2.4 Výpočet v JASP [2] .................................................................................................................. 205
12.2.5 Bayesiánska alternatíva chí-kvadrátového testu v JASP [3] .................................................... 206
12.3 Opakované merania [3] .......................................................................................................................... 207
13 ŠTATISTICKÁ SILA A VEĽKOSŤ VZORKY [3] ................................................................................... 210
13.1 Rôzne prístupy k odhadu potrebnej veľkosti výskumného súboru [3] ................................................. 210
13.2 Rôzne metódy odhadu veľkosti výskumného súboru [3] ..................................................................... 213
13.3 Odhad veľkosti výskumného súboru pre potreby NHST [3] ................................................................ 214
13.3.1 Na základe čoho si zvoliť želanú veľkosť efektu? [3] ............................................................. 217
13.3.2 Zápis odhadu veľkosti výskumného súboru [3] ....................................................................... 220
13.3.3 Sumarizácia toho, na čo pri odhade veľkosti myslieť [3] ........................................................ 221
13.4 Odhad veľkosti výskumného súboru z bayesiánskej perspektívy [4] .................................................. 224
14 STUPNE VOĽNOSTI VÝSKUMNÍKA/VÝSKUMNÍČKY A ANALÝZA SENZITIVITY [2] .......... 226
14.1 Čo ak...? [2] ............................................................................................................................................ 226
14.1.1 Viacero operacionalizácií premennej [3] .................................................................................. 227
14.1.2 Chýbajúce dáta [3] .................................................................................................................... 227
14.1.3 Nedbanlivé odpovede [3] .......................................................................................................... 228
14.1.4 Transformácie premenných [3]................................................................................................. 228
14.1.5 Nízka reliabilita nástroja [3] ..................................................................................................... 229
14.1.6 Narušené predpoklady výpočtu [3] .......................................................................................... 229
14.2 Príklad analýzy senzitivity [3] ............................................................................................................... 230
14.3 Problematické výskumné praktiky [2] .................................................................................................. 232
14.4 Záver [2] ................................................................................................................................................. 235
15 AKO VON Z REPLIKAČNEJ KRÍZY: REGISTROVANÉ SPRÁVY A PREDREGISTRÁCIA [3] 236
15.1 Registrovaná správa (Registered Report) [3] ........................................................................................ 237
15.1.1 Rozdiel medzi RR a tradičným empirickým článkom [3] ....................................................... 238
15.1.2 Aké sú výhody RR? Čo nové, lepšie prináša RR? [3] ............................................................. 239
15.2 Návod, ako pripraviť rukopis pre RR [4] .............................................................................................. 243
15.2.1 Úvod a teoretické východiská (Introduction) [4] ..................................................................... 243
15.2.2 Hypotézy [4] ............................................................................................................................. 245
15.2.3 Metódy [4] ................................................................................................................................. 246
15.2.4 Analýza dát [4] .......................................................................................................................... 248
15.3 Záver [3] ................................................................................................................................................. 250
16 ZDIEĽANIE A VÝPOČTOVÁ REPRODUKOVATEĽNOSŤ [2] .......................................................... 252
16.1 Analytický skript [3] .............................................................................................................................. 252
16.2 Zdieanie dát, materiálov a analytického skriptu [2] ............................................................................ 254
16.2.1 FAIR princípy zdieania [2]...................................................................................................... 255
16.2.2 Ako zdiea materiály [3] ......................................................................................................... 255
16.2.3 Etický aspekt zdieania dát a materiálov [3] ............................................................................ 256
16.3 Zdieanie prostredníctvom OSF (Open Science Framework) [2] ........................................................ 257
16.3.1 Nový projekt v OSF [2] ............................................................................................................ 258
16.3.2 Pridávanie obsahu do projektu v OSF [2] ................................................................................ 260
16.3.3 Zmena v OSF projekte [2] ........................................................................................................ 261
16.4 Tipy na záver [2] .................................................................................................................................... 262
17 ODHADY RELIABILITY MERANIA [3] ................................................................................................. 264
17.1 Spôsoby odhadu reliability merania [3] ................................................................................................ 264
17.2 Situácia opakovaných meraní [3] .......................................................................................................... 265
17.3 Situácia opakovaných meraní s rôznymi formami merania [3] ............................................................ 266
17.4 Situácia jedného merania [3] ................................................................................................................. 266
17.5 Situácia s viacerými posudzovatemi [4] .............................................................................................. 269
REFERENCIE ....................................................................................................................................................... 273
REGISTER ............................................................................................................................................................. 287
AUTORKY A AUTORI .......................................................................................................................................... 291
8
ÚVOD – AKO ČÍTAŤ TÚTO UČEBNICU
Vysokoškolská uebnica Štatistika pre reprodu-
kovatený výskum v spoloenských vedách sa ve-
nuje základom štatistiky, ktoré sú náplou kurzov
na bakalárskom a magisterskom stupni v študijnom
programe psychológia. Je však urená aj študent-
kám a študentom iných odborov, ktorí prichádzajú
do kontaktu so štatistickou analýzou dát. Hlav-
ným cieom uebnice je teda poskytnú pevné zá-
klady pre jednotlivé štatistické metódy, od základ-
ného opisu dát cez teóriu pravdepodobnosti a tes-
tovanie hypotéz až po praktické ukážky testov pre
rôzne typy výskumov.
Táto publikácia vznikla spoloným úsilím udí,
ktorých spojil záujem o reprodukovatenos a otvo-
renú vedu. Aj preto sa sústredí práve na témy re-
produkovatenosti a otvorenosti vo vede, ktoré
sa snažíme vnáša do štatistických kurzov hne
od zaiatku. Zárove však ide o témy, ktoré môžu
by nové a obohacujúce aj pre udí, ktorí sa výsku-
mu venujú dlhšie a základy štatistickej analýzy dát
poznajú. Sústredením sa na tému reprodukovate-
nosti a tiež jej zalenením do základných štatistic-
kých kurzov reagujeme na replikanú krízu, ktorá
v posledných dekádach dominuje vedeckej debate
v mnohých vedných disciplínach (Baker, 2016),
vrátane psychológie. Nízka miera replikovatenos-
ti, teda schopnosti opätovne dospie k rovnakým
výsledkom, priamo súvisí s postupmi využitými
pri štatistickej analýze i plánovaní výskumu.
Napriek tomu, že tieto témy sú už roky diskuto-
vané, informovanos o reprodukovatených postu-
poch v štatistickej analýze dát medzi výskumní-
kami a výskumníkmi v spoloenských vedách
na Slovensku je stále pomerne limitovaná. Chý-
bajúce informácie, ako aj alšie identi kované
bariéry, napr. obavy výskumníok a výskumníkov,
alebo nedostatoné incentívy (Rajáni et al., 2023)
snahu o zvyšovanie reprodukovatenosti sažu-
jú. Reprodukovatenos je tak výzvou pre vý-
ubu štatistiky a vedeckých predmetov na vyso-
kých školách. Ak dokážeme do výuby zaleni
témy reprodukovatenosti už od zaiatku a poda
ich jednoduchým a zaujímavým spôsobom, máme
šancu v nasledujúcich rokoch situáciu zlepšova.
Vyuovanie štatistiky v spoloenskovedných
odboroch prináša aj alšie výzvy. Študentky
a študenti asto prežívajú z kurzov štatistiky oba-
vy. Vnímajú ich ako nároné, príliš matematické,
i vyvolávajúce úzkos a neistotu (Onwuegbuzie,
2004; Trassi et al., 2022). Ako vyuujúci štatistic-
kých kurzov sa s podobnými bariérami stretávame
pravidelne. V našich kurzoch sa teda usilujeme
o to, aby štatistika nebola ažká a demotivujú-
ca. Študentkám a študentom sa snažíme ukáza,
že znalos štatistiky umožuje hlbšie porozumie
výskumom a tiež o nich tvorivo uvažova. Štatisti-
ka zárove môže by aj hravá a zábavná, ako uka-
zujú niektoré kurzy a svetové uebnice (napr. Field,
2018; 2022), i texty o štatistike urené aj mlad-
ším itatekám a itateom (Wagenmakers, 2020).
V tejto publikácii je teda naším cieom priblíži
sa k týmto trendom a vysvetli štatistické koncepty
jednoduchým a dostupným spôsobom.
Na ítanie tejto uebnice nie je nevyhnutná
predchádzajúca znalos štatistickej analýzy dát.
V publikácii sa sústredíme najmä na teóriu a štatis-
tické testy, ktoré považujeme za najpoužívanejšie,
a teda aj najdôležitejšie. V záujme zjednodušenia
a rozvíjania štatistickej gramotnosti namiesto ma-
nuálnych výpotov sme mnohé témy zostrunili
a zjednodušili. Na druhej strane sme sa rozhodli
klasickú štatistiku obohati aj o vysvetlenie zákla-
dov bayesiánskej štatistiky, na ktoré nadväzujeme
aj pri jednotlivých testoch. Výklad štatistických
konceptov zárove dopame návodmi na vý-
poty v štatistickom softvéri JASP. JASP je vo-
ne dostupný štatistický softvér, ktorý si možno
bezplatne stiahnu z webu https://jasp-stats.org/.