ArticlePDF Available

Prestatieveranderingen bij individuele sporters. Monitoring met spreadsheet en praktisch toepasbare statistiek

Authors:

Abstract and Figures

Veel trainers en (fysio)therapeuten testen hun sporters en patiënten regelmatig om hun fitheid en hun vooruitgang (of achteruitgang) ten opzichte van een vorige meting te monitoren. In dit artikel zal besproken worden hoe een spreadsheet met praktisch toepasbare statistiek hiervoor gebruikt kanworden.
Content may be subject to copyright.
28 Sportgericht nr. 4 / 2017 – jaargang 71
In de sport- en revalidatiepraktijk
worden regelmatig testen afgenomen
waarmee onder meer bepaald kan
worden of een sporter fit genoeg is
voor de training en of hij vooruit of
achteruit is gegaan als gevolg van trai-
ning of een specifieke interventie. Zo
laten sommige trainers hun sporters
regelmatig een bounce drop jump uit-
voeren om de reactive strenght index (ra-
tio tussen grondcontacttijd en sprong-
hoogte) te bepalen. Op basis van de
testscore, eventueel in combinatie met
resultaten uit andere objectieve en sub-
jectieve metingen, wordt bepaald of de
sporter fit genoeg is voor de geplande
training(en). Sommige fysiotherapeu-
ten gebruiken regelmatig een repetition
maximum (RM) test om de vooruitgang
van een patiënt in de revalidatie te mo-
nitoren. Naast deze voorbeelden zijn
er nog talloze manieren waarop testen
in de sportpraktijk toegepast worden.
Echte verandering?
Bij het interpreteren van testresulta-
ten is het echter vaak onduidelijk of
de veranderingen ten opzichte van
de voorgaande meting (en de metin-
gen daarvoor) komen door een ‘echte’
verbetering of achteruitgang van de
sporter of patiënt, of door de typische
variatie die een individu laat zien bij
het herhalen van een test. Is een toe-
name in spronghoogte van 40 naar 42
cm als gevolg van twee weken trainen
bijvoorbeeld een ‘echte’ verandering,
of is het een meetfout (typische vari-
atie)? En als het een ‘echte’ verande-
ring is, is deze dan ook groot genoeg
om praktisch relevant te zijn?
Om deze vragen te beantwoorden
moet er rekening worden gehouden
met de typische meetfout en de kleinste
relevante verandering. In dit artikel zal
worden toegelicht hoe een nieuwe
spreadsheet gebruikt kan worden
om de vooruitgang van individuele
sporters en patiënten te monitoren
met gebruik van praktisch toepasbare
statistiek. Deze methode is in 2009
ook al door Smit1 toegelicht (dit arti-
kel is te downloaden op de Sportge-
richt website – tabblad Archief, red.),
maar toen was er nog geen specifieke
spreadsheet beschikbaar. Daarnaast is
de methode sindsdien ook enigszins
aangepast en zijn er enkele nieuwe
functies aan de spreadsheet toege-
voegd.2
Veel trainers en (fysio)therapeuten testen hun sporters en
patiënten regelmatig om hun fitheid en hun vooruitgang (of
achteruitgang) ten opzichte van een vorige meting te monito-
ren. In dit artikel zal besproken worden hoe een spreadsheet
met praktisch toepasbare statistiek hiervoor gebruikt kan
worden.
Prestatieveranderingen bij individuele
sporters Monitoring met spreadsheet en
praktisch toepasbare statistiek
SPORTWETENSCHAP
Bas Van Hooren
LET OP
Bij oudere versies van Microsoft Excel
(2007 en eerder) werken sommige func-
ties van de spreadsheet die in dit artikel
wordt toegelicht niet. Daardoor kan de
spreadsheet niet
gebruikt worden.
Het is dus ver-
standig om eerst na te gaan over welke
versie u beschikt alvorens gegevens te
gaan invoeren.
Sportgericht nr. 4 / 2017 – jaargang 71 29
De spreadsheet
De spreadsheet heet ‘Linear trend and
changes in an individual’s measure-
ments’, is ontwikkeld door de Nieuw-
Zeelandse statistiekprofessor Will
Hopkins en is te vinden onder het kopje
‘Spreadsheets’ rechtsboven op de web-
site sportsci.org (via de link ‘Assessing
an individual’). Op deze website is ver-
der ook nog een Engelstalige toelichting
bij de spreadsheet te lezen.2
De spreadsheet kan gebruikt worden
om drie zaken te monitoren:
1. verandering ten opzichte van de
vorige test;
2. afwijking van één test of het ge-
middelde van meerdere testen ten
opzichte van een trendlijn;
3. de grootte van de trend.
Door het monitoren van veranderin-
gen ten opzichte van de vorige test
kan worden bepaald of een sporter
echt vooruit of achteruit is gegaan ten
opzichte van de vorige keer dat de test
is afgenomen, rekening houdend met
de typische meetfout en de kleinste re-
levante verandering. Met deze functie
kan een fysiotherapeut bijvoorbeeld
bepalen of een patiënt echt vooruit is
gegaan op een 5RM test.
Door afwijkingen van één test of het
gemiddelde van meerdere testen ten
opzichte van een trendlijn te monito-
ren kan worden bepaald of een sporter
beter of slechter presteert dan gemid-
deld. Een ondergemiddelde prestatie
kan er bijvoorbeeld op duiden dat de
sporter vermoeid is. Op basis hiervan
kan de intensiteit en/of duur van de
training eventueel worden aangepast.
Met dezelfde toepassing kunnen ook
de effecten van een specifieke inter-
ventie in een praktijksetting onder-
zocht worden, mits er genoeg resul-
taten van een sporter bekend zijn. Zo
kan bijvoorbeeld bekeken worden wat
de invloed is van cafeïne innemen of
een nacht slecht slapen op de testre-
sultaten. Hierbij moet uiteraard wel
in gedachten worden gehouden dat er
meerdere factoren zijn die het testre-
sultaat kunnen beïnvloeden.
Tot slot kan de spreadsheet ook ge-
bruikt worden om de progressie van
meetbare doelen bij te houden met
een lineaire trendlijn. Zo kan bijge-
houden worden of een sporter sneller
of langzamer progressie maakt dan
bedoeld. Een trainer kan op basis hier-
van besluiten dat er bijvoorbeeld meer
getraind moet worden op de specifieke
vaardigheid, of juist minder, waardoor
er meer tijd over blijft om andere as-
pecten te trainen.
Bij al deze toepassingen is het belang-
rijk dat de testen die gebruikt worden
valide zijn en uitgevoerd worden met
een zo gestandaardiseerd mogelijk
protocol, om de betrouwbaarheid te
vergroten.
Hoe gebruik ik de spreadsheet?
De spreadsheet is gebaseerd op de
statistiek methode Magnitude-based
Inference (MBI) (zie een eerder in
Sportgericht verschenen artikel – even-
eens te downloaden via de website,
red. – voor toelichting3) en werkt in
grofweg zes stappen. Eerst moeten de
volgende gegevens handmatig worden
ingevoerd:
1. resultaten van verschillende testmo-
menten (figuur 1);
2. een waarde voor de typische meet-
fout (figuur 2);
3. een waarde voor de kleinste rele-
vante verandering (figuur 2).
Vervolgens berekent de spreadsheet
automatisch:
4. een lineaire trendlijn tussen de ver-
schillende datapunten (figuur 3);
5. de waarschijnlijkheid in percentages
dat de verandering substantieel gro-
ter, gelijk, of kleiner is dan voorspeld
door de lineaire trendlijn of in ver-
gelijking met het vorige testresultaat
(figuur 1);
6. de grootte van de trend en de waar-
schijnlijkheid in percentages dat er
een snellere toename, gelijke toe-
name of langzamere toename is ten
opzichte van de trendlijn (figuur 4).
Stap 1 – Invoer testgegevens
In rij 47 (zie figuur 1) kan bij ‘Time’
de datum of een cijfer van het test-
moment ingegeven worden. In rij 48
worden de testresultaten ingevoerd.
Voor het voorbeeld in dit artikel zul-
len hier resultaten van sprongtesten
worden gebruikt. Als er tijdens één
Figuur 1. Screenshot van een gedeelte van de spreadsheet met de rijen voor data invoer (47-49 en 54) en de rijen met de resultaten van de statistische
analyses (50-53 en 55-62).
30 Sportgericht nr. 4 / 2017 – jaargang 71
meting meerdere (sprong)testen wor-
den uitgevoerd kan hier het beste de
gemiddelde score worden ingevoerd,
omdat dit de beste schatting geeft van
de ‘echte’ score en omdat deze het
meest sensitief is voor het monitoren
van vermoeidheid of supercompen-
satie.4 Mogelijk geldt dit ook voor
andere testen.
In rij 49 kan aangegeven worden welke
testresultaten meegenomen moeten
worden bij de berekening van de
lineaire trendlijn (zie toelichting later
in het artikel). Een 1 betekent dat de
meting meegenomen wordt, bij een 0
wordt de meting niet meegenomen.
Als er een duidelijk non-lineair ver-
band is tussen testscores (bijvoorbeeld
bij een leereffect of door een foute me-
ting) is het aan te raden om de betref-
fende testscore(s) niet mee te nemen in
de berekening van de trendlijn. Of een
meting duidelijk afwijkt van de andere
metingen kan visueel bepaald worden
op basis van de trendlijn (zie figuur 3).
Bij het testen van meerdere sporters of
het gebruik van verschillende testen
voor dezelfde sporter moet er steeds
een nieuw tabblad worden gebruikt.
Op tabblad 1 komt bijvoorbeeld spor-
ter A, op tabblad 2 sporter B, enzo-
voorts. Bij het gebruik van meerdere
testen voor dezelfde sporter komt de
testscore voor de sprinttest bijvoor-
beeld op tabblad 1, de testscore van de
sprongtest op tabblad 2, et cetera.
Stap 2 – Invoer typische meet-
fout
In rij 38 (zie figuur 2) kan een waarde
ingevoerd worden voor de ‘typical
error’, ook wel bekend als de within-
subject standard deviation. In dit artikel
zal hiernaar verwezen worden als de
‘typische meetfout’. In rij 39 kan deze
typische meetfout als een percentage
ingevoerd worden. Het invoeren van
de typisch meetfout als een percentage
(en niet als een absoluut getal) heeft
over het algemeen de voorkeur, zeker
als deze afkomstig is van wetenschap-
pelijk onderzoek waarin de deelne-
mers van een ander prestatieniveau
waren dan de sporter die nu gemo-
nitord wordt. De typische meetfout
geeft informatie over de variatie die
een sporter laat zien bij het herhalen
van een test onder dezelfde omstan-
digheden, zonder dat er sprake is van
een ‘echte’ (stabiele) vooruitgang of
achteruitgang. Het is de optelsom van
biologische (mentale en fysieke) vari-
atie in de sporter zelf en technische
variatie als gevolg van de gebruikte
testapparatuur.5 Voorbeelden van
methodes om de typische meetfout te
bepalen zijn een sporter die met een
tussenpauze van vijf minuten twee
keer een verticale sprong uitvoert of
bij wie binnen twee dagen twee keer
huidplooimetingen ter bepaling van
het vetpercentage worden gedaan. Bin-
nen vijf minuten of twee dagen zullen
er op beide metingen geen substantiële
veranderingen plaatsvinden, dus ie-
dere verandering in de resultaten van
de meting zal een meetfout zijn. Om
te kunnen spreken van een echte ver-
andering in het testresultaat moet de
verandering ongeveer 1,5-2 keer groter
zijn dan de typische meetfout.5
Een ‘echte’ verandering is niet per
definitie ook praktisch relevant. Bij een
heel kleine typische meetfout kan een
echte verandering namelijk nog steeds
zo klein zijn, dat die in de praktijk
waarschijnlijk geen effect heeft op de
sportprestatie, de gezondheid of het
blessurerisico. Hoewel de typische
meetfout zelf kan worden berekend
(voor toelichtingen zie Hopkins5 en
Taylor et al.6), kan deze ook komen uit
wetenschappelijk onderzoek waarin
de betrouwbaarheid van de test on-
der gecontroleerde omstandigheden
is onderzocht bij een vergelijkbare
groep sporters. Ideaal gezien wordt de
typische meetfout echter bepaald per
individuele sporter6 en onderzocht
over een periode van meerdere dagen
(between-session reliability) en niet door
het afnemen van meerdere testen bin-
nen één dag (within-session reliability).
Over een langere periode kan men im-
mers een grotere variatie verwachten
en deze typische variatie over meer-
dere dagen is representatiever voor het
monitoren van prestaties over meer-
dere dagen. Verder blijkt uit recent
onderzoek dat de typische meetfout
verschilt per trainingsfase.6 Indien
mogelijk is het belangrijk om ook hier
rekening mee te houden.
In tabel 1 zijn de typische meetfouten
met de bijbehorende degrees of freedom
(DoF) weergeven voor enkele veel-
gebruikte fysieke testen. De typische
meetfout en kleinste relevante veran-
dering van de counter movement jump
zijn gebruikt voor het voorbeeld in dit
artikel. De ‘degrees of freedom’ in rij
40 van de spreadsheet wordt berekend
op basis van twee getallen uit de be-
trouwbaarheidsstudie, namelijk 1) het
aantal deelnemers aan de studie minus
1 en 2) het aantal testscores per deelne-
mer. Als er bijvoorbeeld drie testen zijn
afgenomen bij negen deelnemers is het
aantal degrees of freedom 3 x (9-1) = 24.
Als er geen typische meetfout en geen
degrees of freedom worden ingevoerd,
gebruikt de spreadsheet automatisch
de typische meetfout die wordt ge-
Figuur 2. Screenshot van een
gedeelte van de spreadsheet met
de rijen voor het invoeren van de
typische meetfout (38-40), de
kleinste relevante verandering
(41-42) en kleinste relevante
trend (43-45).
Sportgericht nr. 4 / 2017 – jaargang 71 31
schat op basis van de lineaire trendlijn.
Over het algemeen overschat deze
methode de typische meetfout echter,
waardoor het moeilijker wordt om
duidelijke resultaten te krijgen uit de
statistische analyse.2 Verder moeten er
minimaal 10 testresultaten zijn voordat
de spreadsheet een redelijke voorspel-
ling kan doen van de typische meet-
fout. Het invoeren van een typische
meetfout heeft daarom de voorkeur.
Stap 3 – Invoer kleinste
relevante verandering
In rij 41 en 42 (zie figuur 2) kan een
waarde of percentage voor de ‘smallest
important change’, ofwel de ‘kleinste
relevante verandering’ worden inge-
voerd. Voor deze spreadsheet moet dit
een positieve waarde zijn.11 De klein-
ste relevante verandering representeert
de minimale verandering in het testre-
sultaat die nodig is om in de praktijk
een relevant effect op de sportprestatie,
de gezondheid of het blessurerisico te
hebben. Er zijn verschillende manieren
om deze kleinste relevante verande-
ring te bepalen. Deze verschillen tus-
sen sporters waarbij de verandering
in de testscore direct iets zegt over de
sportprestatie (bijvoorbeeld een veran-
dering in de 100m sprintprestatie voor
een 100m sprinter of de geworpen af-
stand voor een speerwerper) en spor-
ters waarbij een verandering in de test-
score indirecte informatie geeft over
de sportprestatie (bijvoorbeeld een
sprinttest voor een voetballer of een
sprongtest voor een 100m sprinter). Bij
topsporters waarvoor de verandering
direct iets zegt over de sportprestatie
is de kleinste relevante verandering 0,3
keer de typische variatie. In de meeste
situaties zal een verandering in de test-
score echter een indirect verband heb-
ben met de sportprestatie. De meest
praktische oplossing is in dit geval om
een gestandaardiseerd effect te gebrui-
ken. Dit kan berekend worden door de
between-subject standaarddeviatie van
de groep sporters waartoe het individu
behoort te vermenigvuldigen met 0,2.
Als een groep voetballers bijvoorbeeld
gemiddeld 3,21 seconden doet over
een 20m sprinttest, met een standaard
deviatie van 0,17 seconden, dan is de
kleinste relevante verandering op deze
test 0,2*0,17= 0,034 seconden. Met
andere woorden: een voetballer moet
minimaal 0,034 seconden vooruit gaan
op de test voordat dit een mogelijk
relevant effect heeft.
In tabel 1 zijn de kleinste relevante ver-
anderingen voor verschillende groe-
pen en testen beschreven. Een uitge-
breidere uitleg over het bepalen van de
kleinste relevante verandering is terug
te vinden in het al eerder genoemde
Sportgericht artikel3 uit 2015.
Als de typische meetfout kleiner is
dan de kleinste relevante verandering,
dan is de mogelijkheid van de test om
een echte verandering te meten goed.
Iedere hogere of lagere score is in dit
geval namelijk zeer waarschijnlijk een
echte en mogelijk ook nog relevante
verandering. Als de typische meet-
fout echter groter is dan de kleinste
relevante verandering, dan zullen
sommige relevante veranderingen als
meetfout gekenmerkt worden. Er moet
in dit geval een test met een kleinere
meetfout gezocht worden, of de test
moet meerdere keren herhaald wor-
den, waarbij de resultaten gemiddeld
worden om de meetfout te verminde-
ren.2,12 In de spreadsheet is daarom
ook een optie om het gemiddelde van
een aantal metingen te vergelijken met
de trendlijn (figuur 1). In rij 54 kan
door het invoeren van een ‘1’ aangege-
ven worden welke metingen gebruikt
moeten worden om het gemiddelde te
berekenen.
Naast de kleinste relevante verande-
ring op de korte termijn kan in rij 43 en
44 (figuur 2) ook aangegeven worden
welke verandering in de trendlijn
relevant is gedurende een specifieke
periode. Stel dat een trainer van een
jeugdteam bijvoorbeeld als doelstel-
ling heeft dat een van zijn sporters
Tabel 1. Typische meetfout en kleinste relevante verandering voor enkele veelgebruikte testen.
32 Sportgericht nr. 4 / 2017 – jaargang 71
over 20 weken 2 cm vooruit is gegaan
in spronghoogte, zodat hij voldoet aan
het selectiecriterium voor de natio-
nale selectie. De spreadsheet kan dan
berekenen hoe waarschijnlijk het is dat
deze sporter een snellere toename, ge-
lijke toename of langzamere toename
heeft ten opzichte van de trendlijn (zie
verderop in dit artikel) door de helling
van de regressielijn en de onzekerheid
hierin te vergelijken met de doelstel-
ling.2 De trainer kan op basis van deze
resultaten besluiten dat er bijvoorbeeld
meer op de specifieke vaardigheid
getraind moet worden om de doelstel-
ling te behalen, of dat minder ook vol-
doende is, waardoor er meer tijd over
blijft om andere aspecten te trainen.
De periode kan aangegeven worden in
rij 45 en moet overeenkomen met de
periode waarin de testresultaten inge-
voerd worden (bijvoorbeeld dagelijks,
wekelijks, maandelijks). In figuur 2 is
de kleinste relevante verandering dus
2 cm per 20 weken.
Stap 4 – Automatische bereke-
ning lineaire trendlijn
Op basis van alle gegevens die bij de
vorige stappen zijn ingevoerd wordt
automatisch een lineaire trendlijn gefit
tussen de testscores (figuur 3). Deze
trendlijn kan gebruikt worden om de
eerste en laatste testscore te interprete-
ren (zie figuur 1 en de toelichting
later in dit artikel) en om te kijken
of de sporter op schema ligt voor
de ten doel gestelde vooruitgang.
Het aantal testresultaten dat no-
dig is om een redelijk nauwkeu-
rige schatting van de trendlijn te
krijgen hangt af van de typische
meetfout en de kleinste relevante
verandering.11
Stap 5 en 6 – Interpreteren
van de resultaten
De rijen 50-53 en 55-62 (zie
figuur 1) geven de resultaten van
de statistische analyse over de
testscores, namelijk de waar-
schijnlijkheid (in percentages)
dat de verandering (rijen 50-52) of het
gemiddelde van meerdere metingen
(rijen 55-58) substantieel groter, gelijk
of kleiner is dan voorspeld door de
lineaire trendlijn of in vergelijking met
de vorige testscore (rijen 59-62). In de
rijen 52, 58 en 62 wordt de praktische
interpretatie van deze waarschijnlijk-
heden gegeven. Er zijn hier verschil-
lende interpretaties mogelijk:
1. veranderingen waarbij
de kans op een vooruit-
gang en achteruitgang
groter is dan 10% zijn
‘onduidelijk’ en wor-
den weergeven met het
vraagteken (?);
2. veranderingen waarbij
de kans op een vooruit-
gang of achteruitgang groter is dan
10% worden als ‘mogelijk’ geïnter-
preteerd en door een pijltje aange-
geven: ↔↑ voor mogelijk groter en
↔↓voor mogelijk kleiner;
3. veranderingen waarbij de kans op
een triviale of substantiële verande-
ring groter is dan 90% worden als
‘zeer waarschijnlijk’ geïnterpreteerd
en krijgen één asterisk (*) in combi-
natie met een pijl die aangeeft of de
score hoger of lager is (bijvoorbeeld
* voor zeer waarschijnlijk hoger).
Zo kan in rij 58 bijvoorbeeld afgelezen
worden dat het gemiddelde van de
vier metingen zeer waarschijnlijk sub-
stantieel groter is in vergelijking met
de trendlijn. Als dit samenvalt met een
specifieke interventie is het zeer waar-
schijnlijk dat deze een positief effect
heeft gehad.
De spreadsheet voert ook nog een
statistische analyse uit over de lineaire
trendlijn om te kijken of de geobser-
veerde trend substantieel groter of
kleiner is dan een kleinste relevante
verandering over de periode (figuur 4).
De geobserveerde trend in figuur 4
is een toename van 0,21 units (in dit
geval cm) per tijdseenheid (in dit geval
week). De kleinste relevante veran-
dering per week was eerder gezet op
2,0 cm per 20 weken, dus 0,1 cm per
week (figuur 3). De waarschijnlijkhe-
den op een snellere toename, gelijke
toename of langzamere toename ten
opzichte van de trendlijn zijn weer-
geven in de rijen 65-67. De praktische
interpretatie van deze analyse is weer-
geven in rij 68. De mogelijke interpre-
taties zijn hetzelfde als bij de verande-
ringen van test tot test als er wel een
Figuur 3. Lineaire trendlijn gefit op (fictieve)
spronghoogte testresultaten gedurende 20
weken. De bolletjes representeren de testre-
sultaten en de bijbehorende verticale lijnen de
typische meetfout. De dikke rechte lijn tussen
de datapunten is de lineaire trendlijn en de
gestippelde lijnen erboven en eronder zijn de
grenzen van de kleinste relevante verandering,
gecombineerd met de typische meetfout van de
voorspelde waarde. Een testscore die buiten de
gestippelde lijnen valt wijkt waarschijnlijk (> 75%
kans) substantieel af van de trend.2 Met andere
woorden: een testscore die buiten deze lijnen valt,
duidt meestal op een duidelijke vooruitgang of
achteruitgang.
Figuur 4. Statistische analyse over de lineaire
trendlijn.
Sportgericht nr. 4 / 2017 – jaargang 71 33
typische meetfout is ingegeven. In dit
geval is er dus zeer waarschijnlijk een
snellere toename in vergelijking met
de doelstelling.
Conclusie
Voor trainers en (fysio)therapeuten is
het doorgaans moeilijk om te bepalen
of een verandering in een testscore ver-
oorzaakt wordt door een echte vooruit-
gang of achteruitgang in de sporter, of
door biologische of technische variatie.
Daarnaast is het ook vaak onduidelijk
wanneer een verandering een relevant
effect heeft op het blessurerisico, de
sportprestatie of de gezondheid. De
spreadsheet die in dit artikel is toege-
licht kan helpen bij het bepalen van
echte en (mogelijk) relevante verande-
ringen in de prestatie door statistische
analyse van de testscores. Omdat deze
spreadsheet pas zeer recent is ontwik-
keld, is het overigens mogelijk dat er
in de loop van de tijd nog kleine din-
gen zullen worden aangepast.
In de toekomst wordt dit monitoren
wellicht gedaan met machine learning
wanneer er genoeg testgegevens be-
schikbaar zijn om neural networks te
trainen. Bij het Australian Institute of
Sports wordt deze methode al toege-
past.13, 14
Referenties
1.
Smit A (2009). Betrouwbare inspanningstes-
ten. Simpele statistiek voor interpreteerbare
resultaten. Sportgericht, 63 (1), 40-45.
2.
Hopkins WG (2017). A spreadsheet for
monitoring an individual’s changes and trend.
Sportscience, 21, 5-7.
3.
Van Hooren B & Smit A (2015). Statistisch
significant of praktisch relevant? Een andere kijk
op statistiek in de (sport)wetenschap. Sportge-
richt, 69 (4), 42-48.
4.
Claudino JG et al. (2017). The countermove-
ment jump to monitor neuromuscular status: A
meta-analysis. Journal of Science and Medicine in
Sport, 20 (4), 397-402.
5.
Hopkins WG (2000). Measures of reliability
in sports medicine and science. Sports Medicine,
30 (1), 1-15.
6.
Taylor KL et al. (2016). The influence of trai-
ning phase on error of measurement in jump
performance. International Journal of Sports Phys-
iology and Performance, 11 (2), 235-239.
7.
Markovic G et al. (2004). Reliability and fac-
torial validity of squat and countermovement
jump tests. Journal of Strength and Conditioning
Research, 18 (3), 551-555.
8.
Markwick WJ et al. (2015). The intraday relia-
bility of the Reactive Strength Index calculated
from a drop jump in professional men’s basket-
ball. International Journal of Sports Physiology and
Performance, 10 (4), 482-488.
9.
Levinger I et al. (2009). The reliability of the
1RM strength test for untrained middle-aged
individuals. Journal of Science and Medicine in
Sport, 12 (2), 310-316.
10.
Saunders PU et al. (2004). Reliability and
variability of running economy in elite distance
runners. Medicine & Science in Sports & Exercise,
36 (11), 1972-1976.
11.
Hopkins WG (2017). Linear trend in an
individual’s assessments. Sportsci.org/2017/wgh-
trend.htm, geraadpleegd op 16 juni 2017.
12.
Hopkins WG (2004). How to interpret
changes in an athletic performance test. Sport-
cience, 8, 1-7.
13.
Hopkins WG (2017). Inspirational insights
for athletic performance at the annual meeting
of the European College of Sport Science.
sportsci.org/2017/ECSSsport.htm, geraadpleegd
op 17 augustus 2017.
14.
Allen SV & Hopkins WG (2017). Big data
and more at the 2017 Sports Analytics Confe-
rence. sportsci.org/2017/sac.htm, geraadpleegd
op 17 augustus 2017.
Over de auteur
Bas Van Hooren heeft zijn bachelor
behaald aan de Fontys Sporthoge-
school en zijn master bewegings-
wetenschappen aan de Universiteit
Maastricht. Hij is op freelance basis
werkzaam als sportwetenschappelijk
adviseur en fysiek trainer voor top-
sporters en topsporttalenten. Tevens is
hij atleet, vaste medewerker van Sport-
gericht en bezig met het voorbereiden
van zijn promotieonderzoek aan de
Universiteit van Maastricht.
E-mail: basvanhooren@hotmail.com.
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Objectives The primary objective of this meta-analysis was to compare countermovement jump (CMJ) performance in studies that reported the highest value as opposed to average value for the purposes of monitoring neuromuscular status (i.e. fatigue and supercompensation). The secondary aim was to determine the sensitivity of the dependent variables. Methods The meta-analysis was conducted on the highest or average of a number of CMJ variables. Multiple literature searches were undertaken in Pubmed, Scopus, and Web of Science to identify articles utilizing CMJ to monitor training status. Effect sizes (ES) with 95% confidence interval (95% CI) were calculated using the mean and standard deviation of the pre- and post-testing data. The coefficient of variation (CV) with 95% CI was also calculated to assess the level of instability of each variable. Heterogeneity was assessed using a random-effects model. Results 151 articles were included providing a total of 531 ESs for the meta-analyses; 85.4% of articles used highest CMJ height, 13.2% used average and 1.3% used both when reporting changes in CMJ performance. Based on the meta-analysis, average CMJ height was more sensitive than highest CMJ height in detecting CMJ fatigue and supercompensation. Furthermore, other CMJ variables such as peak power, mean power, peak velocity, peak force, mean impulse, and power were sensitive in tracking the supercompensation effects of training. Conclusions The average CMJ height was more sensitive than highest CMJ height in monitoring neuromuscular status; however, further investigation is needed to determine the sensitivity of other CMJ performance variables.
Article
Full-text available
Relevante informatie uit (sport)wetenschappelijke artikelen halen is meestal lastig. Het trekken van conclusies voor de (sport)praktijk aan de hand van deze informatie is vaak nog een stuk moeilijker. Het probleem zit vaak in de gebruikte statistiekmethode. In dit artikel wordt een aantal tekortkomingen van de traditionele methode beschreven en wordt een alternatieve methode toegelicht.
Article
Full-text available
This purpose of this study was to calculate the coefficients of variation in jump performance for individual participants in multiple trials over time to determine the extent that there are real differences in the error of measurement between participants. The effect of training phase on measurement error was also investigated. Six subjects participated in a resistance training intervention for 12 weeks with mean power from a countermovement jump measured 6d.wk-1. Using a mixed model meta-analysis, differences between subjects, within-subject changes between training phases, and the mean error values during different phases of training were examined. Small, substantial factor differences of 1.11 were observed between subjects, however the finding was unclear based on the width of the confidence limits. The mean error was clearly higher during overload training compared to baseline training, by a factor of ×/÷ 1.3 (confidence limits 1.0-1.6). The random factor representing the interaction between subjects and training phases revealed further substantial differences of ×/÷ 1.2 (1.1-1.3), indicating that on average, the error of measurement in some subjects changes more than others when overload training is introduced. The results from this study provide the first indication that within-subject variability in performance is substantially different between training phases, and possibly different between individuals. The implications of these finding for monitoring individuals and estimating sample size are discussed.
Article
Full-text available
Purpose: To evaluate the reliability of the Reactive Strength Index (RSI) and jump-height (JH) performance from multiple drop heights in an elite population. Methods: Thirteen professional basketball players (mean±SD age 25.8±3.5 y, height 1.96±0.07 m, mass 94.8±8.2 kg) completed 3 maximal drop-jump attempts onto a jump mat at 4 randomly assigned box heights and 3 countermovement-jump trials. Results: No statistical difference was observed between 3 trials for both the RSI and JH variable at all the tested drop heights. The RSI for drop-jump heights from 20 cm resulted in a coefficient of variation (CV)=3.1% and an intraclass correlation (ICC α)=.96, 40 cm resulted in a CV=3.0% and an ICC α=.95, and 50 cm resulted in a CV=2.1% and an ICC α=.99. The JH variable at the 40-cm drop-jump height resulted in the highest reliability CV=2.8% and an ICC α=.98. Conclusion: When assessing the RSI the 20-, 40-, and 50-cm drop heights are recommended with this population. When assessing large groups it appears that only 1 trial is required when assessing the RSI variable from the 20, 40-, and 50-cm drop heights.
Article
Full-text available
The one-repetition maximum (1RM) test is considered the gold standard for assessing muscle strength in non-laboratory situations. Since most previous 1RM reliability studies have been conducted with experienced young participants, it is unclear if acceptable test-retest reliability exists for untrained middle-aged individuals. This study examined the reliability of the 1RM strength test of untrained middle-aged individuals. Fifty-three untrained males (n=25) and females (n=28) aged 51.2+/-0.9 years participated in the study. Participants undertook the first 1RM test (T1) 4-8 days after a familiarisation session with the same exercises. 1RM was assessed for seven different exercises. Four to eight days after T1, participants underwent another identical 1RM test (T2). Ten weeks later, 27 participants underwent a third test (T3). Intraclass correlation coefficients (ICC), typical error as a coefficient of variation (TEcv), retest correlation, repeated measures ANOVA, Bland-Altman plots, and estimation of 95% confidence limits were used to assess reliability. A high ICC (ICC>0.99) and high correlation (r>0.9) were found for all exercises. TEcv ranged from 2.2 to 10.1%. No significant change was found for six of the seven exercises between T1 and T2. Leg press was slightly higher at T2 compared to T1 (1.6+/-0.6%, p=0.02). No significant change was found between T2 and T3 for any exercise. 1RM is a reliable method of evaluating the maximal strength in untrained middle-aged individuals. It appears that 1RM-testing protocols that include one familiarisation session and one testing session are sufficient for assessing maximal strength in this population.
Article
Reliability refers to the reproducibility of values of a test, assay or other measurement in repeated trials on the same individuals. Better reliability implies better precision of single measurements and better tracking of changes in measurements in research or practical settings. The main measures of reliability are within-subject random variation, systematic change in the mean, and retest correlation. A simple, adaptable form of within-subject variation is the typical (standard) error of measurement: the standard deviation of an individual's repeated measurements. For many measurements in sports medicine and science, the typical error is best expressed as a coefficient of variation (percentage of the mean). A biased, more limited form of within-subject variation is the limits of agreement: the 95% likely range of change of an individual's measurements between 2 trials. Systematic changes in the mean of a measure between consecutive trials represent such effects as learning, motivation or fatigue; these changes need to be eliminated from estimates of within-subject variation. Retest correlation is difficult to interpret, mainly because its value is sensitive to the heterogeneity of the sample of participants. Uses of reliability include decision-making when monitoring individuals, comparison of tests or equipment, estimation of sample size in experiments and estimation of the magnitude of individual differences in the response to a treatment. Reasonable precision for estimates of reliability requires approximately 50 study participants and at least 3 trials. Studies aimed at assessing variation in reliability between tests or equipment require complex designs and analyses that researchers seldom perform correctly. A wider understanding of reliability and adoption of the typical error as the standard measure of reliability would improve the assessment of tests and equipment in our disciplines.
Article
The primary aim of this study was to determine reliability and factorial validity of squat (SJ) and countermovement jump (CMJ) tests. The secondary aim was to compare 3 popular methods for the estimation of vertical jumping height. Physical education students (n = 93) performed 7 explosive power tests: 5 different vertical jumps (Sargent jump, Abalakow's jump with arm swing and without arm swing, SJ, and CMJ) and 2 horizontal jumps (standing long jump and standing triple jump). The greatest reliability among all jumping tests (Cronbach's alpha = 0.97 and 0.98) had SJ and CMJ. The reliability alpha coefficients for other jumps were also high and varied between 0.93 and 0.96. Within-subject variation (CV) in jumping tests ranged between 2.4 and 4.6%, the values being lowest in both horizontal jumps and CMJ. Factor analysis resulted in the extraction of only 1 significant principal component, which explained 66.43% of the variance of all 7 jumping tests. Since all jumping tests had high correlation coefficients with the principal component (r = 0.76-0.87), it was interpreted as the explosive power factor. The CMJ test showed the highest relationship with the explosive power factor (r = 0.87), that is, the greatest factorial validity. Other jumping tests had lower but relatively homogeneous correlation with the explosive power factor extracted. Based on the results of this study, it can be concluded that CMJ and SJ, measured by means of contact mat and digital timer, are the most reliable and valid field tests for the estimation of explosive power of the lower limbs in physically active men.
Article
To establish the typical error (TE) associated with equipment, testing, and biological variation of a running economy (RE) test in 11 elite male distance runners (VO2max 70.3 +/- 7.3 mL x min(-1) x kg(-1)), and measure the between-athlete variation of 70 highly trained runners (VO2max 69.7 +/- 6.0 mL x min(-1) x kg(-1)) to determine the magnitude of the smallest worthwhile change (SWC) required for RE. Runners performed three 4-min bouts of submaximal treadmill running at speeds of 14, 16, and 18 km x h(-1) (0% grade), on two separate occasions within a 7-d period to determine reliability and once over a 3-yr period to measure the SWC. During all RE tests O2 consumption (VO2), ventilation (VE), respiratory exchange ratio (RER), heart rate (HR), stride rate (SR), and concentration of blood lactate (Lac) were determined. The TE for the pooled data of three running speeds (14, 16, and 18 km x h(-1)) was 2.4% for VO2, 7.3% for VE, 27% for Lac, and ranged between 1 and 4% for RER, HR, and SR. The results demonstrate that although the magnitude of the TE for a submaximal treadmill running protocol of three 4-min work efforts is small (2.4-7.3%) for measures associated with cardiorespiratory parameters, it is three- to fourfold higher for Lac. Given the small TE associated with RE, and a SWC of similar magnitude for this cohort of distance runners, the RE test is useful in detecting changes attributable to training interventions. Changes in RE greater than approximately 2.4% in this cohort of elite distance runners are likely to be "real" and "worthwhile," and not simply related to testing error and typical variation.