学术交流

当前位置: 首页» 学术交流

【体能探索25期】体能教练的数据分析:使用Excel分析信度、差异和相关性

摘要:

统计分析对于进行(数字化)体能训练的起着至关重要的作用,不论数据之间的差异和相关性是什么,教练都应该能够识别其信度与客观性。这些分析技能是我们能去发现某些数据所呈现的趋势和它们之间的内在联系,可为将来的训练计划作出有效预判性设计和评估。本文通过Microsoft Excel进行了测试统计,包括了信度(通过变异系数),最小的有价值的变化量(例如,数值中第一个有意义的差异),效应量(ES,运动表现相关测试中的的明显数值变化),以及关联关系(即相关性)。

关键词:最小有价值的变化;效应量;相关性;变异系数

一、前言

数据分析涉及统计,或者说涵盖了数据收集、分析和客观解释的科学(包括推论)。统计的关键是客观性,使它产生的结果可以不受偏见和个人动机的影响。使用统计数据可以让我们发现趋势和其关联、做出预测以及评估针对体能测试流程和运动员身体特征的训练计划的有效性。因此,统计数据对于体能教练而言至关重要,从业人员应该熟悉分析数据的不同方法且随后与教练和运动员对这些数据进行沟通。

我们旨在介绍几种可以进行与体能相关的统计分析的方法。选择的测试是可以使用Microsoft Excel(Excel,Microsoft,Redmond,Washington)进行,因此这也适用于大多数读者。具体来说,我们将研究信度(通过变异系数[CV])、最小的有意义的变化[SWC](即数据的第一个有意义的差异),效应量(ESs,即效果之间的变化幅度)和数据之间关系(即相关性,correlations)。尽管我们应该认识到这些分析方式也可以通过其他的方法,但是这些分析模式通常需要更专业的软件,如SPSS,IBM,Armonk,New York等这类社会科学统计软件。在进行一系列的基础体能测试之后,我们将结果用本研究背景情况下的数据处理进应用进行讨论。当然,我们也应该弄清楚如何将此过程推广到其他方案。我们的分析从系统性偏差开始。

关键词:最小的有价值的变化;规模效应;相关性;变异系数

二、系统性偏差

当我们试图确定运动员的跳跃高度时,通常给运动员2次或3次重复测试以确定测试值的最大值。作为体能教练,我们会记录所有测试,以便我们评估数据的信度(请参阅下文的信度部分)。在所有测试中我们可能会注意到,由于测试动作本身导致疲劳(不够充分的休息间歇)的产生或者是动摇了测试动机,测试得到的结果会逐渐变差;当然也有可能由于不断完善的动作技能(即学习效应)可能会导致测试结果越来越好。这种可能会发生的事被称为系统性偏差,并且在做实验设计环节时就应该尽可能规避。


图1 反向跳(CMJ)在3次测试中的变化。不难发现测试成绩越来越好

图2 反应性力量(reactive strength)在三次测试中的变化。不难发现成绩越来越差

图3 专业灵敏测试(Pro agility test,PorA)在三次测试成绩的变化。不难发现第二次成绩变好了,第三次变差了

图4 在Excel中输入数据时,要确保每行只添加1名运动员。突出显示标题单元格和意思单元格,并从“图表”选项中选择“列”。本图中突出显示的单元格(数字39.72)将生成图1中所示的图表。

图5 为了计算每个运动员的变异系数(CV),我们可以使用在公示栏中输入公式。它可以计算所有测试的标准差,然后计算平均值,再将他们乘以100%,得到每个运动员的CV百分比。单击该单元格的右下角(即正方形)将公式向下拖动并应用于所有运动员。

例如,在图1中,可以明显看出运动员在反向跳(CMJ)高度上的数据随着每次测试的进行而不断提高,从这个结果我们可以认为运动员由于每次动作技能的习得使得成绩变得更好,或者有可能是运动员开始测试时“很冷”(没激活该动作模式),测试人员可能没有提供足够的热身或熟悉动作的时间。在这两种情况下,获得的数据可能都不可靠,可能需要至少包含1个其他测试才能确定运动员的真正最优运动表现。相反,在图2中,对于测试反应性力量(RSI)时,我们可以看到相反的结果。在这种情况下,也许是提供了太多的热身,或者在两次测试之间没有给予足够的休息,导致运动员感到疲劳。最后,在图3中提供的专业灵敏测试时(Pro-Agility test,ProA)测试结果示例中,其实可能前两个测试结果就够了,因为第3个结果导致了运动表现的下降,这可能是由于疲劳或失去测试动机所致。因此,评估数据的一个很好的起点是检查系统性偏差,即运动员准备测试的准备程度。

我们是可以使用Excel评估此过程(图4)。遵循以下准则以消除此类系统性误差所导致的问题:

•确保运动员体温已经升高(通过提高体温,运动表现会有所改善);

•提供一个熟悉期/熟悉课避免由于学习效果而测试结果不正常地迅速提高;

•在两次测试之间提供充足的休息时间确保疲劳不会对测试成绩产生负面影响;

•测试工作人员应该保持始终如一的动机激励-要么全程鼓励,要么全程不说话

三、信度

信度是指测试或测量的一致性或可靠性,或者说信度是可以作为所有测试的结果和发现的计算、认知的一种统计。凭借信度,我们可以确保测试结果能够提供准确的数据。例如,如果你在3次完全一致的测试中得到运动员的30m冲刺时间,每次的结果都明显不同,则这种测试不能反映运动员的运动表现,这当然也就不可靠。当然,没有测试是完全可以规避错误的——设备、测试操作员和运动员都会产生这些问题。

因此,我们必须决定可接受的误差是多少,并认识到运动员测试的成绩真实值应该是在数据值±误差的范围内的。例如,如果一名运动员在3秒钟内跑了30 m,而测试中的误差产生了0.5秒,则实际上该运动员是在2.5到3.5秒之间这个范围跑了30 m。如果运动员在接下来的一个月重新测试,并且跑出2.6秒,他冲刺真的变得更快了吗?


图6 我们已经分别计算了每个运动员的变异系数(CV)。接下来,我们使用公式栏中所示的“平均”公式对全队的这些数据进行平均。对于CMJ来说,CV= 4.9%表示可接受的信度。因此,如果运动员A跳了47.7厘米(图4),则他的数据实际上在45.4到50厘米之间(47.7厘米*0.049=2.3厘米)。

我们将在此处使用的信度测试是变异系数(CV)。CV是一种关于比率的统计,以一致性的百分比去提供数据信度。因为在体育运动中,运动员通常只进行几次测试(2-5次),所以最好计算每个运动员的CV,然后计算整个团队的平均值。CV的计算如公式1和图5、图6所示。当测试目标的CV≤10%的时候就被科学界认为是具有信度的。不过对于体能测试来说,≤5%的CV值可能更加准确。还要注意的是,使用此方法可为每位运动员提供一个CV值,该值可用于控制运动员之间的一致性差异。然而通常情况下,团队平均值的应用更为普遍。

CV =100(SD/M). (公式1)


图7 公式栏显示了30m冲刺时间的标准差的计算,等于0.16s。

四、最小的有价值的变化

假设数据是可靠的并且没有系统性偏差,我们可以分析最小有价值的变化SWC(3),即可以接受真实数据的最小变化是多少?例如,如果一名运动员在季前测试期间能2.1秒内进行了30米的短跑测试,然后在进行训练干预后数据为2.0s,则可能会认为由于某些其它原因促成了这样的成绩提升,不一定就完全是由于训练所引起运动表现的提升。为了计算SWC,我们计算研究对象间标准差(SD),然后将该数字乘以0.2。从图7和30m的冲刺时间(请看图中的“ Best_30-m”列)我们可以看到SD为0.16*0.2= 0.032s,这表明对于运动员A而言,30m冲刺时间的SWC将是4.5-0.032=4.468s。

但是,回顾一下我们刚刚进行的信度测试也是很重要的,看看我们是否可以准确地检测到这一个小的变化。在图6中,我们可以看到30米冲刺时间的CV为2.4%。对于运动员A的SCW则是4.5*0.024 =0.108s;因此在此案例中,该运动员和该测试的SWC落在该测试的误差范围内,所以该数据不适合使用。在这种情况下,我们可以乘以更大的系数,即0.6或1.2,以便现在分别检测出属于中等或较大变化的类别(有关其他系数,请参见表1)或计算CV。在这方面,使用CV来计算真实的变化并为运动员设定目标数据是个好主意。然而,在最初的测试中如果有一个错误,在接下来的测试中还会有错误,虽然已经对前者进行了解释,但没有对后者进行解释。解决方法非常简单,将CV乘以2即可确定数据的真实变化。如果你的运动员熟悉测试并且被充分地进行管理,则应有可能获得CV≤3%。

1解释标准差或均值变化(Hopkins(3))

及微小的(trivial)

0.2

小的(small)

0.2–0.6

适中的(moderate)

0.6–1.2

大的(large)

1.2–2

很大的(very large)

2.0–4.0

极大的(extremely large)

>4.0

再次以30m冲刺时间与运动员A为例,注意此CV2.4%的两倍= 4.8%,作为一个体能教练,你设置的第一个真实变化以及目标测试结果应该如下:4.5-(4.5 *0.048 )=4.5–0.216 =4.284秒。图8展示了如何使用此方法在Excel中添加一列来计算每个运动员的目标数据。


图8 公式栏显示了如何使用双重变异系数(CV)方法计算第一个有意义的变化。括号中的值从原始数据中减去两倍的CV,注意,“$”符号固定CV的位置,因此公式可以向下拖动到所有单元格。

究竟是使用SWC法还是双重CV法取决于教练自己。尽管SWC可能会落在测试错误的范围内,但如果CV太高(例如CMJ和RSI,图5),则双CV方法可能会设置不切实际的目标。第三种选择可能是单独查看每个运动员(或创建子分组),因为某些运动员在整个测试中可能足够一致,可以使用SWC(为0.2)。另外,如果他们是一名“高水平”的运动员,他们只会寻求做出微小而重要的改变。

五、效应量

当尝试量化测试产生表现数据的变化时,可以使用ES客观地展示变化的幅度。同样,客观性在这也是非常关键的,因为客观性消除了关于运动员内部产生的变化质量的任何主观成分,尤其是当变化可能表示未来的干预(以及可能的投入)。例如,在口头描述的情况下,CMJ的测试高度从46cm变到49cm可以认为是中等的变化,或是很大的变化(表1)。当对比队伍集体水平时,这种变化可以在相同的队内被量化。

ES通常使用公式2中所示的Cohen d计算,并且在图9和10中提供了一个应用示例。但是,此处应谨慎使用,教练应意识到以下事实:当运动员是训练多年的高水平运动员,他们的“微小进步”是与业余运动员“大量进步”是等同的。此外,由于SD是用于计算ES的,因此请确保组内数据是具有同质性的,即具有相同运动水平和运动能力(这样不会产生过大范围的测试数据)将有助于发现有意义的变化。

因此,作为教练的你可以在这考虑基于训练年限的不同再分一次亚组,与SWC相似,对于相对更高水平的运动员的数据变化可能会被掩盖。Rhea(5)测试了3,000个ES涵盖400项不同的研究,并提出了一种新的ES分类量表,该量表特定于受试者的力量训练状态(表2)。

               

图9 顶部的公式栏显示了合并标准差的计算。倍根号5 O;^ 5的。

六、相关性

相关性描述了可能的关系。它们可以是2个变量之间的正相关、无相关、负相关(或在这种情况2种不同的运动表现测试)。例如,力量与垂直纵跳之间具有正相关、力量与速度之间也是正相关、速度与灵敏之间是正相关。相关性假设了如果我们影响1个变量,那么这个变量将影响另一个。该关系的强度由“ r”值表示,范围从-1到1,其中0表示无相关性。根据Cohen(1),相关系数阈值0.10为“小”,0.30为“中”,而0.50为“大”。此外,Hopkins等(4)建议把0.7当做是非常大值(very large),把0.9当做是极大值(extremely large)。

在确定某个关系甚至在统计上具有重要意义之前,需要一定的样本量。例如,在r =0.2的关系被认为是有意义之前,将需要近100位运动员作为样本量;对于r=0.3,则需要大概40名运动员;r =0.5则需要大概14名运动员,而r =0.6,则只需要9名运动员(2)。同样,如果你的受试者只有6个人,通过上述关系我们可以认为如果r的值小于0.7则这个测试的6人数据将是没意义的。除非任何数值被认为具有统计意义,否则这些关系被认为是偶然发生的。

我们还可以将r值取平方,以表示可决系数(coefficient of deternmination ,r2)。这是一个变量的可变性量度,由另一个变量解释,通常以百分比表示(乘以100%)。例如,如果力量和速度之间的相关性是r=0.8,则r2=64%(0.8*0.8*100%),即力量变化的64%由速度变化解释。这也告诉我们——剩下的36%可以有其他的变量进行解释。下面分别在图12和13中说明了如何使用Excel进行的相关性计算和可决系数。

对于各类体育类教练而言,诸如相关性和可决系数之类的统计分析是一种询证分析工具,因此也是越来越多的在体能训练领域被使用。例如很多教练无法说明速度对运动竞赛中运动表现的重要性。因此,若当前一些主流观念或者是组织管理机构文化、运动员发展受限的情况下,但我们可以很好的说明身体素质与力量和跳跃高度具有相关性,那么这有可能帮助我们更好的推广、引进抗阻训练理念。


图10 在计算合并的标准偏差之后,编辑栏将显示效应量的计算。该值(0.32)被视为“小”。

     

表2

不同力量训练水平受试者的效应量分类(Rhea(5))

等级

训练有素的

业余训练者

未经训练者

级小的

0.25

0.35

0.50

小的

0.25–0.50

0.35–0.80

0.50–1.25

中等的

0.50–1.0

0.80–1.50

1.25–2.0

大的

>1.0

>1.50

>2.0

训练有素的=至少5年训练经验;业余训练者=经过1-5年训练经验;未经训练者=小于1年训练经验。


图11 相关性。从左到右:完全正相关,无相关,完全负相关。


图12 公式栏标识每个相关的计算。打开方括号后,可以高亮显示感兴趣的单元格。


图13 为了计算可决系数r2,采用相关系数r的平方表示。

七、结论

总言之,数据分析的首要任务是确保所收集数据的质量。这可以通过绘制每个测试的平均数据并评估其系统性偏差来完成;只要对运动员进行适当的热身、且测试过程不疲劳并熟悉测试动作,这应该都不是问题。随后可以使用CV来检查测试的信度——正如所前文讨论的,具有信度的该CV值小于10%。但是,进行体能测试时,数据应低于5%。

完成上述步骤后,可以进一步地分析数据以确定训练的效果。据此,可以使用SWC(或任何其他公式)来设置目标值,但始终牢记确保这些目标不在CV表示的测试误差范围内。如果不是这种情况,则受试者之间的SD可以乘以更大的系数,或者使用的目标是测试CV的两倍。后者考虑了后续测试的误差,但如果CV是0.3%时,则可能会产生不切实际的目标。最后一种选择是使用每位运动员各自的SD或CV设置目标值。

最后,如果将测试数据与同一支球队或另一支球队的先前表现进行比较,则可以使用ES计算数据之间的变化幅度,从而对任何明显的差异进行客观评估。此后,为了证明训练方法和认识到测试中关键的身体生理前期需求是如何影响运动表现的,相关性分析必须进行;所有参与测试者应该确保效应量是否阐明了这种关系确实是有意义的一个。

翻译者:体能训练学院2020级研究生  李恒志

校对者:张鹏

文献来源:

Turner, Anthony MSc, CSCS*D1; Brazier, Jon MSc, CSCS2; Bishop, Chris MSc1; Chavda, Shyam MSc, CSCS1; Cree, Jon MSc1; Read, Paul MSc, CSCS3 Data Analysis for Strength and Conditioning Coaches, Strength and Conditioning Journal: February 2015 - Volume 37 - Issue 1 - p 76-83

doi: 10.1519/SSC.0000000000000113