一文读懂医学科研论文中的描述性统计

描述统计是对整理后的统计数据进行概括性描述,一般不涉及结论性问题,是推断性统计的基础,主要包括数据分布的集中趋势、数据分布的离散程度、数据分布的偏斜程度(www.19992.net)。根据统计变量的类型可将统计数据分为计量资料、计数资料和等级资料。

数据分布的集中趋势可以用平均数、中位数、众数、分位数等统计指标描述。平均数常用于描述计量资料分布的集中趋势,一般包括算术平均数和几何平均数。中位数常用于描述计数资料和等级资料分布的集中趋势,是一种位置平均数,不受极端变量值的影响。众数常用于描述计数资料的集中趋势,也可以用于计量资料和等级资料,但是计量资料如果没有分组,就少用该指标。分位数也是计量资料和等级资料常用的描述集中趋势的统计指标。

数据分布的离散程度常用方差与标准差、极差、四分位数距、变异系数等统计指标描述。方差与标准差和极差是计量资料常用的统计指标;四分位数距常用于计量资料和等级资料;变异系数多用于观察指标单位不同或者均数相差较大,是将一组数据标准差除以均值,常用于计量资料。

数据分布的偏斜程度常用统计指标为偏态系数和峰态系数。偏态系数大于0则表示数据分布右偏或者正偏,等于0表示对称分布,小于0表示左偏或者负偏。峰态系数则表示数据分布的平峰或者尖峰,如果数据服从标准正态分布,则该系数为0;如果不为0,则说明该数据分布比正态分布更平或者更尖。

医学论文中,针对计量资料,如果服从正态分布则用平均数±标准差表示,若不服从正态分布则采用中位数和四分位数间距表示;等级资料一般采用中位数和四分位数间距表示;计数资料通常采用频数和百分比表示。

SAS软件实现方式:集中趋势,means过程步可以实现平均数、中位数、分位数;univariate过程步可以计算众数。离散程度,means过程步可以计算方差与标准差、四分位数间距。偏斜程度,univariate过程步可以计算偏度和峰度。

主营产品:紫外线消毒器,全自动过滤器,水处理设备,便携式紫外线消毒灯