![医学应用统计分析](https://wfqqreader-1252317822.image.myqcloud.com/cover/501/27362501/b_27362501.jpg)
第一节 单一变量的统计描述
单一变量的统计描述,包括单一数值变量的统计描述和单一分类变量的统计描述。
一、单一数值变量的统计描述
单一数值变量的统计描述,是用明确的计算公式和直观的图表方式等,展示某一数值变量的数值特征和分布特征。其数值特征主要是指变量值的集中趋势和离散趋势,分布特征是指变量值分布的正态性、偏态性、对称性等,通过频数表数据可作初步判断。
第一,描述单一数值变量的集中趋势和离散趋势。变量值的集中趋势是变量值集中水平或密集程度指标,有均数()、几何均数(G)、中位数(M)等,如表4-1;离散趋势是变量值离散水平或分散程度的指标,包括标准差(S)、极差(R)、四分位数间距(Q)等,如表4-2。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0308.jpg?sign=1739371970-DKc8PJhjLjiYoKXsIdi1zZk1zmwZksAA-0-11458284bd161c6c43d5277b39dd2693)
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0309.jpg?sign=1739371970-heO2GoTOh6ZWTsOjB1r47l71Cttdktlr-0-dbddba3260473729feace309146c577b)
第二,数据库数据转换为频数表数据、绘制频数分布图,描述分布特征。数据库数据转换为频数表数据,一般是将数值变量涵盖的取值范围分为8~12组,再计算得到每组包含的变量值个数(也称频数)即可。根据频数表数据绘制频数分布图(如直方图等),如表4-3。初步估计变量值分布的对称性、峰态性等,判断是否服从正态分布或偏态分布。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0310.jpg?sign=1739371970-un3mdcoCODHrhUgv0iNEUGTkAXexL0qQ-0-ebe5f855dabda7a07d7978b2f9474eaa)
例4-1某研究者测定了100名男性中学生身高资料如下,试对该身高值进行统计描述。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0301.jpg?sign=1739371970-mU7TW5YCP2v9lEU78rMr4GCg8cKfuFkc-0-ee3a20e8af002e5687d9c289e1ddf109)
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0302.jpg?sign=1739371970-1S8EI0WOZnQsI3lPT9xifHn5DlBlTjgA-0-c152b3c1c79d9250291568d4cd110ab0)
该例给出的身高数据属于单一数值变量的原始记录数据,要求建好单一数值变量的数据库,即数据库数据,如表4-4。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0311.jpg?sign=1739371970-458VChjGHe1pPbKVSQDxs3RboGLAxCXc-0-ef3137833cac944558f60cb54635d0bd)
然后,计算该身高数据的集中趋势、离散趋势,以及频数分布、正态性、偏态性、对称性等指标。
计算软件不同,统计描述有不同的操作方法。
例4-1转频数表数据SAS程序SASfreqP4_1:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0303.jpg?sign=1739371970-2AXz0CYKL1Wb3gTcSOByIcscuK67jkGH-0-d828054a5862150b9ee914731e4e6348)
例4-1转频数表数据SAS程序的计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0084.jpg?sign=1739371970-rD243OoIQkLTTVhWNukQPf1GTuY3FjaG-0-a7d13816b1b17b754732d30a4bbaf3fb)
“z、Frequency、Percent、Cumulative Frequency、Cumulative Percent”依次为z变量、频数、每个频数占总例数的百分比、累计频数、累计百分比。
SAS中统计描述的计算指标主要通过means和univariate过程实现。
SAS的means过程可对数据进行简单的统计描述,包括的指标有例数(N)、均数(Mean)、标准差(Std Dev)、标准误(Std Error)、最小值(Minimum)等。
例4-1means过程的SAS程序SASmeansP4_1:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0305.jpg?sign=1739371970-YTMYPjJGXB6jbuVjn4PmCeswSi0ayM6a-0-1be163c74fbae3f5aa26f7a5491cf782)
例4-1means过程的SAS计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0085.jpg?sign=1739371970-2ksVKTFAFzbwCfHLHKMWUpWVvDwykCU7-0-4030d15e037e45ff5123a90afe470156)
SAS的univariate过程除了能统计means过程的统计量外,还可输出百分位数、极端值和t检验结果等。univariate过程与上述means过程基本相同,只是将means改为univariate即可。
例4-1univariate过程的SAS程序SASunivariateP4_1:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0304.jpg?sign=1739371970-fzCex6VMPx7jd3nV2bw9jf5R8gp96Xph-0-9a87a0da13caf14454052abcf52e3559)
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0318.jpg?sign=1739371970-gcwGqroy7OrFyCPmfWcqavk5u0NsftAs-0-55b436029400dd44ce63dab8a992dc12)
例4-1数据univariate过程的SAS计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0086.jpg?sign=1739371970-PrNjAyZWYyN6FPVCB916CFr9BAkEkRnK-0-2187cbc920f743c34f6c8769552be7a5)
例4-1的SAS绘制直方图程序SAShistogramP4_1:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0317.jpg?sign=1739371970-2hvqDg02uNeKxAbeFIR9cXTjv5JxkaIt-0-576f031e9d76d853d7e6025207c0964f)
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0087.jpg?sign=1739371970-Ab3s8xRigYlVSDi28gpfgFPS5oKinmj9-0-a6938c254e38e3483372fb80e07c2ffd)
点击上图按钮,弹出调整选项菜单,其中Ticks选项可对图形坐标轴刻度的最大值、最小值、刻度间隔等进行调整。
例4-1SPSS绘制直方图操作步骤SPSSP4-1:
打开d4-1.sav文件,在SPSS程序中按以下步骤操作:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0319.jpg?sign=1739371970-qjzthAWlLQPVbNOrv3SBUNuPxpWF6F9N-0-e55804d3b0bb5eae1480c384dac405f1)
例4-1的SPSS计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0088.jpg?sign=1739371970-pybiRngsW3ye6Vq4PB0TQgoVJwm4eyse-0-cf99df6c7156428027f1ced5c047b348)
二、单一分类变量的统计描述
单一分类变量的统计描述,是用明确、直观的计算和图表等方式,展示某一分类变量的分类特征,主要包括相对数,如率、构成比、相对比、动态数列等,以及编制分类频数表和频数分布图等。
首先,编制分类变量的分类频数表。分类频数表是指分类变量频数表数据,是在分类变量的数据库数据中,分类变量不同类别的变量值个数或频数。
第二,计算分类变量的常用计算指标。描述单一分类变量的数值特征,通常需要计算一些率或比等相对数指标,如疾病的患病率、病死率、构成比等,见表4-5。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0312.jpg?sign=1739371970-mv0g0phK1KZNCPZr8i8HYYQvxsbHGFhm-0-5bc86c674441114b128b30380c7f8d79)
第三,绘制有关分类变量的统计图。一般地,应用分类频数表数据绘制分类频数分布图,如直条图,直观形象地反映该变量数据的分类特征,见表4-6。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0313.jpg?sign=1739371970-vb67O7FZ5g9pfeGbwlk3SwEbUexgkFuD-0-fae4a50ed21ac772f5c31912a1c9586c)
例4-2某社区应接种麻疹疫苗的儿童共1024人,接种记录如表4-7,请对该社区的麻疹疫苗接种情况进行描述。
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0314.jpg?sign=1739371970-0z1yxUgYM6TzpCFiT9VsZ7kSv9QPjFHx-0-1ebeb6a755b87d7d3721b69e5b5a48c3)
表4-7某社区麻疹疫苗接种情况的数据属于分类变量的数据库数据,可将其转换为分类频数表数据、计算有关相对数指标、绘制直条图(此处省略)。
例4-2的SAS程序SASP4_2:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0320.jpg?sign=1739371970-SBZ3aJ4Hqelt01iSms8sJJJONY3QsJde-0-d7441ef60a20d30c5e1ebcfcdf7bc036)
例4-2的SAS计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0089.jpg?sign=1739371970-J2ghFcENcyDqKPVoaGwluHQJ0Yk27eEs-0-4b54bbaf2ef60feae0db861ffb8fe197)
该社区已接种麻疹疫苗(vaccine =1)的儿童占96.39%(Percent),即麻疹疫苗的接种率为96.39%。
例4-2的SPSS操作步骤SPSSP4-2:
打开d4-2.sav文件,在SPSS程序中按以下步骤操作:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0321.jpg?sign=1739371970-rYQRYWCEgCttUqFIG5vns5AAbtPeHhCp-0-a014b1e2e445d0b13d0f71af48604f6f)
例4-2的SPSS计算结果:
![](https://epubservercos.yuewen.com/4CE8FD/15670772804239306/epubprivate/OEBPS/Images/Section0090.jpg?sign=1739371970-tkXNHrtRdBCzNe0wFR2Y9rIeFRWJoGzr-0-c518f7d90933a366c2af21af1f10b62c)
该社区已接种麻疹疫苗的儿童占96.4%(Percent),即麻疹疫苗的接种率为96.4%。