第三节 常用统计软件简介
临床研究中数据的分析处理需要利用统计学软件这一工具,如估算样本量、建立数据库、开展统计分析等。这里简介几种常用的样本量估算及统计分析软件。
一、常用样本量估算软件
样本量估算可以借助PASS、nQuery、PS、Epi Info、SAS等统计软件完成。
(一)PASS软件
PASS(power analysis and sample size)软件是专门用于检验效能分析和样本量估算的软件包。PASS软件包含60多种用于样本量估算的工具包,能对数十种统计检验条件下的检验效能和样本量进行估算,主要包括区间估计、均数或率的比较(含差异性检验、等效性检验、非劣效性检验、优效性检验)、相关分析、回归分析、生存分析、诊断试验、成组序贯试验、模拟研究等多种情形。该软件界面友好,操作简便,研究者只需确定研究设计方案及相关参数,就可通过简单的菜单操作估算出检验效能和样本量。同时,PASS软件还提供了每种样本量计算方法的原理及参数设置的PDF文件,供使用者参考学习。本书将详细介绍如何采用PASS软件估计样本含量,采用的版本为PASS 15.0。
(二)PS软件
PS(power and sample size calculation)软件是一款免费的软件,可实现t检验、二分类资料的卡方检验、简单线性回归分析、回归直线的比较、Mantel-Haenszel检验及生存分析等的检验效能和样本量估算。该软件操作界面简便,研究者只需根据研究设计类型及检验方法选择相应操作界面,并设置相关参数,就可以估算出相应的检验效能或者样本量。
二、常用统计分析软件
数据统计分析涉及大量计算,统计软件的使用有助于提高统计运算效率和准确性。常用的统计软件,如SPSS、SAS、R、Stata等,可方便地实现各种统计方法的运算,研究者也可自己编写程序实现新的统计方法。
(一)SPSS统计软件
SPSS原名为statistical package for the social sciences,即社会科学统计软件包,是SPSS公司出品的大型专业统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制。2000年,SPSS公司重新定义其英文全称为statistical product and service solutions(统计产品与服务解决方案)。2009年IBM公司收购了SPSS公司,将其作为IBM子公司,且在此之后变更其名称为IBM SPSS。
SPSS最突出的特点是操作界面友好,输出结果美观。SPSS使用Windows的窗口方式展示各种功能,使用对话框展示功能选择项,研究者只要了解统计分析原理,就可以方便地使用该软件为特定的科研工作服务,是临床研究人员的首选统计软件。
(二)SAS统计软件
SAS为statistical analysis system的缩写,即统计分析系统,是当今国际上最著名的数据分析软件之一,由美国北卡罗莱纳州州立大学的A.J.Barr和J.H.Goodnight两位教授于1966年开始研制,并于1976年正式推出。SAS可以完成数据管理、统计设计、统计分析、运筹决策等工作。自8.0版开始,推出了中文版。
SAS是由多个功能模块组合而成的软件系统,其最大特点是将数据管理和数据分析融为一体,可以实现数据交换、数据管理、数据分析、数据呈现等功能。由于SAS软件一般需要编程实现各种功能,一般多为专业统计人员采用。
(三)R统计软件
R是诞生于1980年左右的S语言的一个分支,可以认为R是S语言的一种实现,被统计领域广泛使用。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能等。
相比于其他统计软件,R具有以下特点:完全免费,开放源代码;更新速度快,大多数最新的统计方法和技术都可以在R中直接得到;有大量可以随时加载的有针对性的软件包等。R可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统。另外,使用R软件的同时可以安装R Studio,方便研究者操作。
(四)Stata统计软件
Stata统计分析软件是美国Stata公司的产品,于1985年问世。自1985年推出至今,Stata不断更新、日趋完善。Stata操作灵活、简单、易学易用,是一款非常轻便的有特色的统计软件。Stata最突出的特点是短小精悍、功能强大,包含全部的统计分析、数据管理和绘图等功能。由于在Stata软件中能便捷地实现多种最新统计方法,因而越来越受到用户的推崇。Stata可以运行于Windows系统上,且提供完整的使用手册。