在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法抉择时,应考虑下列因素:
1.分析目的
对于临床医生及临床流行病医生来说,在进行统计分析前,一定要明确利用统计方法达到研究者的什么目的。一般来说,统计方法可分为描述与推断两类方法。一是统计描述(descriptivestatistics),二是统计推断(inferentialstatistics)。统计描述,即利用统计指标、统计或统计表,对数据资料所进行的最基本的统计分析,使其能反映数据资料的基本特征,有利于研究者能准确、全面地了解数据资料所包涵的信息,以便做出科学的推断。统计表,如频数表、四格表、列联表等;统计,如直方、饼,散点等;统计指标,如均数、标准差、率及构成比等。统计推断,即利用样本所提供的信息对总体进行推断(估计或比较),其中包括参数估计和假设检验,如可信区间、t检验、方差分析、c2检验等,如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。还有些统计方法,既包含了统计描述也包含了统计推断的内容,如不同变量间的关系分析。相关分析,可用于研究某些因素间的相互联系,以相关系数来衡量各因素间相关的密切程度和方向,如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析;回归分析,可用于研究某个因素与另一因素(变量)的依存关系,即以一个变量去推测另一变量,如利用回归分析建立起来的回归方程,可由儿童的年龄推算其体重。
2.资料类型资料类型的划分现多采用国际通用的分类方法,将其分为两类:数值变量(numericalvariable)资料和分类变量(categoricalvariable)资料。数值变量是指其值是可以定量或准确测量的变量,其表现为数值大小的不同;而分类变量是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性或类别,如:性别是两类无序分类变量,血型是四类无序分类变量;有序分类变量表现为各属性或类别间有程度之分,如:临床上某种疾病的“轻、中、重”,治疗结果的“无效、显效、好转、治愈”。由此可见,数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。资料类型的划分与统计方法的抉择有关,在多数情况下不同的资料类型,选择的统计方法不一样。如数值变量资料的比较可选用t检验、u检验等统计方法;而率的比较多用c2检验。值得注意的是,有些临床科研工作者,常常人为地将数值变量的结果转化为分类变量的临床指标,然后参与统计分析,如患者的血红蛋白含量,研究者常用正常、轻度贫血、中度贫血和重度贫血来表示,这样虽然照顾了临床工作的习惯,却损失了资料所提供的信息量。换言之,在多数情况下,数值变量资料提供的信息量最为充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。因此,在临床实验中要尽可能选择量化的指标反映实验效应,若确实无法定量时,才选用分类数据,通常不宜将定量数据转变成分类数据。3.设计方法在众多的临床科研设计方法中,每一种设计方法都有与之相适应的统计方法。在统计方法的抉择时,必须根据不同的临床科研设计方法来选择相应的统计分析方法。如果统计方法的抉择与设计方法不一致,统计分析得到的任何结论都是错误的。在常用的科研设计方法中,有成组设计(完全随机设计)的t检验、配对t检验、成组设计(完全随机设计)的方差分析、配伍设计(随机区组设计)的方差分析等,都是统计方法与科研设计方法有关的佐证。因此,应注意区分成组设计(完全随机设计)与配对和配伍设计(随机区组设计),在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计(随机区组设计)的资料当做成组设计(完全随机设计)来处理,如配对设计的资料使用成组t检验、配伍设计(随机区组设计)使用成组资料的方差分析;或将三组及三组以上的成组设计(完全随机设计)资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较,都是典型的错误。4.分布特征及数理统计条件数理统计和概率论是统计的理论基础。每种统计方法都要涉及数理统计公式,而这些数理统计公式都是在一定条件下推导和建立的。也就是说,只有当某个或某些条件满足时,某个数理统计公式才成立,反之若不满足条件时,就不能使用某个数理统计公式。在数理统计公式推导和建立的条件中,涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律,许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从(符合)某种分布,即可使用该分布所具有的数理统计规律来分析和处理该实际资料,反之则不能。在临床资料的统计分析过程中,涉及得最多的分布有正态分布、偏态分布、二项分布等。许多统计方法对资料的分布有要求,如:均数和标准差、t和u检验;方差分析都要求资料服从正态分布,而中位数和四分位数间距、秩和检验等,可用于不服从正态分布的资料。所以,临床资料的统计分析过程中,应考虑资料的分布特征,最起码的要求是熟悉正态分布与偏态分布。例如:在临床科研中,许多资料的描述不考虑资料的分布特征,而多选择均数与标准差。除了数据的分布特征外,有些数理统计公式还有其它一些的条件,如t检验和方差分析的方差齐性、卡方检验的理论数(T)大小等。总之,对于临床科研工作者来说,为正确地进行统计方法的抉择,首先要掌握或熟悉上述影响统计方法抉择因素;其次,还应熟悉和了解常用统计方法的应用条件。
统计描述的内容包括了统计指标、统计和表,其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用,而统计表的正确使用请参阅其他书籍。
1.数值变量资料的描述描述数值变量资料的基本特征有两类指标,一是描述集中趋势的指标,用以反映一组数据的平均水平;二是描述离散程度的指标,用以反映一组数据的变异大小。描述数值变量资料的常用指标:均数描述一组数据的平均水平,集中位置正态分布或近似正态分布中位数(M)与均数相同偏态分布、分布未知、两端无界几何均数(G)与均数相同对数正态分布,等比资料标准差(S)
描述一组数据的变异大小,离散程度正态分布或近似正态分布四分位数间距
(QU-QL)与标准差相同偏态分布、分布未知、两端无界极差(R)与标准差相同观察例数相近的数值变量变异系数(CV)与标准差相同比较几组资料间的变异大小均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征;中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。这些描述指标应用时,最常见的错误是不考虑其应用条件的随意使用,如:用均数和标准差描述偏态分布、分布未知或两端无界的资料,这是目前在临床研究文献中较为普遍和典型的错误。
好课推荐
课程背景
随着国内临床试验的发展,以及创新药研发力度的加大,越来越多的毕业生和职场人士加入到临床试验研发流程当中,成为整个产业链当中的重要一环。然而随着行业发展,市场对专业技术人才的需求缺口越来越大,出现了企业招不到合适的人才,很多人又找不到合适的工作,为了给业内输送越来越多统计编程岗位的人才,我们开设了本系列录播课程,以帮助大家掌握和应用统计编程岗必备的专业技能,让大家实现更好的职业发展,同时也满足企业的人才缺口!
课程目录
模块一:CDISC---SDTM
模块二:CDISC---ADaM
模块三:CDISC---Define--XML
模块四:项目管理--Lead部分
模块五:SAS编程base和SQL&Macro
课程亮点
课程简介
本课程一共分五大版块,全面而系统地讲解SAS程序员统计编程相关知识和技巧。课程总时长将近100小时,课程内容包括对相关指导原则的深度解读、实际项目经验分享、参考程序、数据集和项目模板分享等等,特别注重专业知识的强化和引申扩充,帮助大家学习行业所需的知识体系。购买课程学员将获取所有课程的相关资料(包括指导原则、文献、论文、模板、程序、数据集等等)
本课程面向医药行业、构建行业知识体系、面向实际就业,是为所有医药数据分析职场小白量身打造的职业技能强化课程。
福利一:凡是购买套课学员讲师将全程在线解答学员课程相关及大家实际工作和学习中遇到的问题.
福利二:凡是购买全套课程的学员,如有需要,平台可帮忙推荐工作机会
模块一:CDISC---SDTM
SDTMIG_v3.3_FINAL,由CDISC Submission Data Standards Team 发布于2018.11.20,解读视频包括SDTM基本理论,试验设计和特殊domain模块等内容。此系列重点关注trial design domain,如TS每一个parameter的创建方法,常见及较为复杂试验设计的综合考虑,如ARM和Element Map方法,SDTM编程的基本理论详细解读,特殊及重要domain的运用和举例。本模块视频时长:17小时31分钟25秒
SDTM metadata Submission Guidelines v2.0,由CDISC SDS MSG Team发布于2021-03-30,这一版较1.2版变化较大,尤其是关于aCRF的制作方面。视频包括对SDTM-MSG_v2.0通读,样本数据和aCRF举例。 本模块视频时长:2小时30分钟58秒
SDTM编程domain创建方法讲解视频及程序 本模块视频时长:2小时44分钟55秒
SDTM编程宏讲解视频及参考SAS程序 本模块视频时长:1小时55分钟28秒
购课赠送:SDTMIG 3.2超详细解读及基本问题分享电子版(204页电子书)
扫码试听
模块二:CDISC--ADaM
ADaM部分指导原则精读视频 ,视频时长:16小时2分钟14秒
ADaM编程部分数据集参考程序及讲解视频 视频时长:1小时4分钟47秒
ADaM部分SAS宏程序及讲解视频 视频时长:21分钟50秒
ADaM Specification基本理论及实操讲解 视频时长:44分钟30秒
扫码试听 模块三:CDISC--Define-XML
Define-XML制作视频,利用Pinnacle 21 Community软件创建SDTM/ADaM Define.xml的全面详细地指导过程,包括数据验证及解释,Review Guide撰写,一般考虑和实际操作方法等。模块三视频总时长:8小时7分15秒
Define-XML部分:PDF格式文件使用规范(含参考程序) 扫码试听 模块四:项目管理--Lead部分
模块四包含两个部分课程视频总时长:5小时29分钟2秒
项目管理-Lead讲解视频及引用资料,详细介绍了项目管理层面对技术和管理能力的基本要求及一般考虑
项目管理-Lead程序及讲解视频
扫码试听 模块五:SAS编程
SAS高级编程技能之SQL & Macro系列录播课程,本课程为SAS高级编程课程,课程包含16节视频课+所有课件/程序/数据集等资料,旨在提高学员SAS编程技能,是提升学员的工作能力的强化课程。视频时长:11小时11分钟 24秒
购课赠送:21节SAS初级编程系列课程(含视频/程序/课件/数据等)本视频一共21节课程,包含视频/程序/课件/数据等,是一套非常全面而系统的系列课,本系列视频课程适合于初级SAS学习者. 本模块视频时长:14小时28分钟4秒
扫码试听 适合人群
小白、在校学生
实习生、初入职场人士
对统计编程感兴趣计划转行到临床SAS程序员的在职人士
讲师简介
团长老师
法迈新媒体合作资深讲师,数量经济学硕士
近10年临床试验行业经验,曾就职于泰格医药、药明康德等知名企业,深耕于统计编程、生物统计、数据管理等,拥有扎实的专业知识和丰富的项目经验,完成上百个向FDA和CDE递交的统计编程项目,善于搭建团队和项目管理,非常熟悉业内的流程和业务,积累了丰富的经验,摸索出培养统计编程人才的一套成熟的教学体系。
已在平台(微信公众号:法迈医讯)推出作品:
21节SAS初级编程系列课程
CDISC-SDTM基本理论及实践系列文章汇总
SAS编程应用及相关知识分享系列文章汇总
ICH指导原则E3/E6/E8/E9系列解读录播课程
统计程序员TFLs编程系列录播课程
等等干货文章资料与课程
报名咨询
课程详细请咨询扫描二维码添加助教“团团” 微信
欢迎加入560+人的中国临床试验行业通讯录
好课推荐
统计程序员TFLs编程系列录播课程
高品质课程推荐—临床研究系列课程
SAS程序员统计编程技能系列录播课程
ICH指导原则E3/E6/E8/E9系列解读录播课程
20天超级训练营|从实际案例系统学习临床试验前沿设计方法
《联合用药研究设计实操训练营》47节课程
真实世界研究系列线上课程
免费听临床试验多终点设计经典课程
精品推荐
免费领取|临床试验统计编程全套干货资料包!
汇总|21节SAS初级编程系列课程在线免费观看
汇总|临床试验十七个相关知识点
实用|药物临床试验必备文件及相关管理要求
限时领取|CDISC-SDTM基本理论及实践系列文章汇总
免费领取|8.72G临床试验精华资料包(共180个文件)
福利|专属生物统计师的几本经典书籍
推荐|领取ADC(抗体药物偶联物)知名书籍:研发,临床,注册及市场发展汇总|CDE ICH指导原则全系列培训视频
限时领取|临床研究设计与方案撰写资料包!!!
干货|生物统计系列知识汇总
福利|专属CRC的全套资料包免费领取啦,赶快拿走吧!
限时领取|药物警戒法规资料中英文版汇总
收藏|E9:临床试验统计原则(另附中英文对照词汇表)
法规|ICH-GCP中英文对照(最完整版)
免费领取| 第二期|临床试验数据管理与统计编程全套资料包!
好书推荐|免费领取临床试验几本经典书籍
汇总|SAS编程应用及相关知识分享系列文章
>>>> 公众号推荐
好文推荐
免费领取|生物制药从业人员的全套资料大礼包!!!
免费领取|双节大礼包:制药企业从业人员231个实用文件
福利来啦!制药人必备的全套资料包
干货|PDA全套资料合辑
限时领取|制剂技术百科全书第三卷【美】J.斯沃布里克【美】J.C.博伊兰主编
欢迎关注法迈新媒体
更多,更及时的干货内容,请加我们的微信公众号:法迈医讯,诚邀业内人士及机构向我们投稿。投稿邮箱:bellama@pharmanews.cn 【免责声明】文章为网络整理,不代表“法迈医讯”立场。如因作品内容、版权等存在问题,请于本文刊发30日内联系法迈医讯进行删除或洽谈版权使用事宜。
法迈医讯作为法迈新媒体微信公众号矩阵之一, 法迈新媒体是国内一家面向制药行业供应链综合服务平台,致力于服务全球制药行业从业人员。以创新的互网+模式服务于行业用户,形成以“资源整合,知识共享”为核心,微信公众号矩阵、社群矩阵为分支的新媒体模式,力争打造国内活跃和具影响力的专业化平台!