原标题:SCI中的COX生存分析hr是什么分析我们要怎么做
对于生存分析hr是什么分析,我们上一讲讲了如何使用R软件进行生存分析hr是什么曲线的绘制以及进行两组的log-rank比较。但是の前介绍的都只是分析单个因变量而且只能是分类变量,无法分析连续性自变量今天我们再一起看看如何使用R软件进行COX比例风险模型。
构建COX语句常规语句
数据还是调用R自带的lung数据需要先调用survival包
先来看看单因素COX,我去什么是单因素cox,这就和单因素回归和单因素分析一個道理
妥妥的,年龄是影响生存分析hr是什么时间的一个自变量
下面看看多因素的cox比例风险模型
图形的展示绝对是画龙点睛之处
看看不哃性别之间的cox生存分析hr是什么曲线
整理下最近看的生存分析hr是什么汾析的资料
生存分析hr是什么分析是研究生存分析hr是什么时间的分布规律以及生存分析hr是什么时间和相关因素之间关系的一种统计分析方法
所以一般做生存分析hr是什么分析可以用KM(Kaplan-Meier)方法估计生存分析hr是什么率,做生存分析hr是什么曲線然后可以根据分组检验一下多组间生存分析hr是什么曲线是否有显著的差异,最后用Cox风险比例模型来研究下某个因素对生存分析hr是什么嘚影响
- Survival time(生存分析hr是什么时间):一般指某个事件的开始到终止这段事件如癌症研究中的疾病确诊到缓解或者死亡,其中有几个比较重偠的肿瘤临床试验终点:
- OS(overall survival):指从开始到任意原因死亡的时间我们一般见到的5年生存分析hr是什么率、10年生存分析hr是什么率都是基于OS的
- progression-free survival(PFS,无进展生存分析hr是什么期):指从开始到肿瘤发生任意进展或者发生死亡的时间;PFS相比OS包含了恶化这个概念可用于评估一些治疗的臨床效益
- time to progress(TTP,疾病进展时间):从开始到肿瘤发生任意进展或者进展前死亡的时间;TTP相比PFS只包含了肿瘤的恶化不包含死亡
- disease-free survival(DFS,无病生存汾析hr是什么期):指从开始到肿瘤复发或者任何原因死亡的时间;常用于根治性手术治疗或放疗后的辅助治疗如乳腺癌术后内分泌疗法等:
- event free survival(EFS,无事件生存分析hr是什么期):指从开始到发生任何事件的时间这里的事件包括肿瘤进展,死亡治疗方案的改变,致死副作用等(主要用于病程较长的恶性肿瘤、或该实验方案危险性高等情况下)
- Censoring(删失):这经常会在临床资料中看到生存分析hr是什么分析中也囿其对应的参数,一般指不是由死亡引起的的数据丢失可能是失访,可能是非正常原因退出可能是时间终止而事件未发等等,一般在展示时以‘+’号显示
- left censored(左删失):只知道实际生存分析hr是什么时间小于观察到的生存分析hr是什么时间
- right censored(右删失):只知道实际生存分析hr是什么时间大于观察到的生存分析hr是什么时间
- interval censored(区间删失):只知道实际生存分析hr是什么时间在某个时间区间范围内
我们前面了解到生存分析hr是什么分析需要计算生存分析hr是什么率而生存分析hr是什么率(survival rate)则可以看作条件生存分析hr是什么概率(conditional probability of survival)的累积,比如三年生存分析hr昰什么率则是第1-3年每年存活概率的乘积
生存分析hr是什么分析的方法一般可以分为三类:
- 参数法:知道生存分析hr是什么时间的分布模型然後根据数据来估计模型参数,最后以分布模型来计算生存分析hr是什么率
- 非参数法:不需要生存分析hr是什么时间分布根据样本统计量来估計生存分析hr是什么率,常见方法Kaplan-Meier法(乘积极限法)、寿命法
- 半参数法:也不需要生存分析hr是什么时间的分布但最终是通过模型来评估影響生存分析hr是什么率的因素,最为常见的是Cox回归模型
而生存分析hr是什么曲线(survival curve)则是将每个时间点的生存分析hr是什么率连接在一起的曲线一般随访时间为X轴,生存分析hr是什么率为Y轴;曲线平滑则说明高生存分析hr是什么率反之则低生存分析hr是什么率;中位生存分析hr是什么率(median survival time)越长,则说明预后较好
简单看下Kaplan-Meier方法是怎么计算的:
- S(ti?1)指在ti?1年还存活的概率
- ni指在在ti年之前还存活的人数
- di指在事件发生的人数
如果想更加通俗的了解生存分析hr是什么率/生存分析hr是什么曲线/乘积极限法等概念可以看,比教科书版的解释通俗易懂多啦
最后来看下如何用R來做生存分析hr是什么分析
使用R包自带的测试数据
列名分别是(抄一下了):
接着用Surv()
函数创建生存分析hr是什么数据对象(主要输入生存分析hr昰什么时间和状态逻辑值)再用survfit()
函数对生存分析hr是什么数据对象拟合生存分析hr是什么函数,创建KM(Kaplan-Meier)生存分析hr是什么曲线
具体每个列的含义洳下(再抄一下):
根据上述fit
结果我们可以将KM生存分析hr是什么数据进行可视化,主要使用Survminer包的ggsurvplot()
函数如下(这里我们在survfit()函数时用性别因孓进行了分组,所以生存分析hr是什么曲线有两组即两条曲线;如果不想分组,将sex换成1即可):
如果想对上图再进行自定义修改看下ggsurvplot
函數说明即可
最后如果想对不同组的生存分析hr是什么率进行假设检验(Log-Rank test)的话,可以用survdiff()
函数Log-Rank test是无参数检验,近似于卡方检验零假设是组間没有差异
不仅从图中可看出性别组间生存分析hr是什么曲线是有差异的,也从Log-Rank test的P值0.001也可得出性别组有显著差异
本文出自于转载请注明出处