缘起
LASSO是由1996年Robert Tibshirani首次提出,全称Least absolute shrinkage and selection operator,是一种采用了L1正则化(L1-regularization)的线性回归方法,本号前期发过多篇专题:
临床预测模型,近年已经进入爆发模式。Lasso回归也频频见于预测模型文中,松哥本期给大家总结整理LASSO在临床预测模型中的常见几种用法
用法一:
这也是最常见的用法,采用LASSO进行回归,根据10重交叉验证,筛选得到最优的模型,也就是拿到筛选得到的预测因子。
然后用筛选得到的因子,继续做后续的多因素Logsitic回归或者多因素COX回归,得到最终的临床预测模型,用于后续的区分度、校准度、临床实用度以及Nomogram的制作。
Nomogram-Based Prediction of the Risk of Diabetic Retinopathy:
A Retrospective Study
如上述这篇文章,采用LASSO回归,对19个预测因子进行筛选,最终选得7个预测因子。然后对7个预测因子构建多因素Logistic回归模型。
然后作者就基于这7个因素,构建了Nomogram,并进行了后续3个度的评价。
用法二:
当我们研究的因素较多几种常见的预测模型,可以先进行单因素Logistic或COX回归,先筛选一批可能的预测因子;
然后再采用LASSO回归进行筛选,将筛选得到的预测因子,再次进行多因素Logisti【78个搞.钱项.目】c或COX回归,确定最终模型。如下这篇文章所述:
文章:Nomogram for predicting overall survival in stage II-III colorectal cancer
作者单变量分析发现59个因素,基于专业有加上5个P>0.05的因素(大家可以学习这种表达,有的时候我们建模,发现某个专业上有意义的变量,却没有进入多因素分析阶段,可以通过这样的表述把加进去),共64个因素。
然后对这个64因素几种常见的预测模型,进行LASSO筛选,发现了6个系数不为零,也就是有意义的预测因子。
作者对【8 8个.赚钱项目】这6个预测因子,做了多因素COX回归,最终发现4个因子。
最终构建的最优模型如下,共4个因子。
然后构建了4个因子的Nomo图,以及后续的3个度的验证,就不说了!
用法三:
这种用法相对少见,就是直接用LASSOLOGIT或者LASSOCOX进行变量筛选,筛选后,用最小误差解,构建模型,无需在对LASSO筛选得到的多个因子,在进行多因素的Logistic或COX进行分析。
精鼎原创,欢迎转发,未经允许,谢绝转载!
———END———
限 时 特 惠: 【萌 心云学 堂】每日持续更新海量各大内部创业教程, 点击查看详情
站 长 微 信: 929444
本站内容均转载于互联网,并不代表副业库立场!如若本站内容侵犯了原著者的合法权益,可联系我们进行处理!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!