Logistic回归变量筛选及回归方法选择实例分析
Selection for Independent Variables and Regression Method in Logistic Regression:An Example Analysis
摘要目的 探讨多因素Logistic回归分析中自变量筛选及逐步回归方法选择应注意的问题.方法 针对冠心病危险因素病例对照调查数据(年龄X1、高血压史X2、高血压家族史X3、吸烟X4、高血脂史X5、动物脂肪摄入X6、体重指数X7、A型性格X8、冠心病Y),采用6种逐步回归变量筛选方法,进行多因素Logistic回归分析,比较不同方法筛选危险因素的差异性.结果 单因素分析可见,冠心病组与非冠心病组的年龄分布无明显差异(P=0.116),而多因素Logistic回归分析显示,相对于65岁以上人群,低年龄组为保护因素[OR<45=0.100,(0.000,0.484),P=0.020;OR45~54=0.051,(0.003,0.975),P=0.048].将年龄定义为分类变量进行分析,筛选出的冠心病危险因素为动物脂肪摄入X6、A型性格x8、高血压史X5和年龄X1(P<0.05);同时将年龄X1当作连续性变量进行分析,结果显示年龄X1无统计学意义(P=0.053).6种逐步回归变量筛选方法得到的共同的危险因素是动物脂肪摄入X6、A型性格X8;向前-条件、向前-LR、向前-Wald法另筛选出高血脂史X5为危险因素;向后-条件、向后-LR法另筛选出高血压家族史X3和年龄X1为危险因素,向后-Wald法筛另筛选出高血压史X2为危险因素.结论 多因素Logistic回归分析应采用逐步回归方法,对全部变量进行分析,包括单因素分析无统计意义的自变量;把多分类变量当作连续性变量进行分析,会损失部分信息,甚至可能漏掉重要的危险因素;当几种逐步回归变量筛选方法得到的危险因素不同时,最好结合临床和流行病学的意义以及生物学机制等专业知识,选择较为合理的结果.
更多相关知识
- 浏览313
- 被引111
- 下载5

相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文


换一批



