摘要2021年互联网医疗用户规模为7.1亿人,同比增长7.25%。一方面,在疫情的催化下,在线健康咨询便捷度高、成本低,在线社区的影响力逐步增大,如寻医问药、好大夫等在线社区涌现了一大批问诊用户,在线社区逐步成为公众信息搜索的重要平台。另一方面,各在线社区健康信息的质量稂莠不齐,失真、劣质信息严重影响用户的信息甄别与采纳,甚至引发用户健康焦虑。基于海量的在线社区健康信息采纳行为数据,探究搜寻者对于健康信息采纳的特征偏好,有助于提高在线社区与入驻医护人员针对用户需求提高平台的信息质量,提高医患交流效率,提升用户健康素养。<br> 目前,海量的在线数据提供了丰富的信息,然而现有健康信息采纳研究主要采用问卷调查、访谈和实验的方法,分析信息特征对用户健康信息采纳意愿的影响,很少有使用机器学习算法对在线社区海量数据挖掘其信息价值。本文借鉴健康信息采纳意愿影响因素和综合问答社区信息采纳的研究成果,采集在线社区健康问答信息,基于集成学习的思想构建模型,提取用户信息采纳行为的影响因素,提高信息采纳预测准确度,推动在线社区提升在线健康咨询服务水平。具体工作如下:第一,设计爬虫程序,获取寻医问药社区问答12149条,历史文本数据1045796条,基于社区数据类型,从问答结构、社交属性和专业权威3个维度构建影响用户信息采纳的潜在影响力指标,采用RF等机器学习算法评价指标影响力、比较不同指标组合的预测准确率,提取在线社区健康信息采纳有效影响因素,并分析各指标影响力随时间变化的特征;第二,选择集成学习中的Stacking算法建立基于集成学习(Xgboost,lightgbm,随机森林等)和非集成学习(支持向量机,决策树,MLP等)及混合分类器的模型,以ROC曲线、准确度、F1、Recall为评价指标,比较不同模型组合的分类预测效果,分析发现Stacking集成模型可以有效提高分类预测的准确率,进一步,验证平台的可移植性,获取快速问医生问答数据1.6万余条,探究Stacking集成模型在快速问医生平台中的表现力。第三,基于影响在线社区健康信息采纳有效影响因素,从在线社区和平台入驻医护人员的视角提出在线健康咨询服务提升策略,平台入驻医护人员应选择简洁通俗的语言提高与问诊用户的交流效率,并加强互动提高影响力、更好服务于问诊用户;在线社区可采用集成Stacking模型提高医护人员问答被采纳预测准确率,从而提高向问诊用户精准推送的效率。
更多相关知识
- 浏览0
- 被引1
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文