摘要在当今社会,一系列新的处方药被不断投放到医疗市场,如果缺乏必要的监管,因这些药物而导致的不良反应(AdverseDrugReactions:ADR)将可能威胁公共卫生安全。2000年的一项研究报告显示,每年约有7,000例病人死于药物的ADR。目前,绝大多数对药品的售后监控都依托于官方数据库,但现有的关于ADR的报告系统存在疏漏,有研究表明,约94%的ADR在官方系统上被误报了。<br> 因此,为了解决官方ADR报告系统的局限性,有学者提出了利用Twitter上的数据进行ADR抽取以丰富数据来源从而解决该问题。Twitter每小时发布超过200万个帖子,提供了各种丰富的多模态的数据,它们为研究者提供了许多研究机会。这个社交媒体平台还涵盖了与健康相关的数据样本,帖子的内容包含各种与健康相关的信息,包括疾病经历,疾病症状和ADR。所以,Twitter可以为科学研究提供与医疗相关的重要数据,研究者可以用这些信息来了解患者的服药体验。<br> 该篇论文提出了使用图卷积(GCN)网络对社交媒体文本进行分类,以高效地从社交平台(Twitter)的推文中获取ADR信息。该模型能够正确地识别推文中的“单词”级和“短语”级的ADR,且解决了现有的顺序学习模型中的一个普遍问题—模型很难从文本中提取远程相关信息。基于现有的TextGCN模型,本文针对社交媒体和医疗类文本的特点分别在图中整合了情感信息和医学信息。在没有使用外部词嵌入的情况下,该模型在两个Twitter数据集上与多个模型进行了比较,且取得了较好的结果。它同时还有效地减少了对于预训练词向量的需求,降低了收集预训练样本所用的时间。<br> 而在应对药物相互作用(Drug-DrugInteraction:DDI)的任务上,本文以BERT为研究的基础模型,结合了实体信息并融合了高斯分布模型,在原有基础上,使模型能获取实体及实体周围的信息向量。该模型用代表全部文本信息的[CLS]向量和融合实体及其周围信息的词向量进行拼接,然后输入全连接层进行多分类。本研究为ADR的继续研究提供了部分有价值的参考,通过使模型能够自主分类,降低了ADR的发现过程中对金钱成本与人力成本的过多消耗。
更多相关知识
- 浏览0
- 被引0
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文