摘要 生物医学工程学,是20世纪50年代以来,随着电子学、材料学、信息科学和电子计算机等多种学科的进步并广泛应用于医学和生物学领域而逐渐形成和发展的,是生物学、工程学和医学紧密相结合的一个交叉学科。其为医学创造出来的新技术、新方法、新材料、新仪器设备推动医学向更高层次更快地发展,显著提高了医学水平。 作为21世纪的重点研究领域,该学科文献增长速度十分惊人,但文献信息组织无序、数量庞大。为了向生物医学工程专业人员提供有序化的信息、挖掘隐藏在文献内部的隐性知识,建立专业的生物医学工程文献自动分析系统具有重大意义。 本文概述了数据挖掘技术的基本概念、分析方法和算法,文本自动聚类算法的分析与比较;综述了国内外面向MEDLINE文献数据库的数据挖掘、知识提取研究;简述了可扩展标识语言(XML)的基本概念、文档格式及其在数据管理及数据挖掘中的应用。利用自建的生物医学工程主题词表聚类XML文献集中包含的生物医学工程文献,统计分析了二十年的文献主题分布,并设计了生物医学工程数据挖掘研究的发布网站,检索主题词表及其下聚类的相关文献。
更多相关知识
- 浏览0
- 被引6
- 下载0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文