- 最近
- 已收藏
- 排序
- 筛选
- 12
- 4
- 2
- 4
- 3
- 1
- 8
- 3
- 2
- 2
- 2
- 中文期刊
- 刊名
- 作者
- 作者单位
- 收录源
- 栏目名称
- 语种
- 主题词
- 外文期刊
- 文献类型
- 刊名
- 作者
- 主题词
- 收录源
- 语种
- 学位论文
- 授予学位
- 授予单位
- 会议论文
- 主办单位
- 专 利
- 专利分类
- 专利类型
- 国家/组织
- 法律状态
- 申请/专利权人
- 发明/设计人
- 成 果
- 鉴定年份
- 学科分类
- 地域
- 完成单位
- 标 准
- 强制性标准
- 中标分类
- 标准类型
- 标准状态
- 来源数据库
- 法 规
- 法规分类
- 内容分类
- 效力级别
- 时效性
【中文期刊】 张帆 刘晓峰 等 《中国中医药信息杂志》 2015年2期 38-41页ISTICCSCDCA
【摘要】 目的:研究适用于中医医案文献自动分词的方案。方法使用层叠隐马模型作为分词模型,建立相关中医领域词典及测试语料库,对语料库中古代医案文献和现代医案文献各300篇进行分词及评测。结果在未使用中医领域词典时,两类医案文献分词准确率均为75%左右;...
- 概要:
- 方法:
- 结论:
【中文期刊】 王保芳 张瑞强 《计算机科学》 2008年35卷5期 163-166页
【摘要】 词性标注是自然语言理解中很长期的问题,但对于大词性标注集的词性标注,它的标注精度还很低.为此我们应用隐含马尔可夫方法(HMM)和最大熵方法对大词性标注集的词性标注问题进行了研究,并在此基础上提出了关于词性标注的最新方法--对数线性模型,以此...
- 概要:
- 方法:
- 结论:
【中文期刊】 刘博 杜建强 等 《计算机工程》 2017年43卷7期 211-216页
【摘要】 针对传统隐马尔可夫模型(HMM)的词性标注存在捕获上下文信息有限的问题,提出一种改进的二阶隐马尔可夫模型.该模型考虑上下文联系,精确标注中医诊断文本.对训练过程中出现数组下溢的问题,采用生词处理及增加比例因子的方法对其加以修正.实验结果表明...
- 概要:
- 方法:
- 结论:
【中文期刊】 王国龙 杜建强 等 《计算机工程与设计》 2015年3期 835-841页
【摘要】 中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM ),进行词性标注,结合词法分析,采用移进归约算法...
- 概要:
- 方法:
- 结论:
【中文期刊】 何剑虎 伊胜月 等 《中国数字医学》 2025年20卷4期 61-67页ISTIC
【摘要】 目的:实现电子医疗文档在共享时的脱敏处理,保护患者隐私.方法:构建一个集成多种机器学习模型的医疗数据词法分析器,整理医疗健康领域的中文分词、词性标注和命名实体识别语料库,利用隐马尔可夫、条件随机场等自然语言处理技术和内置敏感信息特征库识别电...
- 概要:
- 方法:
- 结论:
【中文期刊】 柯丽娟 李海燕 等 《中国中医药图书情报杂志》 2025年49卷3期 5-10页
【摘要】 中医药数据挖掘系统V2.0在V1.0版本的10个功能模块基础上,围绕中医药数据标注、数据变换、机器学习建模与训练预测等数据挖掘需求,增加文本相似度对比、PubMed题录结构化、词性标注、实体和关系标注等功能模块及多分类机器学习模型构建模块和...
- 概要:
- 方法:
- 结论:
【中文期刊】 石玉敬 刘伟 等 《计算机时代》 2022年12期 1-3,8页
【摘要】 针对当前优质中医古籍语料库较为缺乏的问题,对《黄帝内经》全书156,507字进行人工标注,构建集词性标注和分词一体的《黄帝内经》中医古籍语料库,并对《黄帝内经》开展系统性的中文分词研究.基于本文语料库,采用CRF、HMM、BiLSTM-CR...
- 概要:
- 方法:
- 结论:
【中文期刊】 吕愿愿 邓永莉 等 《中国医疗器械杂志》 2016年40卷4期 245-249页MEDLINEISTIC
【摘要】 近年来,电子病历文本的分类、挖掘成为医学大数据研究的基础.该文提出一种利用实体与依存句法结构分析构特征集的电子病历短文本分类方法.首先对病历文本进行自然语言处理,包括分句、分词、词性标注以及实体提取,构建实体词典,利用TF-IDF方法构建词...
- 概要:
- 方法:
- 结论:
【中文期刊】 陈富基 袁建 等 《西藏科技》 2015年12期 20-21页
【摘要】 藏语文信息监测与发布关键技术难点主要包括网络爬虫算法设计、藏文自动分词及词性标注和藏文命名实体识别.文章围绕以上三个方面分别探索了网络爬虫技术、藏文自动分词及词性标注规则算法和藏文命名实体识别构思,致力于形成与舆情、安全相关的藏语文信息监测...
- 概要:
- 方法:
- 结论:
【中文期刊】 胡雪琴 周昌乐 等 《情报杂志》 2008年27卷8期 127-129页
【摘要】 探讨中医医案数据库的构建,寻找对医案数据库进行规范化处理的可行性方法.针对医案文献数量巨大,收录散杂的问题,提出了对历代医案进行整理,建立数据库的方法.由于针对词性标注容易引起语义缺失的问题,提出了以语义标注作为医案信息抽取规则的方案.研究...
- 概要:
- 方法:
- 结论:
【中文期刊】 胡雪琴 周昌乐 等 《计算机工程与应用》 2008年44卷35期 220-222,236页
【摘要】 探讨了中医医案数据库的构建,寻找对医案数据库进行规范化数据处理的可行性方法.针对医案文献数量巨大,收录散杂的问题,提出了对历代医案进行整理,建立数据库的方法.并且,针对词性标注容易引起语义缺失的问题,提出了以语义标注作为医案信息抽取规则的方...
- 概要:
- 方法:
- 结论:
【学位论文】 作者:赵芳芳导师:关毅 哈尔滨工业大学 计算机科学与技术 计算机科学与技术(硕士) 2014年
【摘要】 随着大数据时代的到来,“智慧医疗”已经成为全球医疗服务产业的发展趋势。作为医疗信息化的载体,电子病历蕴含大量的医疗健康知识。电子病历中的知识可以为医疗诊断、用户健康管理及医疗协调等领域提供服务。挖掘电子病历中的知识离不开自然语言处理及信息抽...
- 概要:
- 方法:
- 结论:
【中文期刊】 周扬 王振国 《中国中医药信息杂志》 2007年14卷9期 101-102页ISTICCSCDCA
【摘要】 <篇首> "中医药文献语料库系统"是汉语语料库建设中的一个分支,是在北京大学计算机语言所开发的"汉语文本切分与词性标注工具"的基础上,利用中医药专业切分词典再次加工而成,是为面向中医药文本内容理解的需要而设计研制的.其中中医药文献语料库是该系统...
- 概要:
- 方法:
- 结论:
【成果】 0100040044 山西 TP31 应用技术 公共软件服务 2000年
【成果简介】 该系统是国家863智能机主题专家组资助的项目(863-306-03-09-4)。其目标是以评测促进研究、引导研究。已两次承担863智能计算机专家组的现代汉语切词与词性标注软件的评测任务。评测工作地展顺利,达到了预测的效果。促进了切词和词性标...
【成果】 1600300086 新疆 H236 基础研究 社会人文科学研究与试验发展 2015年
【成果简介】 该研究是国家自然科学基金的“现代哈萨克语短语识别及其语块库构建技术研究”和“现代哈萨克语词级文本语料库构建技术研究”及国家教育部的“基于语料库的哈萨克语词语标注规范研究”项目支持的应用技术研究项目。哈萨克语属于阿尔泰语系突厥语族的克普恰克语...
【成果】 0601320056 北京 TP391.12 应用技术 公共软件服务 2003年
【成果简介】 项目简介:一个好的词语切分和词性标注子系统是开发任何中文文本处理系统的关键之一。北大计算语言所充分认识到汉语词法分析的重要性,并利用计算语言学的各项方法和技术成果,不断提高、改进词语切分与词性标注软件。技术指标:技术特点:该软件确立并实现的...
【成果】 1600440418 青海 G354.47 基础研究 其他计算机服务 2016年
【成果简介】 青海省自然科学基金面上项目《复杂网络与智能信息应用研究》(2012-Z-943)主要研究了以下几个内容:该项目利用超图理论构建了基于科学家和科研论文作者的科研合作超网络和引文超网络演化模型,分析了超网络模型的超度分布等特性;提出了一类网络的...
【学位论文】 作者:陈艳慧导师:杨小平 中国人民大学 管理科学与工程 管理科学与工程(硕士) 2011年
【摘要】 随着医疗行业信息化水平的不断提高,传统的、功能相对独立的各类信息系统应用已经无法满足以病人为中心的医疗服务模式发展的需要,以电子病历为核心的医院信息化建设正在逐步推进。然而,由传统信息系统运行产生的病历文本大量存在,如何有效地共享和利用这些...
- 概要:
- 方法:
- 结论: