资源导航
- 期刊
- 学位
- 会议
- 视频
- 专利
- 成果
- 标准
- 法规
知识库
评价分析
临床指南
医事流
学术频道
合作专区

我的积分：0

退出

所属机构：

账户余额：查看

充值

包时套餐：更多

会员中心

学术中心

我的订阅

我的收藏
登录/注册
- 会员中心
- 学术中心
通知
会员
简体
- 简体
- 繁體
- English

|

|

|

|

|

我的积分：0

所属机构：

账户余额：查看

充值

包时套餐：更多

会员中心

学术中心

我的订阅

我的收藏

医学文献 >>

检索发现
增强检索

知识库 >>

临床诊疗知识库
中医药知识库

评价分析 >>

机构
作者

默认

全部期刊外文

学位会议专利

成果标准法规

×

更多

在国内外文献保障系统中检索

热搜词：

换一批

二次检索
检索历史

论文期刊

取消

高级检索

检索历史清除

首页 > 计算机科学与探索 > 基于Spark的序列数据质量评价

基于Spark的序列数据质量评价

Evaluation of Sequential Data Quality Using Spark

导出在线阅读解读下载全文终端阅读

二维码有效期 120s

注：终端设备浏览有效期：

学术成果认领

打印收藏纠错

摘要随着序列数据在实际中的广泛应用,序列数据质量评价成为学术、工业等众多领域的热门研究问题.目前主流的序列数据质量评价方法是基于概率后缀树模型进行数据质量评价,然而这种方法难以实现对大规模数据的处理.为解决此问题,提出了基于Spark的序列数据质量评价算法STALK(sequential data quality evaluation with Spark),并且采用了改进的剪枝策略来提高算法效率.具体地,在Spark平台下,利用大规模序列数据高效建立生成模型,并根据生成模型对查询序列的数据质量进行快速评价.最后通过真实序列数据集验证了STALK算法的有效性、执行效率和可扩展性.

更多

作者韩超 ^[1] 段磊 ^[2] 邓松 ^[3] 王慧锋 ^[1] 唐常杰 ^[1] 学术成果认领

作者单位四川大学计算机学院,成都,610065 ^[1] 四川大学计算机学院,成都 610065;四川大学华西公共卫生学院,成都 610041 ^[2] 南京邮电大学先进技术研究院,南京,210003 ^[3]

关键词数据质量概率后缀树 Spark 并行计算 data quality probabilistic suffix tree Spark parallel computing

分类号 TP391

栏目名称

数据库技术

DOI 10.3778/j.issn.1673-9418.1609008

发布时间 2017-07-05（万方平台首次上网日期，不代表论文的发表时间）

浏览1
被引3
下载0

计算机科学与探索

计算机科学与探索

2017年11卷6期

897-907页

相似文献

中文期刊
外文期刊
学位论文
会议论文

浏览1
被引3
下载0

计算机科学与探索

计算机科学与探索

2017年11卷6期

897-907页

相关期刊

法律状态公告日	法律状态	法律状态信息

特别提示：本网站仅提供医学学术资源服务，不销售任何药品和器械，有关药品和器械的销售信息，请查阅其他网站。

客服热线：4000-115-888 转3 (周一至周五：8:00至17:00)
|
客服邮箱：yiyao@wanfangdata.com.cn

违法和不良信息举报电话：4000-115-888，举报邮箱：problem@wanfangdata.com.cn，举报专区

官方微信

万方医学小程序

关于我们网站地图知识产权

北京万方数据股份有限公司

万方数据电子出版社

京ICP证010071号

京公网安备11010802020237号

京ICP备08100800号-1

网信算备10108958340801240023号

违法和不良信息举报电话：4000-115-888，举报邮箱：problem@wanfangdata.com.cn，举报专区

new医文AI 翻译充值订阅收藏移动端

官方微信

万方医学小程序

调查问卷