- 最近
- 已收藏
- 排序
- 筛选
- 25
- 23
- 8
- 7
- 6
- 4
- 3
- 28
- 11
- 7
- 4
- 3
- 中文期刊
- 刊名
- 作者
- 作者单位
- 收录源
- 栏目名称
- 语种
- 主题词
- 外文期刊
- 文献类型
- 刊名
- 作者
- 主题词
- 收录源
- 语种
- 学位论文
- 授予学位
- 授予单位
- 会议论文
- 主办单位
- 专 利
- 专利分类
- 专利类型
- 国家/组织
- 法律状态
- 申请/专利权人
- 发明/设计人
- 成 果
- 鉴定年份
- 学科分类
- 地域
- 完成单位
- 标 准
- 强制性标准
- 中标分类
- 标准类型
- 标准状态
- 来源数据库
- 法 规
- 法规分类
- 内容分类
- 效力级别
- 时效性
【中文期刊】 王子腾 于亚新 等 《计算机应用》 2023年43卷7期 2082-2090页
【摘要】 深度强化学习算法在奖励稀疏的环境下,难以通过与环境的交互学习到最优策略,因此需要构建内在奖励指导策略进行探索更新.然而,这样仍存在一些问题:1)状态分类存在的统计失准问题会造成奖励值大小被误判,使智能体(agent)学习到错误行为;2)由于...
【中文期刊】 何倩 仝武宁 《中南民族大学学报(自然科学版)》 2022年41卷5期 586-591页
【摘要】 基于深度强化学习技术研究了智能驾驶中的路径规划问题,且在虚拟环境下进行了模拟分析,对提出的路径规划算法性能做了验证研究.提出了一种改进的经验回放机制ERDDPG(Experience Replay Deep Deterministic Po...
【中文期刊】 李雨松 徐野 等 《科技资讯》 2022年20卷20期 40-43页
【摘要】 目的 强化学习具有较强的感知能力,但是缺乏一定的决策、能力,而强化学习具有决策能力,对感知问题束手无策.因此,将两者结合起来,即为深度强化学习,优势互补,为复杂系统的感知决策问题提供了解决思路.在现实生活中,我们出行会受到多种因素的影响,人...
【中文期刊】 陆雪芳 闫玉辰 等 《磁共振成像》 2024年15卷10期 8-14,49页 ISTICPKUCSCDCA
【摘要】 目的 探讨基于磁共振深度学习重建(deep learning reconstruction,DLR)算法的心肌延迟强化(late gadolinium enhancement,LGE)提高临床未识别心肌梗死(unrecognized myo...
【中文期刊】 陈松景 吴思竹 《中国数字医学》 2024年19卷1期 33-37页 ISTIC
【摘要】 目的:采用深度强化学习方法构建老年肺癌发病风险预测模型,为有针对性地开展老年肺癌预防干预提供依据.方法:整合健康调查和基因突变数据,识别老年分层人群的肺癌发病危险因素,构建基于深度强化学习的老年肺癌发病风险预测模型.结果:60岁以上男性和女...
【中文期刊】 曲小波 余粟 《中国医学物理学杂志》 2023年40卷10期 1212-1219页 ISTICCSCD
【摘要】 为了解决U-Net算法在分割眼底图像时无法分割末梢微小血管和无法处理噪声干扰等问题,提出了一种改进的视网膜血管分割算法.首先,在U-Net算法中引入通道强化残差网络,用以优化U-Net架构,使得网络识别更多视网膜微血管.其次,引入空间注意力...
【中文期刊】 刘义 秦乃姗 等 《中国医学影像学杂志》 2022年30卷5期 457-462页 ISTICPKUCSCD
【摘要】 目的探索基于深度学习对MRI图像上乳腺强化病灶形态分类的可行性.资料与方法连续性收集并回顾分析2013年1月—2016年10月北京大学第一医院行双侧乳腺MR动态增强的290例患者的资料,使用既往研发的3D分割模型分割出乳腺中异常强化区域,由...
【中文期刊】 张昊迪 陈振浩 等 《软件学报》 2023年34卷8期 3821-3835页
【摘要】 近年来,深度强化学习在序列决策领域被广泛应用并且效果良好,尤其在具有高维输入、大规模状态空间的应用场景中优势明显.然而,深度强化学习相关方法也存在一些局限,如缺乏可解释性、初期训练低效与冷启动等问题.针对这些问题,提出了一种基于显式知识推理...
【中文期刊】 王翰林 刘嘉城 等 《中国医学物理学杂志》 2022年39卷1期 1-8页 ISTICCSCD
【摘要】 目的:对于调强放疗(IMRT)计划,优化过程较为耗时,且计划的质量取决于计划人员的经验和时间,本文探讨并实现一种无监督IMRT自动优化的方案,使其能够模拟人工操作方式进行治疗计划优化.方法:本研究基于深度强化学习框架,提出一种优化调整决策网...
【中文期刊】 张先超 赵耀 等 《通信学报》 2022年43卷2期 15-21页
【摘要】 针对无线网络多用户互相干扰的问题,通过对发射功率进行智能控制,实现干扰管理,保证多用户通信服务质量.首先,考虑复杂动态无线信道环境,建立以无线通信系统加权数据速率最大化为目标的发射功率控制模型.其次,设计以深度强化学习"行动器?评判器"为基...