首页 | 本学科首页   官方微博 | 高级检索  
     

逻辑半马尔可夫决策过程及Q学习
引用本文:王蓁蓁,王智钢. 逻辑半马尔可夫决策过程及Q学习[J]. 金陵科技学院学报, 2013, 29(2): 13-19
作者姓名:王蓁蓁  王智钢
作者单位:金陵科技学院信息技术学院,江苏南京211169;江苏省信息分析工程实验室,江苏南京211169
基金项目:金陵科技学院科研基金资助项目
摘    要:增强学习已经开始向关系增强学习发展,并且产生了许多新的算法。这些方法是将命题表达提升为关系或计算逻辑的表达。提出了一种新的表达形式,称为逻辑半马尔可夫决策过程。它是将逻辑程序与半马尔可夫过程相结合。在此框架中,抽象(状态或行动)是至关重要的,并且提出了对于逻辑半马尔可夫决策过程的Q-学习算法,给出其收敛证明。这种框架对在关系增强学习发展中处理时间连续方面提供了一个合理的基础。

关 键 词:关系增强学习  半马尔可夫  逻辑半马尔可夫  决策过程

Logical semi-Markov Decision Processes and Q-learning
WANG Zhen-zhen , WANG Zhi-gang. Logical semi-Markov Decision Processes and Q-learning[J]. Journal of Jinling Institute of Technology, 2013, 29(2): 13-19
Authors:WANG Zhen-zhen    WANG Zhi-gang
Affiliation:1,2(1.Jinling Institute of Technology,Nanjing 211169,China;2.Information Analysis Engineering Laboratoryof Jiangsu Province,Nanjing 211169,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号