主讲人简介:郭先平,男,教授,博士生导师,国家杰出青年基金获得者,珠江学者特聘教授,享受国务院特殊津贴专家,1987和1990年分别于湖南师范大学(数学系)获得学士与硕士学位,1996年于中南大学获博士学位,2002年于中山大学晋升为教授,2003年入选教育部优秀青年教师资助计划,2004年入选教育部新世纪优秀人才支持计划,2017年获教育部自然科学二等奖(第1完成人),2018年担任全国概率统计学会副理事长。曾到美国、英国、加拿大,澳大利亚、墨西哥以及港澳台等进行多次交流与访问,担 (曾)任国际(SCI)杂志 Advance in Applied Probability,Journal of Applied Probability, Science China Mathematics,Journal of Dynamics and Games,及国内期刊《中国科学:数学》、《应用数学学报》、《应用概率统计》、《运筹学学报》等杂志编委,研究兴趣为马氏决策过程、随机博弈、风险控制等。长期从事马氏过程和随机最优化问题的研究。在马氏决策过程(英文缩写为MDP)和随机对策(又称博弈)的研究中取得若干创新性成果和重要进展。比如:他原创性地建立了研究MDP平均最优的第三种方法---“平均最优双不等式”方法;首次建立美法学者等关注的离散时间非平稳MDP的平均最优方程;首次给出连续时间Markov对策的最优性条件和逼近算法。他的主要成果以学术论文形式发表在Ann. Appl. Probab., IEEE Trans. Autom. Control, SIAM J. Optim., SIAM J. Control Optim., Math. Oper. Res., Adv. Appl. Probab., J. Appl. Probab., J. Optim. Theory Appl., J.Theory Probab., IFAC Automat., European J. Oper. Res., Bernoulli等多种国际杂志上,并在国际顶级出版社Springer出版第一本关于连续时间MDP的英文专著。他的科研成果还得到国际同行学者发表在 SIAM J. Control Optim., Automatica, Math. Meth. Oper. Res., J. Math. Anal. Appl., Math. Reviews和Zentralblatt MATH等国际杂志上的高度肯定和公开评价。
内容摘要:In this talk we consider the optimal stopping problem for semi-Markov processes (SMPs) under the expected discount criterion. By introducing an explicit construction of semi-Markov decision processes (SMDPs), we prove the equivalence between the expected discounted SMPs and SMDPs, that is, every stopping time of SMPs can induce a policy of SMDPs such that the value functions are equal, and vice versa. Then, the existence and computation of an optimal stopping time of SMPs are given by the equivalence relation and the SMDP theory. Moreover, we show that the optimal and epsilon-optimal stopping time can be characterized by the hitting time of the sets of special states. Finally, we illustrate our results by a maintenance system.
主持人:闫理坦、张振中
撰写:张振中