报告题目:强化学习算法基本原理及演化历史
报 告 人:郭宪
报告时间:2018年4月15日(星期日)上午10:00-11:30
报告地点:老校部二楼大会议室
邀 请 人:工业与系统工程研究所 唐立新教授
摘要:
强化学习算法被认为是实现通用人工智能最可行的框架之一。近年来强化学习算法在多个领域取得突破,其中最广为人知的应用是谷歌的AlphaGo战胜世界围棋冠军柯洁以及其进化版本AlphaZero横扫一切棋类游戏。强化学习算法无疑是人工智能时代最重要的思想之一。本次报告将会从多个层次和视角来探讨强化学习算法的基本原理并回顾强化学习算法近30年的演化历史及未来的走向趋势。在本次报告中,你会知道:
(1) 强化学习能解决什么问题
(2) 强化学习与其他机器学习的区别和联系是什么
(3) 强化学习如何去解决问题
(4) 了解强化学习算法的路线图是什么
(5) 什么是马尔科夫决策过程
(6) 强化学习算法的演化历史
(7) 强化学习算法的分类及发展趋势
本次报告适合所有专业、具有好奇心和探索精神的学生,欢迎大家前来交流。
报告人简介:
郭宪,现为南开大学计算机与控制工程学院博士后,2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016年1月获得工学博士学位,期间在国内外知名学术杂志和会议发表论文十数篇。2016年以来,主攻方向为机器人智能感知和智能决策。2018年出版《深入浅出强化学习:原理入门》一书,受到学术界和工业界广泛好评。