活动

Campus News

世界智能大会多智能体系统与深度强化学习论坛在天津大学举行

作者:编辑:来源:

  5月17日,第二届世界智能大会的多智能体系统与深度强化学习论坛在天津大学谢克昌报告厅举办。论坛由天津市教委主办,天津海河教育园管理委员会和天津大学协办,主题为“多智能体系统与深度强化学习”,作为世界智能大会的分论坛,主要围绕多智能体系统与深度强化学习进行。来自清华大学、香港中文大学、南洋理工大学等国内外高校的专家以及研究院的各位专家,还有来自全国高校的学生前来参会。论坛由天津大学郝建业教授主持,9位与会专家作了主题报告。

  

  论坛主题报告中,南京大学的高阳教授为我们分析了AI智能体系中多智能体系统的重要性,来自南洋理工大学的安波教授为我们介绍了大规模博弈计算,他指出2017年德州匹克的人机大战中获胜的Libratus的成功与近几年来最火的深度学习无关,其成功完全归功于大规模博弈计算技术在最近十年来的进展。他讨论了大规模博弈计算所面临的挑战、最近几年的在算法设计方面的主要进展、以及在德州匹克和安全领域的重大成功。展望了未来大规模博弈研究的热点及潜在应用。

  

  中国电子技术标准化研究院的王文峰主任作了题为《生物特征识别技术的标注化》的主题报告,清华大学的张崇洁教授作了题为《Towards Task Transfer and Generalization in Deep Reinforcement Learning》的报告,微软亚洲研究院的秦涛研究员作了题为《Deep Reinforcement Learning: Challenges and Opportunities》报告。香港中文大学的梁浩锋教授作了题为《Norm Non-Emergence as a Stable State in Multiagent Systems》的主题报告,中科院自动化所的赵冬斌研究员以《深度强化学习进展:从AlphaGo到AlphaGo Zero》为主题,介绍了从AlphaGo到AlphaGo Zero的深度强化学习的研究进展:简要回顾深度强化学习的主要算法, 包括深度Q网络算法、A3C算法、策略梯度算法及其他算法的相应扩展,给出AlphaGo和AlphaGo Zero的详细介绍和讨论,介绍深度强化学习在游戏、智能驾驶、机器人、医疗等领域的应用。清华大学的唐平中教授介绍了大规模应用机制设计,南京大学的俞扬教授介绍了强化学习如何从虚拟走向现实,他指出为促进强化学习在现实应用中落地,尝试连接虚拟环境与物理环境,利用虚拟环境的低代价学习适应物理环境的策略。他介绍了在虚拟环境迁移到物理环境、以及物理环境虚拟化两方面的研究进展。

  与会专家与参会人员针对多智能体系统未来研究挑战进行了讨论。一些同学针对科研过程中的疑问进行请教,专家给出了相应的解答,现场交流讨论气氛热烈。

  (编辑 赵晖 仇丁丁)