天大主页 | 设为首页 | 添加收藏
首页 > 校内新闻 > 科研 > 正文

理学院本科生科研团队再创佳绩,开发高效机器学习方法预测有机分子特性

      2022-04-18       

本站讯(通讯员 于曦)天津大学理学院化学系本科生团队开发了一种高效的机器学习方法,可以实现常见有机分子液体沸点的精准预测。

机器学习是近年来得到迅速发展的人工智能方法,在图像识别,大数据挖掘以及策略制定等方面受到越来越广泛的应用。著名的围棋智能AlphaGo就是先进的机器学习方法的代表。而机器学习技术在化学研究领域的应用也在突飞猛进的发展,特别是在化合物结构与性质预测方面展现出巨大的潜力。有机化合物的常压沸点是一个重要的物理化学量,在化工生产中具有重要参考价值。然而有机分子复杂多样的组成与结构使得沸点的预测并非易事。

1.png

理学院应用化学专业2019级的本科同学组成的研究团队经过近两年的攻关,开发出了一种高效的机器学习方法,可以实现常见有机分子液体沸点的精准预测。团队首先收集整理了大量的化合物沸点数据,构建了自己的专属的数据库,以此数据库为机器学习方法开发的基础。进一步,他们开发了一种基于集成学习的模型方法来对数据进行学习。这一模型以三个异质性模型为组件,利用可解释性描述符、回归分析描述符、分子指纹从三个不同的维度描述分子特征,采用人工神经网络和支持向量机作为模型方法,最后再将三个模型集成,从而实现对沸点的精准预测。相较传统方法,这一多组件集成模型预测精度大幅提高,适用面更宽。更重要的是,这一异质组件集成策略具有普适性,原则上可以适用于多种物理化学量的预测。日前,相关成果的论文发表于SCI期刊《化学学报》(Acta Chimica Sinica, doi: 10.6023/A22010017),2019级应用化学系刘雨泽,李昆华和黄佳兴同学为主要完成人,分子光电科学重点实验室的于曦研究员和胡文平教授为指导教师。

团队指导教师于曦研究员表示,团队在2020年的疫情期间开始接触机器学习,从零开始不断学习尝试。几位本科同学在几乎没有前人经验的条件下,在完全超出本专业学习内容的研究领域中,表现出优异的跨学科的学习与研究能力,在过去两年时间里逐步掌握了数据的收集整理技术、数据库的构建技术以及机器学习方法,最终建立了自己专属的数据库,并开发出了独特的化学性质预测的机器学习模型。目前团队正在进一步完善数据库和预测方法,相关专利也在申请中。团队计划继续扩大数据规模,涵盖更多的化学理化性质数据,并推出在线数据查询和预测服务,将研究成果推向实际应用。此外,这一成果也是天津市分子光电实验室有机光电分子数据库与人工智能开发计划的先导研究的组成部分,为光电分子智能开发提供了技术探索与技术储备。

(编辑 董玥欣 全莉)