本站讯(通讯员 杨晨)近日,天津大学智能与计算学部软件工程团队成果"Dependency-aware Code Naturalness"被程序设计语言领域CCF-A类会议OOPSLA 2024录用。OOPSLA(Object-Oriented Programming, Systems, Languages & Applications)在程序设计语言领域享有盛誉,是相关领域学术研究的重要参考和指导;该会议本轮共接收60篇论文。这也是天津大学在程序设计语言领域顶级会议上的首篇论文。该项成果的第一作者为软件工程团队2022级硕士研究生杨晨,指导教师为陈俊洁(通讯作者)、姜佳君。
该项成果面向代码自然性开展研究,这也是大语言模型时代下程序代码的重要属性。代码自然性反映了代码重复性和可预测性的特征,对于各种代码相关任务具有重要价值。然而,现有方法忽略了代码之间的深层语义关系(如程序依赖),无法精确衡量代码自然性。该项成果首次通过分析代码中丰富的依赖信息,提高代码自然性衡量的精度,从而提升基于代码自然性的下游任务效果,包括缺陷代码静态识别、代码大模型训练数据清洗等。此外,与现有的RoPE、分层注意力机制等学习非线性上下文的方式不同,该方法通过静态程序分析提取非线性上下文,为大语言模型时代的非线性上下文利用提供了新的选择。
智能与计算学部软件工程团队是一支年轻化、高水平团队;研究方向主要包括基础软件测试、数据驱动的软件工程、可信人工智能、程序分析、代码审查、定位与修复、开源仓库挖掘等;团队先后主持/参与国家自然科学基金优青项目、重点项目、面上项目、青年基金项目以及多项企业合作项目等,成员入选中国科协青年人才托举工程、斯坦福大学发布的全球前2%顶尖科学家年度榜单,荣获CCF优博、中国电子学会自然科学一等奖、七项会议最佳/杰出论文奖等;成果贡献于开源社区,并在华为、国家汽车技术研究中心、海信集团等企业落地。
杨晨同学曾获得ACM学生科研竞赛全球季军,本科与硕士均获得天津大学优秀毕业生和优秀学生纪念章,今年九月将继续在智能与计算学部软件工程团队攻读博士学位。
(编辑 刘晓艳 马晓芳)