近日,东北大学计算机科学与工程学院赵宇海教授团队在语义代码搜索领域取得最新研究进展,论文《How to Better Utilize Code Graphs in Semantic Code Search?》被国际软件工程领域旗舰学术会议ESEC/FSE 2022(ACM SIGSOFT Symposium on the Foundation of Software Engineering/European Software Engineering Conference)长文录用(CCF A类会议)。该研究成果由赵宇海教授(通讯作者)、博士生时宇岑(第一作者)联合新加坡理工大学、新加坡管理大学、澳门科技大学和华为软件工程应用技术实验室研究人员共同完成。
该工作主要面向目前的语义代码搜索模型无法有效学习代码图结构信息的问题,提出了一种唯一且可逆的代码图-序列无损转换方法。该方法可与现有多种主流模型灵活集成,更好地利用代码图结构信息提升语义代码搜索的有效性。与现有模型相比,基于该方法提出的两种新型语义代码搜索模型GSMM和GSCodeBERT在公共评测指标上显著优于目前同类最好水平,处于领先地位,能够有效解决深度学习模型无法有效学习代码图结构信息的问题。该成果在评审过程中获得了评审人的一致好评,具有重要的研究价值和应用前景,很大程度上推进了语义代码搜索领域方向的发展。
ESEC/FSE 是软件工程领域具有最高学术地位的国际性会议之一,对投稿论文的评审非常苛刻和严格,不仅对论文在原始创新性方面有极高要求,而且还要求论文具有解决工程实际问题的实用性。据悉,这是我院首篇第一作者为东北大学的软件工程领域顶级会议论文。该成果是继去年8月,赵宇海教授及其硕士研究生王业江在中国计算机学会推荐的A类学术会议、数据挖掘领域的顶级国际学术会议KDD 2021(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)发表最新研究成果后,取得的又一重大学术成果。
上述具有突破性的研究成果的连续取得,标志着我院学者在基于人工智能的学科交叉研究领域取得了较大进展,研究水平和能力获得了国内外同行的广泛认可,有效提升了学校和学院在相关领域的学术影响力和贡献度,为今后我校学者与国际顶尖学者的交流互动奠定了良好基础。
发表评论