应用软件工程技术中心李传艺老师、葛季栋老师与亚马逊Alexa AI沈晓宇老师共同指导2020级博士生唐泽同学,关于代码摘要的最新研究成果被国际会议ICSE’2022录用为长文(Regular Paper),论文标题为"AST-Trans: Code Summarization with Efficient Tree-Structured Attention"。2022年5月13日,唐泽同学参加ICSE2022线上会议,并在会议的Technical Track的《Program Comprehension》Session报告了该论文工作。
代码摘要任务是自动生成描述代码功能的自然语言注释。为了更好地理解代码的语义与结构信息,目前常见的解决方案是使用编码器-解码器模型对抽象语法树编码,再解码成自然语言。然而,如何并行且快速处理树结构数据仍然没有较好的解决方案。该论文提出了一个树结构编码器,对树结构数据的自注意力计算过程进行了优化,使得树结构数据的编码空间和时间复杂度可以降低到与大小成线性关系(原文图7)。该论文的核心思想是分别考虑树中的两种关系,父子和兄弟关系;并为每个节点生成对应父子关系和兄弟关系的窗口。并且设计了一个并行计算方法,GDC(Gather with Decomposed COO),该算算法可以并行计算所有节点的可视窗口,并且保证只有窗口内的节点会参与计算。
ICSE(IEEE/ACM International Conference on Software Engineering)由IEEE与ACM联合主办,是软件工程领域国际顶级会议之一。ICSE是软件工程领域研究人员、教育从业人员和工业界人士介绍与讨论领域最新思想,创新成果,研究趋势和分享经验的首要论坛之一。ICSE是CCF-A类,Core Conference Ranking A*类会议。
会议信息:https://conf.researchr.org/program/icse-2022/program-icse-2022/
该研究工作获得国家自然科学基金、江苏省自然科学基金和华为公司合作项目的资助。
欢迎并期待对该工作感兴趣的朋友们来信交流:lcy@nju.edu.cn 。