云技术研究中心师生研究成果被数据挖掘领域的CCF A类顶级会议 ACM SIGKDD 录用

 

   近日,我院云技术研究中心周仁杰教授带领硕士生叶浩然完成的1篇论文《HRSTORY:Historical News Review Based Online Story Discovery》被数据挖掘领域的CCF A类顶级会议SIGKDD-2025录用,SIGKDDACM SIGKDD Conference on Knowledge Discovery and Data Mining)是数据挖掘领域最权威的国际会议,SIGKDD-2025计划于202583-7日在加拿大多伦多召开,本次共收到967篇投稿,录用率约19%

   论文提出了基于历史新闻回顾的在线故事发现框架HRSTORY。框架提出了融合多层次信息的文章编码模型和句子级噪声数据遮蔽方法来获得更高质量的文章编码;提出了新闻回顾和重聚模块,对低置信度的历史新闻进行回顾重聚,不断优化聚类簇,使得框架能不断适应最新的新闻内容,得到更符合当前时间点的准确的故事簇结果,缓解了错误聚类结果会在任务中不断传递导致模型性能不断下降的问题。论文在三个数据集上进行了大量的实验,实验结果表明,本框架在线故事发现任务各项指标具有明显优势。

 

HRSTORY框架