计算机学科部宣(文/图 沈剑平)2010 年8月23日至29日,COLING 2010(International Conference on Computational Linguistics)、CLP2010 (CIPS-SIGHAN Joint Conference on Chinese Language Processing)联合国际会议在北京国际会议中心举行。我院计算机学科部徐睿峰老师、硕士生沈剑平参加了此次会议。在CLP 大会上,徐睿锋老师以报告的形式介绍了其论文“Combine Person Name and Person Identity Recognition and Document Clustering for Chinese Person Name Disambiguation ”,沈剑平以poster的形式介绍了其论文“Chinese Word Segmentation based on Mixing Multiple Preprocessor and CRF”。
COLING是除ACL之外自然语言处理与计算语言学界的又一顶级会议,全称国际计算语言学大会,每两年举办一次。CLP是中文信息处理的重要国际会议,每两年举办一次,今年第七届CLP会议由中文信息协会和ACL SIGHAN共同组织,在北京举行。
为促进中文信息处理技术的发展,指引中文信息处理的最新研究方向,CLP2010会议组织了CIPS-SIGHAN BAKE-OFF 国际测评竞赛,今年共有包括:中文分词、句法分析、人名消歧、中文词义归纳在内的四个测评任务。我院徐睿峰副教授率徐军博士生、戴祥鹰硕士生组成的团队完成的算法在人名消歧任务中取得了第2名的好成绩,硕士生沈剑平设计的算法在中文分词任务中分别取得了第2名和第5名的成绩。
人名消岐的目标在于区分出大量文档中具有相同或者相似人名的不同真实人物,并根据识别出的真实人物对大量文档进行分类处理。人名消岐是 Information Retrieval和Web Mining领域中亟待解决的关键研究问题,吸引了国际上广泛的研究关注。中文分词是中文信息处理的基础,一直以来是中文信息处理领域的研究热点。今年的SIGHAN中文分词竞赛共有包括CMU、台湾中央研究院、昆士兰理工大学、哈工大在内的19家国内外科研院所参加。SIGHAN明年将作为ACL2011大会的一个workshop,在美国举行。
图为沈剑平在会议现场
|