“综合型语言知识库”获教育部科技进步奖一等奖
2008-07-29 13:24来源: 北京大学计算语言学研究所【字体: 】【打印】【关闭

“综合型语言知识库”获教育部科技进步奖一等奖

北京大学计算语言学研究所

    “综合型语言知识库”获2007年度教育部科技进步奖一等奖。该项成果是北京大学计算语言学研究所取得的,获奖人员有:俞士汶、段慧明、孙斌、常宝宝、刘扬、朱学锋、张化瑞、陆俭明、于江生。

    1995年底朱学锋、俞士汶在一次学术会议上作了题为《自然语言处理与语言知识库》的报告(见罗振声、袁毓林主编《计算机时代的汉语和汉字研究》,清华大学出版社,1996年第一版,107-118),提出建立“综合型语言知识库”的规划,北大计算语言所师生随之付诸实践、日积月累,截至2006年底,取得了阶段性成果。综合型语言知识库的研制持续了十余年,实在是“十年磨一剑”。若从开始研制综合型语言知识库的第一块基石——《现代汉语语法信息词典》算起,北大计算语言所在建设语言知识库的征途上已走过了20多个年头(《现代汉语语法信息词典》1995年5万词版,曾获1998年度教育部科技进步奖二等奖)。

    2007年度申报奖励的“综合型语言知识库”包括以下成果:(1)现代汉语语法信息词典(8万词版),(2)汉语短语结构知识库,(3)中英文概念词典,(4)现代汉语大规模基本标注语料库,(5)汉英双语对齐语料库,(6)基于语料库的双语词典编纂系统,(7)信息提取系统(含汉语文本词语切分与词性标注软件)。它在汉语计算语言学理论、汉语语言知识形式化描述、语言知识库构建技术以及多语言知识融合技术等方面都有所创新。

    申报奖励之前,“综合型语言知识库”通过了教育部组织的以张钹院士为主任、怀进鹏教授为副主任的鉴定委员会的技术鉴定:“其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果是以汉语为核心的多语言知识库建设中最全面、最重要的研究成果,总体上达到了国际领先水平。”该项成果为推动以汉语为核心的多语言信息处理技术的发展做出了重要的贡献,并取得了显著的经济效益。作为单项技术成果,在北京大学创下了转让次数最多的纪录。

    “综合型语言知识库”的研制是在多个国家级研究项目的支持下进行的,包括973、863、国家科技攻关项目、国家自然科学基金、国家社科基金等,也得到很多大学、研究所和企业的支持以及学界先进的指导。获奖人员向所有给予过支持和帮助的部门、单位、师友致以衷心的感谢,同时也向默默奉献而未能列入获奖名单的课题组其他成员表示深深的敬意。

    “综合型语言知识库”仍在继续发展。俞士汶承担的国家重点基础研究课题(973)“文本内容理解的数据基础”的后三年(2007-2009)调整计划已将“综合型语言知识库系统”的开发列为研究工作的重点。“综合型语言知识库系统”不仅把现在的语言知识资源集成为一个有机的整体,各个成员知识库可以相互参照,互相印证,而且进一步挖掘深层的语言知识,发展概率型汉语词汇知识库,让语言知识库建设更上一层楼,同时,将有新成员不断加入“综合型语言知识库”的大家庭。


责任编辑: 纠错】【打印】【关闭
 
相关文章