俞士汶(1938年12月8日-2021年11月4日),安徽宣城人,
北京大学信息科学技术学院教授、原
计算语言学研究所副所长。1964年毕业于北京大学数学力学系计算数学专业后留校任教,1993年起享受
国务院特殊津贴。长期从事计算语言学研究,是我国
中文信息处理综合型语言知识库中国中文信息学会常务理事,2011年获该学会首届终身成就奖。2021年11月4日在北京大学医院逝世,享年83岁。
人物经历
主要贡献
主持了多个国家级科研项目,如973重点基础研究项目、国家863高技术项目、国家重点科技攻关项目、
国家自然科学基金项目、国家社会科学基金项目以及国际、两岸合作项目。发表论文150多篇,著作8本。《现代汉语语法信息词典》和“综合型语言知识库”等研究成果有广泛影响。得到政府部门和北京大学的多项奖励和表彰。培养了一大批计算语言学领域的博士生、硕士生,也与一批博士后和访问学者进行了合作研究,共计近90人。
著作
俞士汶、黄居仁主编,《计算语言学前瞻》,商务印书馆,2005年8月
俞士汶主编,《计算语言学概论》,商务印书馆,2003年9月(主要撰稿人:常宝宝博士、詹卫东博士)
俞士汶,朱学锋,王惠,张化瑞,张芸芸,朱德熙,陆俭明,郭锐,《现代汉语语法信息词典详解》第二版,2003年2月
俞士汶、朱学锋、王惠、张芸芸,《现代汉语语法信息词典详解》,北京:
清华大学出版社,1998年
俞士汶、朱学锋、E.Kaske、冯志伟,《英汉对照计算语言学词语汇编》,北京:
北京大学出版社,1996年
俞士汶,《Logo语言教程》,北京:北京大学出版社,1987年
杨芙清、俞士汶,《操作系统结构分析》,北京:北京大学出版社,1986年
俞士汶,《有趣的Logo语言》,北京:
科学普及出版社,1986年
论文
【2010】俞士汶,朱学锋.语义计算与语言知识库,第11届词汇语义学研讨会CLSW2010大会报告,2010年4月21日,苏州大学
【2010】柏晓静,俞士汶,朱学锋,自然语言处理中的技术评测及关于英语专业考试的思考,《
外语电化教学》2010年第1期,3-9
【2009】俞士汶,关于副词与区别词兼类的答辩,
北京大学汉语语言学研究中心《语言学论丛》编委会编《语言学论丛(第四十期)》,39-55,北京:商务印书馆,2009年12月第1版
【2009】彭爽、俞士汶,现代汉语介词知识库的建设,《
社会科学战线》,2009年8月总第170期,247-249
【2009】俞士汶,朱学锋,支流,基于计量研究的现代汉语常用词库的构建,见张普、王铁琨主编《中国语言资源论丛(一)》,北京:商务印书馆,2009年第一版,289-301
【2009】俞士汶,隐喻与词义的计算研究及其在搜索引擎中的潜在应用,
2009百度技术创新大会特邀报告,2009年8月18日,北京
【2009】俞士汶、朱学锋、贾玉祥,汉语隐喻计算研究之概要,第十届汉语词汇语义学研讨会特邀报告,2009年7月29日,鲁东大学
【2009】俞士汶,语言随计算齐飞,《当代语言学》,2009,2,Vol.11 No.2 April 2009. 97-99
【2008】俞士汶、朱学锋、贾玉祥,汉语隐喻自动处理研究之概况,第四届文学与信息技术国际研讨会之主题报告,
香港城市大学,2008年11月11日
【2008】俞士汶、朱学锋,中文信息处理之基础研究之成果及其应用,第二届全国少数民族青年自然语言处理学术研讨会大会报告,2008年10月8日,合肥
【2008】俞士汶、朱学锋、王萌,语言资源建设:经验与建议,第一届多语言知识库研讨会(MLKB2008)之特邀报告,呼和浩特,2008年9月11日
【2008】俞士汶、朱学锋、段慧明、刘扬、吴云芳,汉语词汇语义研究及词汇知识库建设,《语言暨语言学》(台北),2008,9(2),359-380
【2008】俞士汶、朱学锋,汉语语言资源建设的理论基础与发展规划,《中国计算机学会通讯》,第4卷第2期,2008年2月,15-20(所附参考文献在14页)
【2007】俞士汶,建设综合型语言知识库的理念与成果的价值,《
中文信息学报》,2007年第6期,3-12
【2007】俞士汶、曲维光、王治敏、苏祺、金澎,机器学习与自然语言处理,见周志华和王珏主编《
机器学习及其应用2007》,北京:清华大学出版社于2007年10月(第1版),166-193
【2007】王治敏、俞士汶,n-n三字隐喻研究,见 姬东鸿、刘礼堂主编《中文计算技术与语言问题研究——第七届中文信息处理国际会议论文集》,北京:电子工业出版社,2009年9月,709-713
【2007】俞士汶、朱学锋、刘云,现代汉语广义虚词库的建设,徐杰、钟奇主编,《汉语词汇∙句法∙语音 的相互关联》,北京:北京语言大学出版社,2007年7月第1版,90-101。
该书是第二届肯特岗汉语语言学国际会议(2002年11月27日至29日)的论文集。关于该会议及其论文集的背景与历程,袁毓林教授的代前言《走向多层面互动的汉语研究》和徐杰、钟奇的“编后”都作了说明。拙文曾刊载于《汉语语言与计算学报》(新加坡),2003年3月,第13卷1期,89-98
【2007】 俞士汶、段慧明、朱学锋,计算语言学基础研究成果及其在语言教学中的应用,见李红等主编《语言·认知·信息处理》,北京:
外语教学与研究出版社,2007年5月第一版,81-90
【2007】 王治敏,王厚峰,韩爽,俞士汶,基于机器学习方法的汉语名词隐喻识别,《高技术通讯》2007,第17卷第6期,总第198期,575-580,(EI 检索源)
【2007】 俞士汶、朱学锋、刘云,面向汉语理解的汉语虚词研究,嘎日迪等主编,《民族语言文字信息技术研究》,北京:西苑出版社,2007年2月第一版,270-279
【2007】 王洪俊,施水才,俞士汶,肖诗斌,跨语言相似文档检索[J],中文信息学报,2007.1,P30-37.
【2006】 俞士汶、王治敏、朱学锋,文学语言与自然语言理解研究,见曹右琦、孙茂松主编,《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议》,北京:清华大学出版社,2006年11月第一版,72-79
【2006】 Hongjun Wang,Shiwen Yu,Shuicai Shi,Shibin Xiao,Xueqiang Lv,,Chinese-English Similar Document Retrieval,Journal of Computational Information Systems,Volume2,Number 3,2006,P1153-1159,(EI检索)
【2006】 俞士汶、柏晓静,计算语言学与外语教学,《外语电化教学》2006年第5期(总第111期) ,3-11
【2006】 俞士汶、段慧明、朱学锋,词的概率语法属性描述研究及其成果,见许嘉璐、傅永和主编,《中文信息处理——现代汉语词汇研究》第五章,广州:
广东教育出版社,2006年9月第1版,227-283
【2006】 俞士汶、朱学锋,语文现代化与汉语信息处理技术,见苏培成主编《语文现代化论丛(第六辑)》,北京:语文出版社,2006年9月第1版,176-189
【2006】 俞士汶, 民族特点的文化要求——汉字汉语民族语言进入信息系统,罗沛霖院士主编《
信息电子技术知识全书》之第15章,298-311,北京:北京理工大学出版社,2006年5月
【2006】 Wang Zhimin,Wang Houfeng,Duan Huiming,Han Shuang,Shiwen Yu,Chinese Noun Phrase Metaphor Recognition with Maximum Entropy Approach,Seventh International Conference on Intelligent Text Processing and Computational Linguistics (CICLing),Mexico,2006: p235-244,SCI 检索号:BDY33
【2006】 柏晓静、俞士汶,面向中文专著的机器辅助翻译研究,《中国翻译》(上海),第27卷总第176期,78-64,2006年第2期
【2005】 Byeong-Kwu Kang,Bao-Bao Chang,Yi-Rong Chen and Shi-Wen Yu,Extracting Terminologically Relevant Collocations in the Translation of Chinese Monograph,Proceedings of 2nd International Joint Conference on Natural Language Processing (IJCNLP 2005,Jeju,Korea),Lecture Notes in Computer Science Vol 3651,pp 1017-1028,Springer,2005.,SCI
【2006】 王洪俊,施水才,俞士汶,吕学强,词义演化的计算方法研究[J],广西师范大学学报,第24卷,第四期,2006,P183-1865.
【2006】 李芸,张化瑞,王洪俊,俞士汶,《人民日报》中的成语频度和匀度考察[A],第七届汉语词汇语义学研讨会,2006
【2005】 Byeong-Kwu Kang,Yi-Rong Chen,Bao-Bao Chang and Shi-Wen Yu,Translating Multi Word Terms into Korean from Chinese Documents,Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering (IEEE NLP-KE ’05),pp 449– 454,Wuhan,China,2005.
【2005】 俞士汶,自然语言理解研究与文学表现手法,第二届文学与信息技术国际研讨会(北京)之特邀报告,2005年12月10日,论文集2-13
【2005】 俞士汶、朱学锋、段慧明,现代汉语中的形式动词,中文计算语言学学刊(台湾),Vol.10,no.4,509-518
【2005】 词语兼类暨动词向名词漂移现象的计量分析,全国第八届
计算语言学联合学术会议(JSCL-2005),2005年8月27日—29日 南京:
南京师范大学【2005】 王洪俊,俞士汶,苏祺,施水才,肖诗斌,中文文本聚类的特征单元比较[A],第二届全国信息检索与内容安全学术会议(NCIRCS-2005),2005
支流、朱学锋、段慧明、俞士汶,中文缩略语还原技术初探,全国第八届计算语言学联合学术会议(JSCL-2005),2005年8月27日—29日 南京:南京师范大学
【2005】俞士汶、朱学锋、段慧明、张化瑞,以词义为主轴的综合型语言知识库,第六届汉语词汇语义学研讨会之特邀报告,2005年4月20-24日,厦门:厦门大学,见论文集214-221。后刊登在
【2005】俞士汶,北京大学的语言数据资源及其建设经验,“亚洲语言资源建设及语言社会规划”研讨会特邀报告,2005年3月2-3日,日本大阪外国语大学(只有*.ppt文件,未成文)
【2005】 俞士汶、朱学锋、段慧明,《现代汉语中的形式动词》,台北:《中文计算语言学期刊》CLCLP,Vol.10,No.4,Dec,2005,509-518
【2004】朱学锋、张化瑞、段慧明、俞士汶,《汉语高频词语法信息词典》的研制,《语言文字应用》,2004年第3期,98-104
【2004】俞士汶、段慧明、朱学锋、张化瑞,综合型语言知识库的建设与利用,《中文信息学报》,2004年第5期,1-10
【2003】俞士汶、苏祺、胡景贺,汉语拼音与汉语信息处理技术,见苏培成主编《信息网络时代的汉语拼音(汉语拼音方案公布45周年纪念文集) 》,7-20,北京:语文出版社,2003年10月
【2003】俞士汶,语料库与综合型语言知识库的建设,见徐波、孙茂松、靳光瑾主编《
中文信息处理若干重要问题》120-135,北京:科学出版社,2003年11月
【2003】YU Shiwen,Mining of Language-Data-Based Knowledge & Integration of Language Resources Database,CJNLP2003 (invited speech),15,Nov,2003,Japan
【2003】 俞士汶、朱学锋、刘云.现代汉语广义虚词知识库的建设.第二届肯特岗汉语语言学圆桌会议(新加坡),2002年11月27日,刊载于《汉语语言与计算学报》,2003年3月,第13卷1期,P89-98
【2003】 俞士汶、段慧明、朱学锋、孙斌、常宝宝,北大语料库加工规范:切分·词性标注·注音,《汉语语言与计算学报》,2003年6月,第13卷2期,P121-158
【2003】 俞士汶,现代汉语短语结构知识库规格说明书,《汉语语言与计算学报》,2003年6月,第13卷2期,P215-226
【2003】 俞士汶,北京大学语言知识库概况,《汉语语言与计算学报》,2003年6月,第13卷2期,P119-120
【2003】 俞士汶、胡俊峰,唐宋诗之词汇自动分析及应用,《语言暨语言学》(台北),第4卷第3期,P631-647
【2003】 俞士汶、朱学锋、刘云.虚词与汉语理解研究,此文已在“第四届词汇语义学研讨会”(2003年6月23日至7月25日,香港城市大学主办,网络会议形式)上发表,将收入会议文集。
【2003】王惠、詹卫东、俞士汶,现代汉语语义词典规范,《汉语语言与计算学报》,2003年6月,第13卷2期,P159-176
【2003】王惠、俞士汶、詹卫东,现代汉语语义词典(SKCC)的新进展,《语言计算与基于内容的文本处理》——全国第七届计算语言学联合学术会议,2003年8月,P351-356
【2003】于江生、刘扬、俞士汶,中文概念词典规格说明,《汉语语言与计算学报》,2003年6月,第13卷2期,P177-194
【2003】陈玉忠、李保利、俞士汶、兰措吉.基于格助词和接续特征的藏文自动分词方案,《语言文字应用》,2003年第1期,2003年1月,P75-82,(该文同时获第一届学生计算语言学研讨会优秀论文奖)
【2003】陈玉忠、李保利、俞士汶.藏文自动分词系统的设计与实现,《中文信息学报》,2003年第3期,P15-20
【2003】陈玉忠、俞士汶,面向信息处理的藏语虚词的语法信息表述研究,Advances in Computation of Oriental Languages——20th International Conference on Computer Processing of Oriental Languages,2003年8月,沈阳,P161-168
【2003】陈玉忠、李保利、俞士汶.基于格关系和配价的藏语动词再分类研究,《语言计算与基于内容的文本处理》——全国第七届计算语言学联合学术会议,2003年8月,P284-290
【2003】Li Baoli,Chen Yuzhong,Bai Xiaojing,Yu Shiwen.Experimental Study on Representing Units for Chinese Text Categorization.In the Proceedings of the Fourth International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2003)(Feb,2003),In A,Gelbukh (ed.): Computational Linguistics and Intelligent Text Processing,LNCS 2588,Springer-Verlag Press,P604-616.
【2003】李保利、陈玉忠、俞士汶,信息抽取研究综述,《
计算机工程与应用》,39(10),2003年4月,P1-5
【2003】李保利、俞士汶,话题识别与跟踪研究,《计算机工程与应用》,第39卷17期,2003年6月,P7-10
【2003】刘扬、于江生、俞士汶.CCD构造模型及VACOL辅助软件的设计与实现.《语言文字应用》,Vol 45,P83-88,2003年1月
【2002】胡俊峰、穗志方、俞士汶.信息科学与技术领域中的术语分类研究,The 5th East Asia Forum of Termiminology Proceedings,中国海口,2002年12月,p191-197
【2003】昝红英、俞士汶.CCD的构建及其应用.《广西师范大学学报》,2003年,第一期(第七届
中国人工智能学会联合学术会议论文集),P98-103
【2003】昝红英、苏玉梅、孙斌、俞士汶.名人网页的相关度评价.《搜索引擎与WEB挖掘进展》,首届“全国搜索引擎和网上信息挖掘学术研讨会”论文集,2003年3月14日,北京大学,P165-171
【2003】昝红英、苏玉梅、孙斌、俞士汶,基于浅层分析的网页相关度研究,《语言计算与基于内容的文本处理》——全国第七届计算语言学联合学术会议,2003年8月,P501-506
【2002】俞士汶,信息技术中的语言文化特点,苏培成等编,《语文现代化论从》,北京:商务印书馆,2002年10月,第一版,P121-138
【2002】 俞士汶、段慧明、朱学锋、孙斌,北京大学现代汉语语料1库基本加工规范,《中文信息学报》,2002年,第16卷第5期,P49-64;第6期,P58-65
【2002】王惠、詹卫东、俞士汶,“现代汉语语义词典”的开发与应用,第二届中日自然语言处理专家研讨会论文集,2002年10月,北京,P211-225
【2002】詹卫东、常宝宝、俞士汶,机器翻译与语言研究,《语言科学》,2002年11月第1卷第1期(创刊号),P47-61
【2002】 陈玉忠、俞士汶.藏文信息处理技术的研究现状与展望,第二届中日自然语言处理专家研讨会论文集(CJNLP2002),P336-346,2002年11月,北京大学计算语言研究所
【2002】Li Baoli,Chen Yuzhong,Yu Shiwen.A Comparative Study on Automatic Categorization Methods for Chinese Search Engine.In the Proceedings of the Eighth Joint International Computer Conference (Nov,2002),Hangzhou: Zhejiang University Press,ISBN 7-900647-28-7/TP.02,pages 117-120.
【2002】俞士汶、段慧明、朱学锋、孙斌,北京大学现代汉语语料库基本加工规范,《中文信息学报》,2002年,第16卷第5期,P49-64
【2002】俞士汶、朱学锋,关于汉语信息处理的认识及其研究方略,《语言文字应用》,2002年,第2期,P51-58
【2001】俞士汶,计算语言学的应用研究与基础研究,《辉煌二十年——中国中文信息学会二十周年学术会议》,P54-65,北京:清华大学出版社,2001年11月
【2001】俞士汶,网上的基础语言信息资源,《
术语标准化与信息技术》,2001年,第4期,P19-23
【2001】俞士汶、段慧明、朱学锋,汉语词的概率语法属性描述,《语言文字应用》,2001年,第3期,P21-26
【2001】俞士汶、段慧明、朱学锋,大规模标注汉语语料库开发的基本经验,新加坡:国际中文电脑学术会议ICCC2001主题报告,见论文集 56-60,2001年11月
【2001】俞士汶,计算语言学的应用研究与基础研究,见《辉煌二十年——中国中文信息学会20周年学术会议》,54-65,北京:清华大学出版社,2000年11月
【2001】 俞士汶、段慧明、朱学锋,汉语词的概率语法属性描述,《语言文字应用》,2001年第3期,21-26
【2001】俞士汶、段慧明、朱学锋,语言工程中同形及兼类词语的处理策略,见黄昌宁、张普主编,《自然语言理解与机器翻译》,211-218,北京:清华大学出版社,2001
【2001】胡俊峰、俞士汶,唐宋诗之计算机辅助深层研究,《
北京大学学报》
【2001】俞士汶、朱学锋、王惠,《现代汉语语法信息词典》的新进展, 《中文信息学报》,2001年第1期58-65
【2001】孙宏林,陆勤、俞士汶,利用遗传算法实现词类标记集的优化,《中文信息学报》,2001年第1期19-27
【2001】俞士汶、朱学锋、段慧明,大规模现代汉语标注语料库的加工规范,《中文信息学报》,2000年第6期58-64
【2000】亢世勇、朱学锋、俞士汶,《现代汉语语法信息词典》在计算机辅助语言教学中的应用,第二届中文电化教学国际研讨会论文集,P250-255,2000年:广西桂林
【2000】刘云、俞士汶、朱学锋,《现代汉语合成词语数据库的开发及应用》,第二届中文电化教学国际研讨会论文集,P273-278,2000年:广西桂林
【2000】俞士汶,信息技术中的语言文化特点,
中国语文现代化学会第4次学术年会专题报告,2000年10月25日
【2000】俞士汶、胡俊峰,唐宋诗之词汇自动分析及应用,已在台湾中研院第3届汉学会议上报告,2000年6月
【2000】Hu Junfeng,Yu Shiwen(俞士汶),The Multi-layer Language Knowledge Base of Chinese NLP,Proceedings of LREC2000,May,2000: Athens
【2000】俞士汶、段慧明、朱学锋,综合型汉语知识库及其在汉语教学中的应用,第四届全球华人教育资讯科技大会主题报告,《Proceedings of GCCCE2000》,P12-19,2000年5月:新加坡
【2000】段慧明、松井久仁於、徐国伟、胡国昕、俞士汶,大规模汉语标注语料库的制作与使用,《语言文字应用》,P72-77,2000年第2期
【1999】詹卫东、常宝宝、俞士汶,汉语短语结构定界歧义类型分析及分布统计,《中文信息学报》,1999年第3期,P9-17
【1999】孙宏林、俞士汶,浅层句法分析方法概述,陈章太等主编,《世纪之交的中国应用语言学研究》,P41-55,北京:华语教学出版社,1999年12月,又载于《当代语言学》2000.2期,74-83
【1999】朱学锋、俞士汶、李锋,汉语语素库的构造及其同语法信息词典的集成,见陈章太等主编《世纪之交的中国应用语言学研究》,P31-40,北京:
华语教学出版社,1999年12月
【1999】Sun Honglin,Lu Qin and Yu Shiwen(俞士汶),Two-level shallow parser for unrestricted Chinese text,Proceedings of JSCL-99,Nov.1999: Beijing
【1999】Sun Honglin,Yu Shiwen(俞士汶) and Lu Qin,Evaluation on Part-of-Speech tag set,Proceedings of NLPRS99,Nov,1999,Beijing
【1999】Bing Swen and Yu Shiwen,A graded approach for efficient resolution of Chinese word segmentation ambiguities,Proceedings of NLPRS99,Nov,1999: Beijing
【1999】俞士汶,自然语言理解与语法研究,见马庆株编、吕叔湘等著《
语法研究入门》,北京:商务印书馆,1999年2月第1版,P240-251
【1999】俞士汶,理解—交流的基础,《微电脑世界》周刊,1999年8月,第31期,P11-15
【1999】朱学锋、李峰、俞士汶,汉语语素库的构造及其同语法信息词典的集成,《术语标准化与信息技术》,1999年2期,P36-40
【1999】Sui Zhifang,Yu Shiwen(俞士汶),The Technology of Predicate-Head Recognition for Chinese Simple Sentences,ICCPOL'99(Japan),A1,17-22
【1999】Yu Shiwen(俞士汶),Duan Huimimng,Sui Zhifang,The Consideration on the Testing Outline of Chinese-English Machine Translation,ICMI'99(Hong Kong),IV,P38-40
【1999】俞士汶,朱学锋,李峰,现代汉语语素库的开发及应用,《世界汉语教学》,1999年2期,P38-45
【1998】詹卫东、常宝宝、俞士汶,基于词组本位语法的语义模型,《(新加坡)中文与东方语言信息处理学会学报》,Vol.8,No.1,1-10,1998年6月
【1998】俞士汶、朱学锋、李峰,现代汉语词语语法知识描述,邹家彦主编,《汉语计量与计算研究》,香港城市大学,1998年,P353-372
【1998】穗志方、俞士汶,主题概念规范化研究中的自然语言处理策略,《第二届术语学、标准化与技术传播学术会议论文集》,1998年8月,P367-374
【1998】穗志方、俞士汶、罗凤珠,宋代名家诗自动注音研究及系统实现,《中文信息学报》,1998年第2期,P44-53
【1998】穗志方、俞士汶,基于骨架依存树的语句相似度计算模型,黄昌宁著,《1998年中文信息处理国际会议论文集》,1998
【1998】刘群、俞士汶,汉英机器翻译的难点分析,黄昌宁著,《1998中文信息处理国际会议论文集》,北京:清华大学出版社,1998
【1998】穗志方、俞士汶,汉语单句谓语中心词识别知识的获取及应用,《北京大学学报》(自然科学版),第34卷2-3期,1998,P221-230
【1998】穗志方、俞士汶,面向EBMT的汉语单句谓语中心词识别研究,《中文信息学报》,1998年第4期,P39-46
【1998】俞士汶、段慧明,英汉机器翻译译文质量测试大纲,《计算机世界》,1998 年4月13日,第13期D版技术专题D10-D11
【1997】Qiang Zhou and Shiwen Yu(俞士汶),Annotating the Contemporary Chinese Corpus,International Journal of Corpus Linguistics,Volume 2,Number 2,P239-258,1997
【1997】周强、张伟、俞士汶,汉语树库的构建,《中文信息学报》,1997年第4期,P42-51
【1997】俞士汶、段慧明、田剪秋,机械文摘自动评测的原理及实现,见吴泉源主编《智能计算机接口与应用进展—第三届中国计算机智能接口与智能应用学术会议论文集》,北京:清华大学出版社,1997,P230-233
【1997】朱学锋、俞士汶、王惠,现代汉语五万词语归类的实践,《语言文字应用》,1997年第4 期,P88-94
【1997】俞士汶,语法知识在语言信息处理中的作用,《语言文字应用》,1997年第4 期,P81-87
【1997】俞士汶、朱学锋,受限汉语研究的必要性,见王均主编《语文现代化论丛第三辑》,语文出版社,1997年10月,P150-160
【1997】俞士汶,关于语言信息处理技术的展望,《计算机世界》,1997年第1期,第127版
【1997】刘岩斌、俞士汶、孙钦善,古诗研究的计算机支持环境的实现,《中文信息学报》,1997年第1期,P27-36
【1996】周强、俞士汶,汉语短语标注标记集的确定,《中文信息学报》,1996年第4期,P1-11
【1996】朱学锋、俞士汶,自然语言处理与语言知识库,见罗振声,袁毓林主编,《计算机时代的汉语汉字研究》,清华大学出版社,1996年,P107-118
【1996】Yu Shiwen(俞士汶),Luo Airong,Automatic Evaluation System-MTE and the Improvement of Its Test Suite,The Proceedings of International Conference on Chinese Computing'96,P211-217,1996: Singapore
【1996】俞士汶、朱学锋、王惠、张芸芸,现代汉语语法信息词典规格说明书,《中文信息学报》,1996年第2 期,P1-22
【1995】朱学锋、俞士汶、王惠,《现代汉语语法信息词典》的开发与应用,《COLIPS通讯》,1995年12月
【1995】俞士汶,关于受限的规则汉语的设想,见王均主编《
语文现代化论丛》,
山东教育出版社,1995年10月,P193-205
【1995】周强、俞士汶,一个人机互助的汉语语料库多级加工处理系统CCMP,见陈力为,袁琦主编《计算语言学进展与应用》,清华大学出版社,1995年,P50-55
【1994】Zhou Qiang,Yu Shiwen,Blending Segmentation with Tagging In Chinese Language Corpus Processing,Proceedings of COLING-94,Vol.2,1274-1279,Aug,1994
【1994】朱学锋、俞士汶,自动翻译电话与口语信息处理研究,《人工智能新进展》,清华大学出版社,1994年10月,P446-450
【1994】俞士汶、姜新、朱学锋,机器翻译译文质量评价的实践与分析,《中文电脑国际会议论文集》,1994年6月,新加坡
【1994】俞士汶,关于现代汉语词语的语法功能分类,《
中国计算机报》,1994年 5月31日第73版
【1993】Yu Shiwen(俞士汶),Automatic Evaluation of Output Quality for Machine Translation Systems,Machine Translation,1993,V8,P117-126,Kluwer Academic publisher,Netherlands
【1993】周强、俞士汶,一种切词与词性标注相融合的汉语语料库多级加工方法,《计算语言学研究与应用》,陈力为主编,1993年11月,P126-131
【1993】俞士汶,关于计算语言学的若干研究,《语言文字应用》,1993年 第3期 P55-64
【1992】俞士汶、朱学锋、郭锐,现代汉语语法电子词典的概要与设计,国际会议论文集ICCIP'92,P186-191
【1992】俞士汶、姜新、朱学锋,基于测试集与测试点的机译系统评估,陈肇雄主编《机器翻译研究进展》,电子工业出版社,1992年,P524-537
【1991】俞士汶,朱学锋,《多语种计算语言学术库及其开发策略》,《国际会议论文集TSST’91》, PP307-312
【1991】俞士汶,语言信息处理研究的意义与方法,中国计算机报,1991年 第18期 专家述评
【1991】Yu Shiwen(俞士汶),Zhu Xuefeng(朱学锋),A Technique of Kanji-to-Kana Conversion and its Application,国际会议论文集JAJSNLP'91,1991年,PP58-65
【1991】俞士汶,姜新,朱学锋,机译译文质量自动评价原理,国际会议MMT'91 论文集 1991年PP57-58,此文被日本《情报处理》杂志译载,并加述评 Vol.32,No.11,PP1216-1217
【1991】俞士汶,姜新,朱学锋,机器翻译译文质量自动评估系统,中国中文信息学会十周年论文集,1991年 PP314-319
【1991】朱学锋,俞士汶,《汉字假名变换技术及其应用》,《中文信息学报》,1991年 第五卷 第四期,PP35-42,1992年此文被
中国计算机学会评为优秀论文
【1991】俞士汶,姜新,朱学锋,《机译译文质量测试描述语言TDL》,《知识工程进展(1991)》,
中国地质大学出版社,1991, P116-126
【1990】Yu Shiwen(俞士汶),Application of Grammatical Parsing Technique in Chinese Input,JOURNAL OF COMPUTER SICIENCE AND TECHNOLOGY,1990,Vol.5,No,4,PP312-318
【1989】俞士汶,《现代汉语词语信息库开发工作介绍提纲》,《计算机开发与应用》,1989年第5卷第2期
【1989】俞士汶,《自然语言理解与认知科学》,《计算机信息报》,1989年51期21版
【1989】俞士汶,《自然语言的歧义与机器翻译对策》,《中文信息学报》,1989年 第三卷 第二期,PP55-60
【1989】朱学锋,朱万森,俞士汶,《简易日汉兼容系统的设计与应用》,《中文信息学报》,1989年第三卷 第一期,PP40-44,1990年此文被中国计算机学会评为表扬论文
【1989】俞士汶,《机器翻译导引》,《中国计算机用户》,1989年第9期
【1989】姜新,朱学锋,俞士汶,《机器翻译的评价与运用》,《中国计算机用户》,1989年第9期
【1989】俞士汶,《面向对象的计算》,《中国计算机用户》,1989年第8期
【1989】柳纯录,俞士汶,《面向VLSI的计算机研究动向》,《中国计算机用户》,1989年第1期
【1988】俞士汶,野口喜洋,《中国话入力にぉけろ》,《日本情报处理学会研究报告》,88-NL-68-9,1988年9月16日
【1988】俞士汶,《中文输入中语法分析技术的应用》,《中文信息学报》,1988年 第二卷 第三期,PP20-26
【1988】俞士汶,《怎样看待机器翻译译文的质量》,《计算机信息报》,1988年9月6日23版
【1988】俞士汶,《多种形式的电子词典》,《中国计算机用户》,1988年15期
【1988】俞士汶,《自然语言语义分析技术》,《中国计算机用户》,1988年第5期
【1988】俞士汶,《自然语言语法分析技术》,《中国计算机用户》,1988年第5期
【1988】俞士汶,《自然语言处理的研究对象》,《中国计算机用户》,1988年第5期
【1987】俞士汶,《Logo语言教程》,北京大学出版社,1987
【1987】金在明,俞士汶,《中文文本编辑操作的标准化》,《中文信息处理标准化国际研讨会论文集》,1987,北京,PP137-140
【1986】杨芙清,俞士汶,《操作系统结构分析》,北京大学出版社,1986
【1986】俞士汶,张乃孝,《PROLOG:原理与特征》,《计算机世界月刊》,1986年12月试刊
【1986】俞士汶,《LOGO是学习语言,不是玩具语言》,《计算机用户》,1986年7、8期合刊
【1984】俞士汶,《从比较中认识LOGO的价值》,《计算机世界》,1984年第22期
【1984】俞士汶,顾小风,《机读主题词表的存储结构》,1984年11月洛阳,全国第四次机器检索会议
【1984】俞士汶,《结构程序设计技术的实践》,《
小型微型计算机系统》,1984年第3期,PP9-14
【1984】俞士汶,《NDG公司的概况及其产品的应用》,《
微小型计算机开发与应用》,1984年第1期
【1983】《Role Of Software In The Computerized Editing And Laser Typesetting System For Chinese Books And Newspapers》,1983年10月东京ICTP会议,陈堃銶是第一作者,我是第四个署名者
【1983】俞士汶,《个人计算机的新语言LOGO》,《计算机世界》,1983年第22期
【1982】黄琳,俞士汶,《具范数约束的最小平方解问题》,《北京大学学报》,1982年第5期,此文虽是1979年6月前的工作,但因未能及时发表,以前未计入工作成果
【1982】俞士汶,《CL操作系统的内存管理》,《小型计算机与应用》,1982年第4期
【1982】俞士汶,《5924软盘子系统》,《小型计算机与应用》,1982年增刊
【1982】俞士汶,《5924软盘使用中的注意事项》,《小型计算机与应用》,1982年第3期
【1981】俞士汶,《汉字编排系统样书的编排过程》,1981年11月在大连中文信息处理讨论会上报告,《大连科技情报》1982年第2期发表。
【1981】俞士汶,陈坤球,傅国泰,《CL操作系统的设计与实现》,计算机学报,1981年,第2期,PP103-109
【1981】俞士汶(执笔),用于中文书报编辑排版的大型软件系统,中小型计算机,1981年第3期,PP1-6。俞士汶以此为题于1981年3月在北京地区软件工程讨论会上报告相关内容,随后在《中小型计算机》1981年第3期上正式发表,《
电子科学技术》1981年第10期也选登了此文,此文被
中国电子学会第二届理事会第二次会议评定为中国电子学会第一批优秀论文之一,消息见1983年1月10日的《中国电子报》第4期头版头条
出版图书
获奖记录
2008年度北京技术市场金桥奖项目二等奖,“综合型语言知识库”。
2007年度教育部科技进步一等奖,2008年1月,教育部,“综合型语言知识库”,排名第一。
第四届中国科协期刊优秀学术论文奖:《北京大学现代汉语语料库基本加工规范》(第一作者),刊于《中文信息学报》,2002年第5,6期;
中国科学技术协会,2007年1月。
北京大学杨芙清王阳元院士奖教金2004年度教学科研奖,2005年1月。
1998年度教育部科技进步二等奖,1999年1月,教育部,现代汉语语法信息词典,排名第一。
北大-君安科学家奖,1994年.
因对我国高等教育事业作出了突出贡献,自1993年起享有国务院特殊津贴。
科技进步三等奖,1993年6月,国家教委,机器翻译译文质量评估软件,排名第一。
科技进步二等奖,1992年7月,国家教委,日汉机器翻译系统,排名第五。
个人荣誉证书,1991年10月,中国机电部 ,“七五”攻关项目突出贡献。
集体荣誉证书,1991年,国家计委、国家科委中国财政部,“七五”攻关子项目负责人。
个人荣誉证书,1985年,国家经委,对计算机-激光汉字照排系统的重要贡献.
北京大学科技成果二等奖2项及三等奖1项(均排名第一)。
人物逝世
2021年11月4日下午5时9分,俞士汶先生因病在北京大学医院逝世,享年83岁。