基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

概念内涵属性计算研究 

当今计算语言学界语义处理方兴未艾,中文信息处理的深度也在不断增加,研究内容从词法到句法,到语义,再到语用。但是,中文在句法处理阶段就遇到了很大的困难。究其原因,是因为中文缺乏形态变化,词类和句法成分没有严格的对应关系,所以并不适合印欧语系的句法理论。中文的特点是以名词为中心,表现形式是概念的直接耦合。因此,对于中文的处...
上海交通大学  博士论文  2011年 下载次数(308)| 被引次数(11)

汉语动词名物化复合结构的语义解释 

网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载的内容信息,本质上都涉及自然语言的语义概念。自然语言成分结构间的语义关系计算问题是自然语言理解的关键,其本质在于计算语言结构与语言语义之间的对应关系。如何寻找新的思路及其理论和方法,使得...
上海交通大学  博士论文  2008年 下载次数(345)| 被引次数(1)

基于统计学习的词义识别方法研究 

如何解决语言的歧义问题一直困扰着自然语言处理技术的研究人员。语言的歧义最重要的一个表现就是一词多义现象。如何根据歧义词出现的上下文语言环境识别出正确词义是词义识别要解决问题。在自然语言理解领域,词义识别是应用基础研究课题,也是自然语言理解的重点和难点之一。 早期的词义识别研究以基于规则的方法为主,近些年来随着计...
哈尔滨工程大学  博士论文  2011年 下载次数(416)| 被引次数(1)

文本标注的数据库表达及应用 

词典普遍被作为一种含有大量语言学知识、常识知识的知识库。传统英语词典中一般包含词形、词性、词义、例句、习语、各种语法语用说明以及出处、领域等注解。从传统词典中提取出这些语言词汇知识并加以结构化存储,使词典中的知识利于计算机使用和处理,将有利于促进语言学、自然语言处理、机器翻译和知识工程等相关领域的研究,同时有利于语言教...
东北大学  硕士论文  2008年 下载次数(127)| 被引次数(2)

基于XMARC信息描述的知识标引与概念检索研究 

MARC(Machine Readable Catalogue机读目录)作为一种元数据格式,在信息描述、存储、交换、标准化和检准率方面具有不可比拟的优势。经过30多年的发展和在国内外图书馆界的广泛应用,目前仍有继续存在和发展的必要。但其专业性强、著录速度慢和结构复杂等局限性,使MARC满足不了当前...
东华大学  博士论文  2004年 下载次数(440)| 被引次数(4)

多策略英汉词对齐技术的研究 

词语对齐的目标在于指明平行文本片段之间的对应关系,最早是作为统计翻译模型的中间产物而被提出。在英汉词对齐技术研究中,词形、语义、句法的多样性和灵活性,未登录词及分词错误等不利因素,一定程度上直接或间接影响了词对齐的质量。人们尝试结合不同的信息来提高词对齐的质量并获得了很好的成绩。 迄今为止,出现了...
沈阳航空工业学院  硕士论文  2009年 下载次数(131)| 被引次数(0)

问答系统中词义消歧与关键词扩展研究 

问答系统是信息检索系统的一种高级形式。它与传统搜索引擎不同,它允许用户用自然语言进行提问,并给用户返回确切的答案,而不是返回一系列相关链接。随着自然语言处理的研究,问答系统进入新的阶段。 问答系统主要包括问句分析、信息检索和答案生成。问句分析包括分词、词性标注、词义消歧、关键词扩展等。分词和词性标注目前已有一些...
太原理工大学  硕士论文  2011年 下载次数(198)| 被引次数(3)

基于Word Net和How Net建设双语语义词典 

针对当前语义信息往往需要手工获取的现状 ,探讨了利用英语义类词典Word Net和汉语概念词典HowNet资源 ,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法 ,以改善手工添加语义类带来的低效率和不一致性等问题。实验表明 ,该方法向英汉双语机读词典ECDic2K的 35 84 8词条译文项自动添加语...
《高技术通讯》  2001年 第12期 下载次数(423)| 被引次数(13)

利用分级建库技术建造汉语语义词典 

文章介绍了立足于机读文本资源——机读《现代汉语词典》和机读《同义词词林》,分级建造以统一管理、共享数据资源为特征的汉语语义词典的研究工作。
《计算机工程与应用》  2001年 第04期 下载次数(144)| 被引次数(0)

一种生成机读词典的方法 

论文首先分析了词典的现状,提出了一种将现有词典转换成XML形式的机读词典方法,该方法分两步实现现有词典转换成数据库,再将数据库转换成为XML形式的词典。并提出了一套适合于词典标注的中文XML的词汇表,利用它对词典进行标注,使词典的可读性得到很大的提高。最后初步实现了一个汉语词典的集成处理系统。
《计算机工程与应用》  2005年 第03期 下载次数(76)| 被引次数(0)

一种建立中文概念分类关系的新算法 

该文总结了本体概念之间的分类关系研究现状,提出了一个通用且独立于领域的自底向上建立中文概念之间的分类关系的分级模型和算法,算法充分考虑了中文自身的特点,通过生成领域词汇的语义森林并利用现有的语义词典或机读词典进行语义森林的整合。通过实验得到了比较完整的概念间的分类关系,由此证明算法是可行的和有效的。
《计算机工程与应用》  2004年 第36期 下载次数(227)| 被引次数(25)

汉英词语对齐技术研究 

词语对齐是跨语言自然语言处理领域的一个基本问题,许多基于双语语料库的应用(如SBMT、EBMT、WSD、词典编纂)都需要词汇级别的对齐。 以往词语对齐方法对双语词典在对齐中的作用的研究都不够深入。本文重点研究利用由多部人读双语词典扩充双语词典的规模来改善对齐质量。在Ker的...
中国科学院研究生院(计算技术研究所)  硕士论文  2004年 下载次数(289)| 被引次数(19)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(252)| 被引次数(13)

基于维基百科的微博文本语义概念扩展研究 

随着微博的日趋流行,它已经成为市场营销情报工作和名誉管理等行业的重要信息来源Twitter等微博网站日渐成为海量数据信息的发布平台,对微博的研究逐渐从挖掘单一的用户关系向挖掘微博自身的内容进行转变由于微博用语具有随意性创造性以及长度受限等特点,机器通过语义分析来智能的理解微博内容的真实含义至今仍然具有很大的挑战...
西安电子科技大学  硕士论文  2013年 下载次数(200)| 被引次数(3)

共找到相关记录916条12345678910下一页