基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

文本标注的数据库表达及应用 

词典普遍被作为一种含有大量语言学知识、常识知识的知识库。传统英语词典中一般包含词形、词性、词义、例句、习语、各种语法语用说明以及出处、领域等注解。从传统词典中提取出这些语言词汇知识并加以结构化存储,使词典中的知识利于计算机使用和处理,将有利于促进语言学、自然语言处理、机器翻译和知识工程等相关领域的研究,同时有利于语言教...
东北大学  硕士论文  2008年 下载次数(127)| 被引次数(2)

多策略英汉词对齐技术的研究 

词语对齐的目标在于指明平行文本片段之间的对应关系,最早是作为统计翻译模型的中间产物而被提出。在英汉词对齐技术研究中,词形、语义、句法的多样性和灵活性,未登录词及分词错误等不利因素,一定程度上直接或间接影响了词对齐的质量。人们尝试结合不同的信息来提高词对齐的质量并获得了很好的成绩。 迄今为止,出现了...
沈阳航空工业学院  硕士论文  2009年 下载次数(131)| 被引次数(0)

问答系统中词义消歧与关键词扩展研究 

问答系统是信息检索系统的一种高级形式。它与传统搜索引擎不同,它允许用户用自然语言进行提问,并给用户返回确切的答案,而不是返回一系列相关链接。随着自然语言处理的研究,问答系统进入新的阶段。 问答系统主要包括问句分析、信息检索和答案生成。问句分析包括分词、词性标注、词义消歧、关键词扩展等。分词和词性标注目前已有一些...
太原理工大学  硕士论文  2011年 下载次数(198)| 被引次数(3)

中英双语专利信息检索及主题聚类研究 

专利文献是规模庞大的信息源,是科技研究成果的重要表现形式,能够反映领域内科技成果与技术发展的最新动态,在科研、经济、法律等领域有举足轻重的地位。随着中国市场经济的迅猛发展与经济全球化日益深化,专利冲突与专利壁垒深深困扰着广大中国企业与研发机构,专利侵权、专利保护也成为关注重点,对外国专利的研究与利用越发重要。本文围绕中...
南京理工大学  硕士论文  2017年 下载次数(389)| 被引次数(4)

汉英词语对齐技术研究 

词语对齐是跨语言自然语言处理领域的一个基本问题,许多基于双语语料库的应用(如SBMT、EBMT、WSD、词典编纂)都需要词汇级别的对齐。 以往词语对齐方法对双语词典在对齐中的作用的研究都不够深入。本文重点研究利用由多部人读双语词典扩充双语词典的规模来改善对齐质量。在Ker的...
中国科学院研究生院(计算技术研究所)  硕士论文  2004年 下载次数(289)| 被引次数(19)

基于维基百科的微博文本语义概念扩展研究 

随着微博的日趋流行,它已经成为市场营销情报工作和名誉管理等行业的重要信息来源Twitter等微博网站日渐成为海量数据信息的发布平台,对微博的研究逐渐从挖掘单一的用户关系向挖掘微博自身的内容进行转变由于微博用语具有随意性创造性以及长度受限等特点,机器通过语义分析来智能的理解微博内容的真实含义至今仍然具有很大的挑战...
西安电子科技大学  硕士论文  2013年 下载次数(200)| 被引次数(3)

跨语言专利文本分析技术研究 

专利文献是数量巨大的信息源,在科技、经济和法律领域有着非常重要的地位。随着信息及技术全球化成为趋势,利用国外专利、防止国外专利侵权、专利保护等问题日益受到关注,而语言障碍与专利数量巨大是影响国外专利使用的最大壁垒。跨语言专利文本分析可解决准确查询国外相关专利问题并有效分析国外专利信息。目前国内系统地研究跨语...
浙江大学  硕士论文  2010年 下载次数(357)| 被引次数(4)

跨语言信息检索的查询消歧及查询扩展技术研究 

随着网络资源的全球化,不同语言国家、民族的互联网用户飞速增长。伴随着不同语言使用者对网络需求的日益加剧并且由于语言的多样性使得跨语言信息检索成为信息检索领域的研究热点。我们可以通过跨语言信息检索系统使用某种语言去查询用另外一种或若干种语言书写的文档。显然,这对于那些不擅长外语的用户具有重要意义。目前,汉英方面的跨语言信...
内蒙古大学  硕士论文  2013年 下载次数(140)| 被引次数(4)

基于知网和贝叶斯模型的词义消岐技术的研究 

词义消歧是自然语言处理中的热点和难点问题,对机器翻译、信息检索、句法分析及文本分类方面的研究,有着极其重要的理论及实践意义。现阶段词义消歧技术,因为词义知识获取中的瓶颈因素、词义消歧知识库的质量及词义消歧模型的优劣问题,消歧正确率一直不太理想。因此,如何进一步提升词义消歧的处理效果,一直是科研人员在词义消歧领域研究的动...
南京理工大学  硕士论文  2010年 下载次数(282)| 被引次数(1)

基于唐诗语料词的提取与统计分析的研究 

本文研究的内容是“基于唐诗语料库的‘词’的提取与统计分析的研究”。本文主要是采用了基于语料库统计的方法,统计作为一种工具可以用来帮助发现语言事例中隐藏的许多语言现象,统计手段的引入,使人们能够有一个相对客观的标准来判定唐诗中“词”的概念,词汇语义之间的相互关系等,基于唐诗三百首的语料库,对诗中的...
吉林大学  硕士论文  2006年 下载次数(604)| 被引次数(4)

《奥斯卡奖项汉俄英词典》编撰的实践与理论研究 

词典学作为一门应用学科,包括词典编撰的实践与理论研究两个方面。国内在单语词典和双语词典的编撰理论与实践领域的成果已颇为丰富,关于这方面的资料也很充分,市面上也不乏各式各样的单语词典和双语词典。与此同时,多语词典也日益丰富,但其相关编撰理论与实践方面的资料相对匮乏,因此本文选取对我们编写的《奥斯卡奖项汉俄英词典》的编撰实...
哈尔滨师范大学  硕士论文  2015年 下载次数(49)| 被引次数(0)

《中国图书馆分类法》兼容化研究 

一直以来,图书馆和情报领域的专家学者,都在关注各类检索语言共同应用于同一检索系统或不同检索系统,而导致检索策略多样化,进而影响到系统内信息资源共享的问题,并积极探讨解决方法。检索语言标准化应是最理想的方法,但难度太大。通过人工或自动方式,在异构检索语言词汇之间建立语义映射关系,以此实现它们的兼容转换,最终让各种检索语言...
郑州大学  硕士论文  2012年 下载次数(357)| 被引次数(2)

网络环境下图书馆信息资源描述格式的兼容性研究 

随着资源描述格式的日益增多、用户统一检索的要求日益强烈,资源描述格式兼容问题越来越突出,已成为元数据研究的热点之一。针对网络环境下图书馆资源描述格式的兼容性问题,本文进行了比较系统的研究。全文共分四个部分: 第一部分,图书馆信息资源描述格式兼容的必要性研究。探讨了网络环境下图书馆信息资源描述格...
武汉大学  硕士论文  2004年 下载次数(456)| 被引次数(3)

基于多知识源的词义消歧知识库构建 

词义消歧是自然语言处理任务的重要环节,影响计算机对文本语义的理解。从规则到概率模型,从表面的搭配到语义层面的理解,词义消歧方法不断深入语言的本质,越来越符合人类的认知模型。词义消歧的知识也可以从机读词典、义类词典、语料库等知识源中通过不同的方法获取。因此,有必要将这些可用于词义消歧的知识提取出来,构建不同的知识库,将这...
北京信息科技大学  硕士论文  2012年 下载次数(104)| 被引次数(2)

共找到相关记录1206条12345678910下一页