一种建立中文概念分类关系的新算法 

该文总结了本体概念之间的分类关系研究现状,提出了一个通用且独立于领域的自底向上建立中文概念之间的分类关系的分级模型和算法,算法充分考虑了中文自身的特点,通过生成领域词汇的语义森林并利用现有的语义词典或机读词典进行语义森林的整合。通过实验得到了比较完整的概念间的分类关系,由此证明算法是可行的和有效的。
《计算机工程与应用》  2004年 第36期 下载次数(227)| 被引次数(25)

词义消歧研究的现状与发展方向 

1 词义消歧及其应用词义是词汇在一定的语言环境下反映的特定语言现象。它能够明确地表达该词汇在该语境下表达的语义属性如感知、行为和情绪等;表达该词汇与相关词汇之间的关系;并且表达该词汇所特有的知识及常识性的知识。透过词义,人们将能运用自己的思维描述该语言现象,对其进行推理,或者为指代词从上下文中找到指代物。在自然...
《计算机科学》  2001年 第09期 下载次数(392)| 被引次数(21)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(250)| 被引次数(13)

基于Word Net和How Net建设双语语义词典 

针对当前语义信息往往需要手工获取的现状 ,探讨了利用英语义类词典Word Net和汉语概念词典HowNet资源 ,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法 ,以改善手工添加语义类带来的低效率和不一致性等问题。实验表明 ,该方法向英汉双语机读词典ECDic2K的 35 84 8词条译文项自动添加语...
《高技术通讯》  2001年 第12期 下载次数(422)| 被引次数(13)

概念内涵属性计算研究 

当今计算语言学界语义处理方兴未艾,中文信息处理的深度也在不断增加,研究内容从词法到句法,到语义,再到语用。但是,中文在句法处理阶段就遇到了很大的困难。究其原因,是因为中文缺乏形态变化,词类和句法成分没有严格的对应关系,所以并不适合印欧语系的句法理论。中文的特点是以名词为中心,表现形式是概念的直接耦合。因此,对于中文的处...
上海交通大学  博士论文  2011年 下载次数(303)| 被引次数(11)

统计学习方法在语义消歧中的应用研究 

语义歧义大量存在于自然语言中,其排歧成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标.对语义消歧这一自然语言理解领域的难点技术问题进行了探讨,分析了统计学习方法在语义消歧中的应用,阐述了统计语义消歧的有关技术,并给出一个基于贝叶斯与机读词典的语义消歧实例,取得了较高的语义消歧成功率.
《西南民族大学学报(自然科学版)》  2007年 第01期 下载次数(261)| 被引次数(6)

基于义类的无导词义消歧方法的研究 

词义消歧在自然语言处理的许多应用领域都起着十分重要的作用。为了适用于大规模的词义消歧,提出了一种无导的学习方法。基于向量空间模型,结合机读词典和义类词典建立从义项到义类的映射关系,再利用义类知识在语料库中无导学习消歧特征,最后利用这些特征实现词义消歧。
《计算机应用研究》  2005年 第04期 下载次数(232)| 被引次数(5)

关于计算词典 

计算词典学 (ComputationalLexicography)是一门新兴的、跨领域的学科。语言学、词典学的发展为其打下了坚实的理论基础 ,计算机科学、计算语言学、语料库语言学及语料库的发展为其实现自己的目标提供了强有力的技术和资源保障。本文仅就该学科的研究对象、手段及预期效果等进行探讨。
《辞书研究》  2003年 第05期 下载次数(259)| 被引次数(5)

基于平行语料的查询翻译词典改进方法研究 

面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。...
《图书情报工作》  2011年 第20期 下载次数(165)| 被引次数(3)

机器翻译还是人工翻译?——浅析《黄帝内经·素问》双字格养生术语机译错误人工评测 

限定语言内机读术语库的创建与维护是机器翻译系统开发的一个重要组成部分。能否借助机器翻译技术有效、快速、准确地翻译中医养生术语是我国传统中医养生概念顺利传播到世界的关键步骤。本文以《黄帝内经·素问》养生篇章中双字格术语为基础,对SYSTRAN机器译文和我国中医英语专家李照国的译文进行平行对比研究,人工评测了SYSTRAN...
《医学争鸣》  2016年 第04期 下载次数(469)| 被引次数(2)

词义刻画与词义识别 

为了改善词义识别的效果,使词义识别技术水平获得实质性的提高,需要考察词义刻画与词义理解之间的关系,确定是否有必要重新刻画词语的词义,需要从理论和实验角度进行探讨。从语言学角度分析了影响词义刻画的各种因素,并设计和实现了人机词义识别的对比实验,借以揭示词义刻画粒度大小与词义识别精度之间的关系,进而说明调整词义刻画粒度的必...
《计算机工程与设计》  2011年 第01期 下载次数(75)| 被引次数(2)

泛化类型的机读词典属性信息抽取 

为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇...
《计算机应用与软件》  2011年 第04期 下载次数(64)| 被引次数(2)

基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

关于机器翻译系统未来的方向 

从实用的机器翻译系统开发开始,时间大约已过去20年了.在此期间,有许多机器翻译系统问世.本文想就今后的机器翻译系统的方向进行一些讨论.
自然语言理解与机器翻译——全国第六届计算语言学联合学…  2001-08-01 下载次数(60)| 被引次数(2)

融合语言学知识与统计方法的汉语分词 

笔者介绍了一种汉语分词框架,能够综合利用语言学知识与统计方法对输入的汉语句子实施词汇切分。首先,根据机读词典从汉语句子中切分出可信度最高的单词;然后,使用统计方法从大规模语料库中提取高频出现的元组,并利用这些元组对汉语句子进行词汇切分;最后,消除两种词汇切分结果中的歧义。
《信息与电脑(理论版)》  2016年 第08期 下载次数(56)| 被引次数(1)

共找到相关记录34条123下一页