机器翻译还是人工翻译?——浅析《黄帝内经·素问》双字格养生术语机译错误人工评测 

限定语言内机读术语库的创建与维护是机器翻译系统开发的一个重要组成部分。能否借助机器翻译技术有效、快速、准确地翻译中医养生术语是我国传统中医养生概念顺利传播到世界的关键步骤。本文以《黄帝内经·素问》养生篇章中双字格术语为基础,对SYSTRAN机器译文和我国中医英语专家李照国的译文进行平行对比研究,人工评测了SYSTRAN...
《医学争鸣》  2016年 第04期 下载次数(467)| 被引次数(2)

融合语言学知识与统计方法的汉语分词 

笔者介绍了一种汉语分词框架,能够综合利用语言学知识与统计方法对输入的汉语句子实施词汇切分。首先,根据机读词典从汉语句子中切分出可信度最高的单词;然后,使用统计方法从大规模语料库中提取高频出现的元组,并利用这些元组对汉语句子进行词汇切分;最后,消除两种词汇切分结果中的歧义。
《信息与电脑(理论版)》  2016年 第08期 下载次数(56)| 被引次数(1)

基于平行语料的查询翻译词典改进方法研究 

面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。...
《图书情报工作》  2011年 第20期 下载次数(165)| 被引次数(3)

概念内涵属性计算研究 

当今计算语言学界语义处理方兴未艾,中文信息处理的深度也在不断增加,研究内容从词法到句法,到语义,再到语用。但是,中文在句法处理阶段就遇到了很大的困难。究其原因,是因为中文缺乏形态变化,词类和句法成分没有严格的对应关系,所以并不适合印欧语系的句法理论。中文的特点是以名词为中心,表现形式是概念的直接耦合。因此,对于中文的处...
上海交通大学  博士论文  2011年 下载次数(303)| 被引次数(11)

泛化类型的机读词典属性信息抽取 

为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇...
《计算机应用与软件》  2011年 第04期 下载次数(64)| 被引次数(2)

词义刻画与词义识别 

为了改善词义识别的效果,使词义识别技术水平获得实质性的提高,需要考察词义刻画与词义理解之间的关系,确定是否有必要重新刻画词语的词义,需要从理论和实验角度进行探讨。从语言学角度分析了影响词义刻画的各种因素,并设计和实现了人机词义识别的对比实验,借以揭示词义刻画粒度大小与词义识别精度之间的关系,进而说明调整词义刻画粒度的必...
《计算机工程与设计》  2011年 第01期 下载次数(75)| 被引次数(2)

基于统计学习的词义识别方法研究 

如何解决语言的歧义问题一直困扰着自然语言处理技术的研究人员。语言的歧义最重要的一个表现就是一词多义现象。如何根据歧义词出现的上下文语言环境识别出正确词义是词义识别要解决问题。在自然语言理解领域,词义识别是应用基础研究课题,也是自然语言理解的重点和难点之一。 早期的词义识别研究以基于规则的方法为主,近些年来随着计...
哈尔滨工程大学  博士论文  2011年 下载次数(414)| 被引次数(1)

现代汉语“V+N”序列关系的平行处理 

目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同结构关系的动词和名词相互间的制约规则,再分别依据v+n中汉语名词、动词的语义在英语译文中的具...
《计算机工程与应用》  2010年 第30期 下载次数(127)| 被引次数(1)

基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

利用多种机读资源建造汉语语义机用词典的方法研究 

利用多种机读资源建造汉语语义机用词典的方法研究;;本项目主要研究了机读语义词典的构建问题,探索描述汉语词汇意义的最小粒度知识、描述词汇的属性分类及其在概念上构成的层次结构。根据现代汉语词典、现代汉语通用词典和同义词词林等三部词典中所收词的同现信息将词划分为不同的集合,提出了机用语义词典采用分级收词的思想;研究并实现了一...
山西大学  科技成果  2009年 下载次数(3)| 被引次数(0)

汉语动词名物化复合结构的语义解释 

网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载的内容信息,本质上都涉及自然语言的语义概念。自然语言成分结构间的语义关系计算问题是自然语言理解的关键,其本质在于计算语言结构与语言语义之间的对应关系。如何寻找新的思路及其理论和方法,使得...
上海交通大学  博士论文  2008年 下载次数(338)| 被引次数(1)

面向汉语词义自动标注研究的软件平台开发 

词语义项标注在自然语言处理领域占有重要地位。词义排歧知识的获取、基于排歧知识构建词义标注的语言模型,以及对所构建模型性能的评价就成为词语义项标注系统的三个核心问题,尤其是前两个问题非常重要,难度也很大。为更好地研究这些问题,设计并实现了一个面向词语义项标注研究的试验软件平台,应用该软件平台,很容易实现对不同语言模型、知...
《北京机械工业学院学报》  2007年 第03期 下载次数(107)| 被引次数(1)

统计学习方法在语义消歧中的应用研究 

语义歧义大量存在于自然语言中,其排歧成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标.对语义消歧这一自然语言理解领域的难点技术问题进行了探讨,分析了统计学习方法在语义消歧中的应用,阐述了统计语义消歧的有关技术,并给出一个基于贝叶斯与机读词典的语义消歧实例,取得了较高的语义消歧成功率.
《西南民族大学学报(自然科学版)》  2007年 第01期 下载次数(261)| 被引次数(6)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(248)| 被引次数(13)

从“电子词典”谈起 

Hartmann & James(1998)在他们编著的《词典学词典》中给“print dictionary”下的定义为“纸质版传统词典,相对于“electronic dictionary”或“machine-readable dictionary”。在汉语里,前者一般翻译成“电子词典”,而后者为“机器可读词典 ...
第四届全国语言文字应用学术研讨会论文集  2005-12-01 下载次数(126)| 被引次数(0)

共找到相关记录34条123下一页