利用多种机读资源建造汉语语义机用词典的方法研究 

利用多种机读资源建造汉语语义机用词典的方法研究;;本项目主要研究了机读语义词典的构建问题,探索描述汉语词汇意义的最小粒度知识、描述词汇的属性分类及其在概念上构成的层次结构。根据现代汉语词典、现代汉语通用词典和同义词词林等三部词典中所收词的同现信息将词划分为不同的集合,提出了机用语义词典采用分级收词的思想;研究并实现了一...
山西大学  科技成果  2009年 下载次数(3)| 被引次数(0)

基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

汉语动词名物化复合结构的语义解释 

网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载的内容信息,本质上都涉及自然语言的语义概念。自然语言成分结构间的语义关系计算问题是自然语言理解的关键,其本质在于计算语言结构与语言语义之间的对应关系。如何寻找新的思路及其理论和方法,使得...
上海交通大学  博士论文  2008年 下载次数(336)| 被引次数(1)

机读词典快速检索杂凑算法的实现 

本文按照参考文献I给出的词汇T-Y码,T-Z码和机读词典Hash索引文件的定义以及在Hash索引文件中冲突次数的计算公式和处理冲突的策略,为一个实用的机读词典建立了各级索引文件,试验结果具有参考价值。
《计算机系统应用》  1996年 第01期 下载次数(29)| 被引次数(1)

概念内涵属性计算研究 

当今计算语言学界语义处理方兴未艾,中文信息处理的深度也在不断增加,研究内容从词法到句法,到语义,再到语用。但是,中文在句法处理阶段就遇到了很大的困难。究其原因,是因为中文缺乏形态变化,词类和句法成分没有严格的对应关系,所以并不适合印欧语系的句法理论。中文的特点是以名词为中心,表现形式是概念的直接耦合。因此,对于中文的处...
上海交通大学  博士论文  2011年 下载次数(303)| 被引次数(10)

基于统计学习的词义识别方法研究 

如何解决语言的歧义问题一直困扰着自然语言处理技术的研究人员。语言的歧义最重要的一个表现就是一词多义现象。如何根据歧义词出现的上下文语言环境识别出正确词义是词义识别要解决问题。在自然语言理解领域,词义识别是应用基础研究课题,也是自然语言理解的重点和难点之一。 早期的词义识别研究以基于规则的方法为主,近些年来随着计...
哈尔滨工程大学  博士论文  2011年 下载次数(413)| 被引次数(1)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(244)| 被引次数(12)

一种快速检索机读词典的杂凑算法 

给出了词汇的T—Y码,T—Z码和机读词典T索引文件的定义,提出了T索引文件中冲突次数的计算公式和处理冲突的策略。本文对计算语言学的研究有一定价值。
《现代电子技术》  1995年 第01期 下载次数(27)| 被引次数(1)

泛化类型的机读词典属性信息抽取 

为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇...
《计算机应用与软件》  2011年 第04期 下载次数(64)| 被引次数(2)

融合语言学知识与统计方法的汉语分词 

笔者介绍了一种汉语分词框架,能够综合利用语言学知识与统计方法对输入的汉语句子实施词汇切分。首先,根据机读词典从汉语句子中切分出可信度最高的单词;然后,使用统计方法从大规模语料库中提取高频出现的元组,并利用这些元组对汉语句子进行词汇切分;最后,消除两种词汇切分结果中的歧义。
《信息与电脑(理论版)》  2016年 第08期 下载次数(56)| 被引次数(0)

机器翻译还是人工翻译?——浅析《黄帝内经·素问》双字格养生术语机译错误人工评测 

限定语言内机读术语库的创建与维护是机器翻译系统开发的一个重要组成部分。能否借助机器翻译技术有效、快速、准确地翻译中医养生术语是我国传统中医养生概念顺利传播到世界的关键步骤。本文以《黄帝内经·素问》养生篇章中双字格术语为基础,对SYSTRAN机器译文和我国中医英语专家李照国的译文进行平行对比研究,人工评测了SYSTRAN...
《医学争鸣》  2016年 第04期 下载次数(456)| 被引次数(2)

机读词典与百科全书 

系统发展公司(System Development Corp.)在1966年至1968年间拟定了一个《英语词汇结构调查》计划,开创了计算机词法(computer morphology)研究的新天地。根据这项计划,专家们用计算机编制了两本词典:《梅里安-韦伯斯特第七版大学新字典》(Merrian-Webster ...
《辞书研究》  1989年 第04期 下载次数(25)| 被引次数(0)

一种建立中文概念分类关系的新算法 

该文总结了本体概念之间的分类关系研究现状,提出了一个通用且独立于领域的自底向上建立中文概念之间的分类关系的分级模型和算法,算法充分考虑了中文自身的特点,通过生成领域词汇的语义森林并利用现有的语义词典或机读词典进行语义森林的整合。通过实验得到了比较完整的概念间的分类关系,由此证明算法是可行的和有效的。
《计算机工程与应用》  2004年 第36期 下载次数(227)| 被引次数(25)

一种生成机读词典的方法 

论文首先分析了词典的现状,提出了一种将现有词典转换成XML形式的机读词典方法,该方法分两步实现现有词典转换成数据库,再将数据库转换成为XML形式的词典。并提出了一套适合于词典标注的中文XML的词汇表,利用它对词典进行标注,使词典的可读性得到很大的提高。最后初步实现了一个汉语词典的集成处理系统。
《计算机工程与应用》  2005年 第03期 下载次数(76)| 被引次数(0)

关于计算词典 

计算词典学 (ComputationalLexicography)是一门新兴的、跨领域的学科。语言学、词典学的发展为其打下了坚实的理论基础 ,计算机科学、计算语言学、语料库语言学及语料库的发展为其实现自己的目标提供了强有力的技术和资源保障。本文仅就该学科的研究对象、手段及预期效果等进行探讨。
《辞书研究》  2003年 第05期 下载次数(257)| 被引次数(5)

共找到相关记录34条123下一页