利用多种机读资源建造汉语语义机用词典的方法研究 

利用多种机读资源建造汉语语义机用词典的方法研究;;本项目主要研究了机读语义词典的构建问题,探索描述汉语词汇意义的最小粒度知识、描述词汇的属性分类及其在概念上构成的层次结构。根据现代汉语词典、现代汉语通用词典和同义词词林等三部词典中所收词的同现信息将词划分为不同的集合,提出了机用语义词典采用分级收词的思想;研究并实现了一...
山西大学  科技成果  2009年 下载次数(3)| 被引次数(0)

基于概念图模型的词汇多源释义的融合研究 

随着计算机的普及以及互联网的迅猛发展,网络上的各种信息呈爆炸式的增长,传统的采用布尔检索模型的中文信息检索已经越来越不能满足人们的需要,以汉语内涵语义分析作为着眼点的概念信息检索成为目前中文信息检索的一个新的发展方向。基于概念图模型理论的概念信息检索包括用户需求的概念分析、概念图的标引以及概念图的匹配。其中...
上海交通大学  硕士论文  2010年 下载次数(150)| 被引次数(2)

机读词典快速检索杂凑算法的实现 

本文按照参考文献I给出的词汇T-Y码,T-Z码和机读词典Hash索引文件的定义以及在Hash索引文件中冲突次数的计算公式和处理冲突的策略,为一个实用的机读词典建立了各级索引文件,试验结果具有参考价值。
《计算机系统应用》  1996年 第01期 下载次数(29)| 被引次数(1)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(248)| 被引次数(13)

一种快速检索机读词典的杂凑算法 

给出了词汇的T—Y码,T—Z码和机读词典T索引文件的定义,提出了T索引文件中冲突次数的计算公式和处理冲突的策略。本文对计算语言学的研究有一定价值。
《现代电子技术》  1995年 第01期 下载次数(27)| 被引次数(1)

泛化类型的机读词典属性信息抽取 

为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇...
《计算机应用与软件》  2011年 第04期 下载次数(64)| 被引次数(2)

融合语言学知识与统计方法的汉语分词 

笔者介绍了一种汉语分词框架,能够综合利用语言学知识与统计方法对输入的汉语句子实施词汇切分。首先,根据机读词典从汉语句子中切分出可信度最高的单词;然后,使用统计方法从大规模语料库中提取高频出现的元组,并利用这些元组对汉语句子进行词汇切分;最后,消除两种词汇切分结果中的歧义。
《信息与电脑(理论版)》  2016年 第08期 下载次数(56)| 被引次数(1)

机器翻译还是人工翻译?——浅析《黄帝内经·素问》双字格养生术语机译错误人工评测 

限定语言内机读术语库的创建与维护是机器翻译系统开发的一个重要组成部分。能否借助机器翻译技术有效、快速、准确地翻译中医养生术语是我国传统中医养生概念顺利传播到世界的关键步骤。本文以《黄帝内经·素问》养生篇章中双字格术语为基础,对SYSTRAN机器译文和我国中医英语专家李照国的译文进行平行对比研究,人工评测了SYSTRAN...
《医学争鸣》  2016年 第04期 下载次数(467)| 被引次数(2)

机读词典与百科全书 

系统发展公司(System Development Corp.)在1966年至1968年间拟定了一个《英语词汇结构调查》计划,开创了计算机词法(computer morphology)研究的新天地。根据这项计划,专家们用计算机编制了两本词典:《梅里安-韦伯斯特第七版大学新字典》(Merrian-Webster ...
《辞书研究》  1989年 第04期 下载次数(25)| 被引次数(0)

一种建立中文概念分类关系的新算法 

该文总结了本体概念之间的分类关系研究现状,提出了一个通用且独立于领域的自底向上建立中文概念之间的分类关系的分级模型和算法,算法充分考虑了中文自身的特点,通过生成领域词汇的语义森林并利用现有的语义词典或机读词典进行语义森林的整合。通过实验得到了比较完整的概念间的分类关系,由此证明算法是可行的和有效的。
《计算机工程与应用》  2004年 第36期 下载次数(227)| 被引次数(25)

一种生成机读词典的方法 

论文首先分析了词典的现状,提出了一种将现有词典转换成XML形式的机读词典方法,该方法分两步实现现有词典转换成数据库,再将数据库转换成为XML形式的词典。并提出了一套适合于词典标注的中文XML的词汇表,利用它对词典进行标注,使词典的可读性得到很大的提高。最后初步实现了一个汉语词典的集成处理系统。
《计算机工程与应用》  2005年 第03期 下载次数(76)| 被引次数(0)

关于计算词典 

计算词典学 (ComputationalLexicography)是一门新兴的、跨领域的学科。语言学、词典学的发展为其打下了坚实的理论基础 ,计算机科学、计算语言学、语料库语言学及语料库的发展为其实现自己的目标提供了强有力的技术和资源保障。本文仅就该学科的研究对象、手段及预期效果等进行探讨。
《辞书研究》  2003年 第05期 下载次数(259)| 被引次数(5)

利用分级建库技术建造汉语语义词典 

文章介绍了立足于机读文本资源——机读《现代汉语词典》和机读《同义词词林》,分级建造以统一管理、共享数据资源为特征的汉语语义词典的研究工作。
《计算机工程与应用》  2001年 第04期 下载次数(140)| 被引次数(0)

基于Word Net和How Net建设双语语义词典 

针对当前语义信息往往需要手工获取的现状 ,探讨了利用英语义类词典Word Net和汉语概念词典HowNet资源 ,为双语机读词典ECDic2K的英语词条添加概念和语义类的自动方法 ,以改善手工添加语义类带来的低效率和不一致性等问题。实验表明 ,该方法向英汉双语机读词典ECDic2K的 35 84 8词条译文项自动添加语...
《高技术通讯》  2001年 第12期 下载次数(422)| 被引次数(13)

从“电子词典”谈起 

Hartmann & James(1998)在他们编著的《词典学词典》中给“print dictionary”下的定义为“纸质版传统词典,相对于“electronic dictionary”或“machine-readable dictionary”。在汉语里,前者一般翻译成“电子词典”,而后者为“机器可读词典 ...
第四届全国语言文字应用学术研讨会论文集  2005-12-01 下载次数(126)| 被引次数(0)

共找到相关记录31条123下一页