泛化类型的机读词典属性信息抽取 

为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇...
《计算机应用与软件》  2011年 第04期 下载次数(64)| 被引次数(2)

一种基于贝叶斯分类与机读词典的多义词排歧方法 

一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下...
《计算机应用》  2006年 第06期 下载次数(251)| 被引次数(13)

一种生成机读词典的方法 

论文首先分析了词典的现状,提出了一种将现有词典转换成XML形式的机读词典方法,该方法分两步实现现有词典转换成数据库,再将数据库转换成为XML形式的词典。并提出了一套适合于词典标注的中文XML的词汇表,利用它对词典进行标注,使词典的可读性得到很大的提高。最后初步实现了一个汉语词典的集成处理系统。
《计算机工程与应用》  2005年 第03期 下载次数(76)| 被引次数(0)

机读词典快速检索杂凑算法的实现 

本文按照参考文献I给出的词汇T-Y码,T-Z码和机读词典Hash索引文件的定义以及在Hash索引文件中冲突次数的计算公式和处理冲突的策略,为一个实用的机读词典建立了各级索引文件,试验结果具有参考价值。
《计算机系统应用》  1996年 第01期 下载次数(29)| 被引次数(1)

一种快速检索机读词典的杂凑算法 

给出了词汇的T—Y码,T—Z码和机读词典T索引文件的定义,提出了T索引文件中冲突次数的计算公式和处理冲突的策略。本文对计算语言学的研究有一定价值。
《现代电子技术》  1995年 第01期 下载次数(27)| 被引次数(1)

机读词典与百科全书 

系统发展公司(System Development Corp.)在1966年至1968年间拟定了一个《英语词汇结构调查》计划,开创了计算机词法(computer morphology)研究的新天地。根据这项计划,专家们用计算机编制了两本词典:《梅里安-韦伯斯特第七版大学新字典》(Merrian-Webster ...
《辞书研究》  1989年 第04期 下载次数(25)| 被引次数(0)

利用多种机读资源建造汉语语义机用词典的方法研究 

利用多种机读资源建造汉语语义机用词典的方法研究;;本项目主要研究了机读语义词典的构建问题,探索描述汉语词汇意义的最小粒度知识、描述词汇的属性分类及其在概念上构成的层次结构。根据现代汉语词典、现代汉语通用词典和同义词词林等三部词典中所收词的同现信息将词划分为不同的集合,提出了机用语义词典采用分级收...
山西大学  科技成果  2009年 下载次数(3)| 被引次数(0)