语境计算在词语歧义消解中的应用 

本文回顾了国内外自动分词和词性标注技术的发展过程、面临的困难和已取得的进展。介绍了国内外语料库语言学发展的概况,以及在理论和方法上对语言研究的许多相关领域产生的影响。接着,详细地分析了自动分词和词性标注中两个重要的课题——分词消歧和兼类词歧义消解,对已有的研究成果进行了评述。 本课题以语料库...
华东师范大学  硕士论文  2006年 下载次数(259)| 被引次数(1)

基于搭配强度的复句关系词自动标识方法研究 

目前,中文信息处理的最大难题是如何实现汉语句子的自动标识。“句处理”主要分为单句处理和复句的处理,现在研究较多的是单句的处理。而复句是连接单句与篇章的桥梁,因而复句的自动标识更加重要,但复句的自动标识及其艰难,目前很少有人涉及。关系词在复句中是一个重要组成部分,一个句子的逻辑语义就主要体现在关系词上,因此,自动标识复句...
华中师范大学  硕士论文  2014年 下载次数(113)| 被引次数(3)

基于相对词频的相似度研究 

在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,相似度计算的方法目前也有很多种,针对总体研究情况来看,这些方法缺乏对文本的语义分析,本文主要考虑利用知网提供的词语标注从中文语义角度计算词语相似度,从而提高相似度的精度。 作为相似...
东北师范大学  硕士论文  2008年 下载次数(322)| 被引次数(9)

基于语境计算模型的词义消歧 

本文提出相对词频的概念,据此建立起语境计算模型,利用歧义字段前后语境词语相对词频信息对多义词进行消歧。以“黄色”和“黄金”为例进行实验,封闭测试精确率分别达到99.41%和98.93%,开放测试精确率分别达到96.37%和96.81%。试验结果证明该方法的有效性。
全国第八届计算语言学联合学术会议(JSCL-2005)论文集  2005-08-01 下载次数(110)| 被引次数(1)

基于加权关键词的领域热点与趋势分析新方法 

[目的/意义]为克服关键词绝对词频分析的局限性,以关键词多因素加权及得分排名实现领域热点与趋势探索。[方法/过程]构建年度-关键词频次矩阵,用水平加权和垂直加权处理关键词词频,设计相对词频模型,计算关键词加权综合分值,以获得更有效的关键词排序。[结果/结论]基于关键词加权排序,可以识别量高质优型、量低质优型和突变型关键...
《图书情报工作》  2018年 第18期 下载次数(289)| 被引次数(5)

基于领域相似性度量方法的统计机器翻译方法 

基于领域相似性度量方法的统计机器翻译方法,涉及机器翻译技术领域。它解决了现机器翻译技术中选取平行语料的方法中,采用余弦函数与词频来作为领域间相似性的度工具并不能反应实际的相似程度以及忽略了文字背后的语义关联,而导致选取的平行语不能反映实际含义、最终影响翻译结果准确性的问题。本发明是在现有统计机器翻译方法中,...
哈尔滨工业大学  中国专利  2014年 下载次数(0)| 被引次数(0)

基于语境信息的组合型分词歧义消解方法 

提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。
《计算机工程》  2006年 第17期 下载次数(411)| 被引次数(18)

基于相对词频的文本特征抽取方法 

评估函数对已定义类别以外的语料区分度相对较低的问题出发,结合常用的停用词表功能,提出了基于与统计量相关的相对词频作评估函数的改进模型。该模型结合了现代汉语词频统计结果,使用相对词频选择特征词,较好地区分了特定类别与类别外文本。实验结果验证了这种方法的可行性,并且取得了较好的分类效果。
《计算机应用研究》  2005年 第04期 下载次数(522)| 被引次数(31)

基于词频分布的文本隐写技术研究 

通过对同义词替换方法的深入研究,为了提高其抗检测性,本文以文本信息隐藏技术为研究方向,设计了一种抗词频统计检测分析的信息隐藏方法,并在此基础上提出了一种提高嵌入容量的文本信息隐藏方法,具体工作如下: (1)本文设计了一种抗词频统计分析攻击的文本信息隐藏方法。基于同义词替换的文本信息隐藏方法会导致同义词出现的频率发...
湖南大学  硕士论文  2013年 下载次数(152)| 被引次数(2)

异形词规范的三个基本性原则——评《第一批异形词整理表(草案)》 

运用词汇计量的方法 ,对《第一批异形词整理表 (草案 )》进行了全面的词次、词频统计 ,针对异形词的入选范围、正体词与异形词的确定标准、异形词规范的松紧度以及处在语言动态变化中的异形词所应采取的策略等问题进行了论述。归纳出异形词规范应遵循三条原则 :俗成性、实用性、指导性
《厦门大学学报(哲学社会科学版)》  2002年 第02期 下载次数(483)| 被引次数(23)

国外人工智能教育应用最新热点问题探讨 

本文通过典型案例法和文献计量法,分析近三年来(即从2007年初到2009年底),国外人工智能教育应用研究的最新进展。典型案例法表明,一个成效显著的语言和文化智能教学系统综合运用了自然语言处理、智能代理等人工智能技术。文献计量法结果则显示,智能代理和自然语言处理是人工智能教育应用中出现频次最多的两个关键词。殊途同归,特殊...
《中国电化教育》  2010年 第07期 下载次数(6478)| 被引次数(39)

基于渡越矩阵与语境计算模型的复句关系词的自动标注 

自然语言理解是人工智能领域的经典难题,目前国内外有大量的研究。在汉语信息处理领域,相应的研究应该包括有字处理、词处理、句处理、篇章处理。然而到目前为止,关于汉语理解的研究基础比较薄弱,汉语信息处理的研究基本上还停留在“字和词处理”阶段,大多数研究成果都是基于字和词的研究。对于句子的研究尤其是汉语...
华中师范大学  硕士论文  2007年 下载次数(105)| 被引次数(2)

一种同义词的挖掘方法和装置 

本发明提供了一种同义词的挖掘方法和装置,其中方法包括:从搜索日志中,搜索请求(query)及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。通过本发明能...
北京百度网讯科技有限公司  中国专利  2012年 下载次数(0)| 被引次数(0)

再论异形词规范的俗成性原则——谈异形词规范中的三个问题 

本文认为俗成性是异形词整理与规范的最重要原则 ,并对相关的三个问题作了阐述 :学理性在异形词中的正体与异形之间从来没有表现出整齐划一的规律 ,它只有在几个异形词难以分辨高下时才能起辅助作用 ;对《现汉》异形词整理的成果要充分地继承 ,但要进行新的求证 ,使之符合当代语言事实 ;对已经完全定型了的异形词进行整理与规范 ,...
《语言文字应用》  2002年 第02期 下载次数(709)| 被引次数(34)

基于Web内容挖掘的论坛发贴分类推荐技术 

随着Internet基础结构的不断扩大和其所含信息的持续增长,Internet用户感觉越来越容易在WWW服务中 资源迷向 。目前提高用户使用效率的方法有页面预取技术、站点动态重构技术和Web个性化推荐技术等。因为网站的页面内容才是用户真正感兴趣的,本文应用了一种基于Web内容挖掘的文本分类技术来实现论坛中贴子的分类推荐...
《华北科技学院学报》  2011年 第01期 下载次数(146)| 被引次数(2)

共找到相关记录51条上一页>234