语境计算在词语歧义消解中的应用 

本文回顾了国内外自动分词和词性标注技术的发展过程、面临的困难和已取得的进展。介绍了国内外语料库语言学发展的概况,以及在理论和方法上对语言研究的许多相关领域产生的影响。接着,详细地分析了自动分词和词性标注中两个重要的课题——分词消歧和兼类词歧义消解,对已有的研究成果进行了评述。 本课题以语料库...
华东师范大学  硕士论文  2006年 下载次数(259)| 被引次数(1)

基于搭配强度的复句关系词自动标识方法研究 

目前,中文信息处理的最大难题是如何实现汉语句子的自动标识。“句处理”主要分为单句处理和复句的处理,现在研究较多的是单句的处理。而复句是连接单句与篇章的桥梁,因而复句的自动标识更加重要,但复句的自动标识及其艰难,目前很少有人涉及。关系词在复句中是一个重要组成部分,一个句子的逻辑语义就主要体现在关系词上,因此,自动标识复句...
华中师范大学  硕士论文  2014年 下载次数(113)| 被引次数(3)

基于相对词频的相似度研究 

在中文信息处理中,文本相似度的计算广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域,是一个非常基础而关键的问题,相似度计算的方法目前也有很多种,针对总体研究情况来看,这些方法缺乏对文本的语义分析,本文主要考虑利用知网提供的词语标注从中文语义角度计算词语相似度,从而提高相似度的精度。 作为相似...
东北师范大学  硕士论文  2008年 下载次数(322)| 被引次数(9)

基于语境计算模型的词义消歧 

本文提出相对词频的概念,据此建立起语境计算模型,利用歧义字段前后语境词语相对词频信息对多义词进行消歧。以“黄色”和“黄金”为例进行实验,封闭测试精确率分别达到99.41%和98.93%,开放测试精确率分别达到96.37%和96.81%。试验结果证明该方法的有效性。
全国第八届计算语言学联合学术会议(JSCL-2005)论文集  2005-08-01 下载次数(110)| 被引次数(1)

基于领域相似性度量方法的统计机器翻译方法 

基于领域相似性度量方法的统计机器翻译方法,涉及机器翻译技术领域。它解决了现机器翻译技术中选取平行语料的方法中,采用余弦函数与词频来作为领域间相似性的度工具并不能反应实际的相似程度以及忽略了文字背后的语义关联,而导致选取的平行语不能反映实际含义、最终影响翻译结果准确性的问题。本发明是在现有统计机器翻译方法中,...
哈尔滨工业大学  中国专利  2014年 下载次数(0)| 被引次数(0)

基于语境信息的组合型分词歧义消解方法 

提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧义进行实验,平均准确率达到95%以上,证明该方法对于消解组合型分词歧义具有良好效果。
《计算机工程》  2006年 第17期 下载次数(411)| 被引次数(18)

基于相对词频的文本特征抽取方法 

评估函数对已定义类别以外的语料区分度相对较低的问题出发,结合常用的停用词表功能,提出了基于与统计量相关的相对词频作评估函数的改进模型。该模型结合了现代汉语词频统计结果,使用相对词频选择特征词,较好地区分了特定类别与类别外文本。实验结果验证了这种方法的可行性,并且取得了较好的分类效果。
《计算机应用研究》  2005年 第04期 下载次数(522)| 被引次数(31)

基于词频分布的文本隐写技术研究 

通过对同义词替换方法的深入研究,为了提高其抗检测性,本文以文本信息隐藏技术为研究方向,设计了一种抗词频统计检测分析的信息隐藏方法,并在此基础上提出了一种提高嵌入容量的文本信息隐藏方法,具体工作如下: (1)本文设计了一种抗词频统计分析攻击的文本信息隐藏方法。基于同义词替换的文本信息隐藏方法会导致同义词出现的频率发...
湖南大学  硕士论文  2013年 下载次数(152)| 被引次数(2)

基于渡越矩阵与语境计算模型的复句关系词的自动标注 

自然语言理解是人工智能领域的经典难题,目前国内外有大量的研究。在汉语信息处理领域,相应的研究应该包括有字处理、词处理、句处理、篇章处理。然而到目前为止,关于汉语理解的研究基础比较薄弱,汉语信息处理的研究基本上还停留在“字和词处理”阶段,大多数研究成果都是基于字和词的研究。对于句子的研究尤其是汉语...
华中师范大学  硕士论文  2007年 下载次数(105)| 被引次数(2)

一种同义词的挖掘方法和装置 

本发明提供了一种同义词的挖掘方法和装置,其中方法包括:从搜索日志中,搜索请求(query)及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。通过本发明能...
北京百度网讯科技有限公司  中国专利  2012年 下载次数(0)| 被引次数(0)

基于爆发词识别的微博突发事件监测方法研究 

鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突...
《情报杂志》  2014年 第09期 下载次数(395)| 被引次数(20)

基于语境计算模型的汉语词义消歧(英文) 

提出利用相对词频(Relative Word Frequency,RWF)来评估词语之间搭配强度。基于相对词频,提出语境计算模型,用于对汉语文本词义进行消歧。选择3个常用多义词进行试验,结果验证了该方法的有效性。
《广西师范大学学报(自然科学版)》  2006年 第04期 下载次数(169)| 被引次数(8)

面向中文新闻话题检测的多向量文本聚类方法 

基于多向量模型,给出一种将话题主题信息与话题文本信息相结合的多向量话题表示方式,使用较低的维度来准确表示一个话题.针对传统TFIDF方法在文本分类问题中对特征项在各个类中分布情况考虑不充分的问题,给出了一种TFIDF改进方法.在TDT4的中文语料上,与传统向量空间模型进行了对比实验.实验结果表明,给出的话题表示方法和T...
《郑州大学学报(理学版)》  2016年 第02期 下载次数(171)| 被引次数(12)

利用构建语义词典的查询自动分类方法 

为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrap-ping,由某个主题的少量关键词逐步扩充,最终得到该主题的语义词典及词典中每个单词的相对词频.Web中信息的冗余和各主题语义上的差别...
《哈尔滨工业大学学报》  2008年 第07期 下载次数(239)| 被引次数(6)

基于SVM的中文文本自动分类研究 

详细介绍了进行文本分类的过程,并着重介绍了一种新的基于结构风险最小化理论的分类算法———支持向量机,通过实验比较支持向量机算法和传统的KNN算法应用于文本分类的效果,证实了支持向量机在处理文本分类问题上的优越性。
《计算机与现代化》  2006年 第08期 下载次数(268)| 被引次数(19)

共找到相关记录27条12下一页