中文农业网页去重及相似度判断研究 

随着网络信息技术的飞速发展,农业信息化的建设、服务水平得到了极大的促进与提高。互联网中海量、重复的农业信息为从事农业领域的朋友们带来方便的同时,也增加了快速、准确获取有效信息的难度。如何对农业网页中重复以及近似重复的网页进行有效的管理,成为农业垂直搜索引擎领域研究的重要课题之一。本文的工作主要包括以下几个方面: ...
新疆农业大学  硕士论文  2014年 下载次数(64)| 被引次数(1)

中文农业网页多分类方法研究 

随着信息技术的匕速发展和互联网的普及,农业信息化的建设、服务及水平都得到了极大的促进与提高。互联网中海量、无序和繁杂的农业信息在为农业从业人员带来便利的同时,也增加了获取有效信息的难度。如何对这些农业信息进行有效的分类管理,从而方便农民朋友及时、准确地从中获取需要的实际信息,成为农业信息化领域研究的重要课题。本文的主要...
新疆农业大学  硕士论文  2012年 下载次数(116)| 被引次数(2)

智能中文农业垂直搜索引擎体系的架构与实现 

针对互联网农业信息的多样性、复杂性以及我国 三农 的特殊性,研究并实现了智能中文农业垂直搜索引擎AgriRoom,介绍了AgriRoom的体系架构和系统实现中涉及到的关键技术:基于网页分类和多元线性回归分析的信息过滤技术、物理存储模式的分页式倒排索引技术、基于随机索引和潜在语义分析的语义检索模型。该系统目前已投入使用,...
《湖北农业科学》  2014年 第12期 下载次数(77)| 被引次数(0)

基于文本内容的农业网页信息抽取和分类研究 

通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的...
《情报科学》  2012年 第07期 下载次数(361)| 被引次数(4)

SDD算法在中文农业网页信息检索的应用 

SDD(半离散矩阵分解)算法是潜在语义索引(LSI)的最新技术,弥补了传统SVD算法无法大规模应用的局限,具有压缩比大,响应时间短等优点。利用com技术实现了检索引擎的封装使得服务器端的维护变得轻松,有利于二次开发,同时能够作为一个对象嵌入ASP页面实现了B/S模式,降低了用户使用的门槛。由于SDD算法与具体的语言无关...
《农业网络信息》  2005年 第11期 下载次数(87)| 被引次数(7)

Web文本信息抽取与分类方法研究 

随着互联网技术的快速发展,网络信息爆炸式增长,用户从海量信息中准确、快速地找到所需信息遇到了很大困难,此类需求推动了Web信息抽取技术的研究。隐马尔可夫模型因其易于建立、适应性强、抽取精度高等优点日益受到研究者的关注,但其对初值敏感、未考虑状态转移概率和观察值输出概率与模型历史状态的关联性,使得信息抽取准确度受限。针对...
西北农林科技大学  硕士论文  2014年 下载次数(291)| 被引次数(6)

基于SDD中文农业网页搜索系统的设计与实现 

由于我国数字鸿沟的存在,农业信息的获得非常困难,特别是急需农业科技信息和市场信息的企业、部门、农户,他们通过传统的综合搜索引擎,在这些海量的信息中,搜索一个准确的信息已非常困难,而使用通用的搜索引擎则搜索到很多无关的信息。要实现信息的精确搜索,就需要研究专业的搜索引擎。因此,针对于中文农业网页,研发专业化的搜索引擎,实...
中国农业科学院  硕士论文  2006年 下载次数(111)| 被引次数(4)

中文农业网页去重及相似度判断研究 

随着信息技术的飞速发展,互联网中的网页急剧增长,在这海量、繁杂的网页中却呈现出一定比例的重复网页及近似网页。为了减少农业领域中近似及重复网页对农业垂直搜索引擎性能的影响,文中首先使用MD5算法去除网页集合中完全相同的网页,再利用向量空间模型(VSM)、基于知网的语义相似度模型及潜在语义分析(LSA)三种相似度判断方法对...
《计算机技术与发展》  2015年 第01期 下载次数(104)| 被引次数(1)

基于本体的旱区农业垂直搜索引擎研究 

随着互联网的快速发展,农业知识资源也在急剧增长,但农业用户在海量复杂的数据中获得农业信息资源效率并不高。通用搜索引擎无法满足农业用户在信息检索时对查准率的要求,现有的农业搜索引擎存在缺乏公信的农业服务平台、区域性和实效性不高等问题。针对这些问题,本研究以西部旱区农业物联信息平台为公信的农业服务平台来开展针对西北干旱地区...
西北农林科技大学  硕士论文  2013年 下载次数(128)| 被引次数(4)

基于内容的农业网络信息可信度评估方法研究 

随着网络技术的普及,信息化技术得以飞速发展,同样农业在社会信息化过程中也在逐步实现农业的信息化。农业的主体是农民,在农业信息化服务中,由于农民普遍存在知识文化水平不高以及经济能力较弱的问题,无法判别网络中各类信息的真实可靠性。本文针对农业信息服务过程中出现的这些问题,对如何评估农业网络信息的可信度问题进行了研究,主要工...
湖南农业大学  硕士论文  2015年 下载次数(51)| 被引次数(0)

“农搜”系统的研发与应用 

信息检索是当今社会的热点话题,但是一般的搜索引擎涵盖面太广,个性化、专业化程度不够。本文利用潜在语义索引(LSI)的最新技术SDD(半离散矩阵分解)算法来解决大规模网页索引计算的问题,利用SDD算法建立起语义索引,成功构建了一个中文农业搜索引擎,本文介绍了 农搜 系统的结构、功能、关键算法和应用情况。
《农业网络信息》  2009年 第08期 下载次数(95)| 被引次数(5)

农业网站中垃圾网页过滤方法的研究 

新疆位于祖国的西北地区,幅员辽阔,资源广袤,但是正是由于地域广阔,客观上造成了乡村之间、城乡之间距离较远,从而间接导致了农村信息的相对闭塞,阻碍了农村生产力的发展。新疆农村地区的信息化建设迫在眉睫,广大农民迫切需要通过各种技术手段获取实时涉农信息,掌握市场动态。而在众多的信息化手段中,农业网站最受农民用户的青睐,因为它...
新疆大学  硕士论文  2011年 下载次数(83)| 被引次数(0)

农业搜索引擎倒排索引缓冲机制研究 

目前,我国有3万多个农业网站。为了充分利用农业网站资源,人们通常会使用百度、谷歌、雅虎等通用性搜索引擎来进行信息检索,但是通用性搜索引擎对涉农领域的搜索结果存在不准确、覆盖率低的问题。因此,专门针对涉农用户的农业垂直搜索引擎便出现了。 本文在开源搜索引擎ASPSeek分块式倒排索引的基础上,参照LRU,MRU,...
新疆农业大学  硕士论文  2011年 下载次数(52)| 被引次数(0)

基于SDD改进算法的中文农业搜索引擎的研究 

信息检索是当今社会的热点话题,但是一般的搜索引擎涵盖面太广,个性化、专业化程度不够。本文利用潜在语义索引(LSI)的最新技术SDD(半离散矩阵分解)算法来解决大规模网页索引计算的问题,在实践中根据稀疏矩阵的特点,对该算法进行了改进,提高了检索计算的时间效率。在此基础上,结合《中国农业网站名录》中收录的6000余个网址,...
农业工程科技创新与建设现代农业——2005年中国农业工程…  2005-12-01 下载次数(41)| 被引次数(0)

农业复杂自适应搜索模型研究及实现 

截止2009年底,互联网上的涉农网站已超过30000个,积累了丰富的农业技术、市场信息、政策法规、农业新闻等信息资源。然而由于互联网信息资源缺少统一的形式化表达,信息异质、异构、分散、重复现象严重,形成“信息孤岛”,很难发挥农业信息资源的集成效用。同时,由于农户文化水平、计算机操作能力的限制,“三农”用户很...
中国科学技术大学  博士论文  2010年 下载次数(458)| 被引次数(7)

共找到相关记录26条12下一页