搜索到49篇“ 新闻搜索引擎“的相关文章
- Geeking:基于胜者表的体育新闻搜索引擎系统
- 2016年
- 文章介绍了体育新闻搜索引擎系统Geeking的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面4个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照。输入查询请求时,系统根据搜索日志和新闻热词自动补全查询词,搜索不到相关结果时校正查询,给出推荐的查询词。检索新闻文档时,使用胜者表快速查找查询词项的相关文档,综合tf-idf权重和新闻标题、发布时间等因素计算文档的相关性并按得分排序。在相似新闻聚类中,结合最长公共子序列和编辑距离衡量新闻标题之间的相似度,以新闻标题相似度代表新闻文档的相似度。测试结果表明,基于胜者表的Geeking搜索引擎系统各项功能协调效果好,检索响应速度快。
- 林裕杰陈新荃高妍肖卡飞胡红祥花强
- 关键词:搜索引擎体育新闻聚类
- 网络医患关系报道中医生形象内容分析——以百度新闻搜索引擎为例
- 目前我国医患关系现状不容乐观:医疗纠纷呈逐年上升趋势;处理难度越来越大,医疗纠纷的赔偿额越来越高;刑事案件增多,患者疾病久治不愈,患方伤害医生事件时有发生。面对紧张的医患关系,了解医生群体的媒介形象是十分必要的。同时新媒...
- 倪雪莹
- 关键词:大众传播网络媒介医患关系
- 文献传递
- 基于领域本体的新闻搜索引擎的研究与实现
- 随着网络的大规模覆盖,浏览网络新闻已成为大家了解社会动态的一个重要渠道,新闻搜索引擎不可或缺。然而,虽然网络如一本无所不包的百科全书,由于当前搜索引擎技术仍处在革新阶段,致使信息检索结果还不尽如人意。
由此,本文将...
- 曾小芹
- 关键词:领域本体新闻搜索引擎网页分类信息增益软件开发
- 基于爬虫的Sohu新闻搜索引擎设计与实现
- 互联网信息增长速度惊人,为了在海量数据中快速找到有用的信息,搜索引擎技术成为了网民关注的热点。本论文的新闻搜索引擎就是在这样的环境下应运而生。 对普通用户来说,商业的搜索引擎基本上能满足其应用需求。但是对于特定的用...
- 林伟业
- 关键词:搜索引擎LUCENEPAGERANKHADOOP
- 个性化新闻搜索引擎的研究与设计
- 随着计算机各项技术的不断发展,信息化时代已经到来。如何让用户在海量的数据中快速并且准确的获取自己所需要的信息,是互联网行业一个亟待解决的问题。为此,搜索引擎应运而生。垂直搜索是搜索引擎中一个重要的组成部分,它能帮助用户在...
- 朱健琛
- 关键词:网络服务数据挖掘程序语言
- 商标新闻搜索引擎的研究与设计
- 刘志伟
- 基于WebHarvest的中文财经新闻搜索引擎的设计与实现
- 随着互联网的迅速发展,其所承载的信息量呈爆炸式增长,因此,如何有效地利用这些丰富的信息资源逐渐成为研究人员关注的课题。搜索引擎在当今互联网领域起着十分重要的作用,它是获取知识信息的主要工具。同时,随着用户需求的进一步扩大...
- 隋玉航
- 关键词:搜索引擎网络爬虫中文分词
- 文献传递
- 基于JAVA的移动新闻搜索引擎的研究与设计
- 随着Internet/Intranet的迅速发展,基于WWW的网上信息的收集、发布和相关的信息处理日益成为人们关注的焦点。面对着网络上新闻信息数量和种类的高速增长,导致了一方面新闻信息过度膨胀而另一方面用户却找不到所需要...
- 薛惠
- 关键词:垂直搜索引擎JAVA技术搜索引擎网页正文提取
- 文献传递
- 新闻搜索引擎的设计
- 2008年
- 将不同的新闻网站的内容集中分类显示。系统为样本网页建造了数学模型,根据网页所属的类别,构造不同的矩阵。对于未确定类别的网页,构造其对应的向量,并计算该向量和不同矩阵之间的值,比较计算结果和阀值的关系,确定网页的类别。
- 黄建才
- 关键词:搜索引擎矩阵向量
- 基于Lucene的网络新闻搜索引擎研究与实现被引量:1
- 2008年
- 本文针对新闻搜索的特点研究了中文新闻搜索引擎的构建技术,包括从网页文档抓取、解析、再到建立索引、发布搜索、用户界面搭建的全过程,并基于开源的Lucene软件包,结合中文分词与Pagerank技术实现了一个原型系统,取得了较好的搜索效果。
- 何会民韩东霞周明姬
- 关键词:LUCENE新闻搜索引擎PAGERANK中文分词
相关作者
- 付岩

- 作品数:8被引量:35H指数:3
- 供职机构:哈尔滨工程大学计算机科学与技术学院
- 研究主题:水下机器人 AUV 遗传算法 遗传模拟退火算法 模拟退火算法
- 黄劲潮

- 作品数:12被引量:14H指数:2
- 供职机构:龙岩学院
- 研究主题:神经网络 薄荷属 SSL 安全通信 教学法
- 刘志伟

- 作品数:2被引量:1H指数:1
- 供职机构:温州大学
- 研究主题:聚类系数 聚类 模式识别 相似度 谱聚类
- 李鲁群

- 作品数:66被引量:312H指数:10
- 供职机构:上海师范大学信息与机电工程学院
- 研究主题:地理信息系统 GIS 体系结构 局域网 CAI
- 何会民

- 作品数:13被引量:34H指数:3
- 供职机构:邯郸学院信息工程学院计算机系
- 研究主题:P2DR模型 信息检测 内部网 木马 网络安全