白鹤 作品数:17 被引量:49 H指数:3 供职机构: 中国科学院声学研究所 更多>> 发文基金: 国家高技术研究发展计划 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
SOA架构的融合业务系统中的多次用户认证鉴权方法 本发明涉及一种SOA架构的融合业务系统中多次用户认证鉴权方法,所述认证鉴权方法,包括以下步骤:(1)初访注册过程,是指不同终端用户初次启动适配安装的客户端软件,在鉴权中心进行注册,并初始化客户端的过程;(2)确认终端属性... 王劲林 白鹤 李晔 汤迪斌文献传递 收入导向的电子商务网站队列管理策略 2009年 现有的网站请求队列管理策略没有考虑各页面的重要性。针对电子商务网站,该文提出一种以收入为导向的队列管理策略,通过对日志文件的统计分析,根据各页面最终跳到交易页面的概率,给予请求不同的优先级,优先处理最有可能发生交易的请求,提高交易成功率,保证网站赢得更多的收益。实验结果表明,收入导向的队列管理策略最多能增加59.2%的用户交易量。 汤迪斌 白鹤 倪宏 王劲林关键词:队列管理 电子商务 面向旅游领域的Deep Web接口查询研究 被引量:1 2010年 Deep Web蕴涵丰富的分类信息,是融合型在线旅游业务良好的数据源。本文对Deep Web接口模式进行分析,提出了接口集成方案的流程和领域实例库的建模方法,并就"酒店查询"业务进行了对方案的评估。测试结果显示,在对接口页面一定积累的基础上,可以达到较高的模式匹配准确率,从而保证了Deep Web接口的正确的自动查询。 白鹤 赵志强 王劲林关键词:DEEP WEB 一种自适应XML内容发布方法 本发明提供一种自适应XML内容发布方法,包括如下步骤:1)客户端向服务端发送针对某一XML内容的请求;2)服务端查找所请求的XML内容,然后从根节点到叶节点遍历该XML内容的DOM树状结构,记录所有节点的抽象化层次;3)... 王劲林 李晔 白鹤文献传递 在线旅游业务中Web页面主体块提取方法研究 2010年 Web信息提取是在线旅游业务的重要技术。页面的主体语义块集中了最主要的信息量,它的正确提取是Web信息提取的基础。本文在对现有页面分割方案总结的基础上,提出了结合机器学习方法的Web页面主体语义块节点识别算法,并基于启发式规则对正结果集进行后续的校验,以定位最佳的主体语义块节点。通过实验,本文提出的方案达到了比较理想的准确率。 白鹤 赵志强 王劲林关键词:WEB信息提取 支持向量机 基于FFT的网页正文提取算法研究与实现 被引量:19 2007年 主要研究"正文式"网页的有效信息提取算法。该种底层网页真正含有Web页面所表达的主题信息,通常包含一大段的正文信息,正文信息的前后是一些格式信息(例如导航信息、交互信息、JavaScript脚本等)。分析了此种网页的页面结构特征,将问题转化为——给定一个底层网页的HTML源文件,求解最佳的正文区间;从而提出了一种基于快速傅立叶变换的网页正文内容提取算法。采用窗口分段的方法,利用统计学原理和FFT,得出每个可能区间的权值,从而求解出最佳正文区间。实验结果表明,此种方法能比较准确的对"正文式"网页的有效信息进行提取。 李蕾 王劲林 白鹤 胡晶晶关键词:中文信息处理 WEB页面 信息提取 页面结构 FFT 一种基于快速傅里叶变换的网页正文提取方法 本发明公开了一种基于快速傅立叶变换的网页正文提取方法,包括:读入HTML文件,并将该文件转换为Unicode格式,并存入一个字符数组;对字符数组进行窗口分段;对字符在文档中的位置进行统计学分析,根据结果对字符进行强度编码... 王劲林 李蕾 李晔 白鹤 胡晶晶文献传递 主题搜索系统关键技术研究 搜索引擎是当前互联网的基础应用,它帮助用户在海量数据中进行查询。但是传统的全网搜索模式存在索引更新困难和查询准确度低等局限性,主题搜索的出现和发展可以有效弥补上述不足,其关键技术成为了当前互联网研究的热点。
本课题... 白鹤关键词:搜索引擎 一种基于快速傅里叶变换的网页正文提取方法 本发明公开了一种基于快速傅立叶变换的网页正文提取方法,包括:读入HTML文件,并将该文件转换为Unicode格式,并存入一个字符数组;对字符数组进行窗口分段;对字符在文档中的位置进行统计学分析,根据结果对字符进行强度编码... 王劲林 李蕾 李晔 白鹤 胡晶晶文献传递 一种基于RFC1867规范的HTTP协议的文件上传方法 本发明涉及一种基于RFC1867规范的HTTP协议的文件上传方法,该方法基于UGiA-PHP-UPLOADER组件的系统架构,实现客户端进度控制、服务器端数据接收、按照RFC1867协议的即时解析和状态日志读取,包括:(... 王劲林 白鹤 苏孝强文献传递