您的位置: 专家智库 > >

吕震宇

作品数:13 被引量:71H指数:6
供职机构:河北理工大学经济管理学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术理学经济管理文化科学更多>>

文献类型

  • 13篇中文期刊文章

领域

  • 10篇自动化与计算...
  • 3篇理学
  • 2篇经济管理
  • 1篇文化科学

主题

  • 5篇文本分类
  • 4篇特征加权
  • 4篇加权
  • 3篇文本特征
  • 2篇电子商务
  • 2篇商务
  • 2篇文本特征选择
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 2篇基尼指数
  • 2篇ERP集成
  • 1篇代数
  • 1篇信息化
  • 1篇信息检索
  • 1篇异构
  • 1篇异构数据库
  • 1篇制造业
  • 1篇制造业电子商...
  • 1篇制造业信息化

机构

  • 13篇河北理工大学
  • 6篇北京交通大学

作者

  • 13篇吕震宇
  • 8篇林永民
  • 8篇赵爽
  • 6篇朱卫东
  • 3篇张春玲
  • 2篇刘遵峰
  • 1篇阎红灿
  • 1篇陈景年
  • 1篇刘保相

传媒

  • 3篇计算机工程与...
  • 2篇情报杂志
  • 1篇情报科学
  • 1篇现代制造工程
  • 1篇计算机工程
  • 1篇河北理工学院...
  • 1篇计算机工程与...
  • 1篇计算机与现代...
  • 1篇中国管理信息...
  • 1篇河北理工大学...

年份

  • 3篇2010
  • 2篇2009
  • 6篇2008
  • 1篇2007
  • 1篇2005
13 条 记 录,以下是 1-10
排序方式:
向量空间模型中特征加权的研究被引量:8
2008年
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。常采用向量空间模型来表示文本,将文本看作特征空间的一个向量,使用TF.IDF方法对特征加权。但是这种加权方法简单地认为文本频数少的单词就重要,文本频数多的单词就不重要,使它不可能很好地反映单词的有用程度,从而导致分类准确率下降。针对TF.IDF方法存在的问题,提出了一种基于特征基尼指数的特征加权方法TF.GINI。实验结果显示,这种加权方法具有很好的分类性能。
林永民吕震宇赵爽朱卫东
关键词:文本分类基尼指数特征加权向量空间模型
基于同义词词林的文本特征选择与加权研究被引量:12
2008年
特征选择与加权是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。介绍了一种基于同义词词林的统计与语义相结合的文本特征选择与加权方法。该方法首先对同义词进行合并,将原有的特征提取从词的层面上升到主题概念层面,然后采用词频与相对熵的剩余度的组合TF*Ensu对特征进行加权,强化对分类贡献大的主题特征。实验结果表明,这种方法较之传统方法在特征选择与加权的效果上有明显改善,并能提高文本分类的精度。
吕震宇林永民赵爽朱卫东
关键词:文本分类特征加权同义词词林
ADO意义.NET在并发控制方面存在的问题及解决方案
2007年
针对ADO.NET在处理"丢失的修改"问题时,不支持"关键字和已修改字段"的并发控制问题提出了相应的解决办法;同时对ADO.NET架构本身带来的异常更新问题提供了解决思路。
吕震宇刘淑袆
关键词:ADO.NET并发控制
制造业电子商务与ERP集成方案研究被引量:3
2010年
从ERP和电子商务的发展历程出发,分析两者集成的重要性和集成所面临的问题,提出"战略统一、业务优化、应用集成、数据同步"的16字集成原则,最后给出一个制造业电子商务与ERP集成的完整、可行的解决方案。
张春玲吕震宇刘遵峰
关键词:电子商务企业资源计划系统集成制造业信息化
基于类信息的文本特征选择与加权算法研究被引量:8
2008年
文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往偏爱类分布不均匀文档集中的大类,而常用的TF·IDF特征加权方案仅考虑了特征与文档的关系,缺乏对特征与类别关系的考虑。针对上述问题,提出了基于类别信息的特征选择与加权方法,在两个不同的语料集上进行比较和分析实验,结果显示基于类别信息的特征选择与加权方法比传统方法在处理类分布不均匀的文档集时能有效提高分类精度,并且降维程度有所提高。
吕震宇林永民赵爽陈景年朱卫东
关键词:文本分类特征加权基尼指数
文本特征加权方法TF·IDF的分析与改进被引量:14
2008年
TF·IDF作为一种简单、直观、处理速度快的文本特征加权方法,在文本分类中得到广泛应用。但是这种方法简单地认为文本频数少的单词就重要,文本频数多的单词就不重要,使它不可能很好的反映单词的有用程度,从而导致分类准确率下降。针对TF·IDF方法存在的问题,采用在特征发生的条件下类的后验概率分布来衡量特征对分类的有效性,提出了一种基于熵的特征加权方法TF·Ensu。实验结果表明,这种加权方法具有很好的分类性能。
林永民吕震宇赵爽朱卫东
关键词:文本分类特征加权向量空间模型
基于虚拟日志压缩的数据同步方案被引量:7
2010年
在基于虚拟日志的数据同步中,当主库端存在对同一记录的频繁修改时,庞大的虚拟日志记录会影响整个数据同步效率。针对该问题,提出一种基于虚拟日志压缩的数据同步方案。虚拟日志压缩通过计算合并日志记录,只保留与数据同步相关的日志信息,从而减少网络数据流量,提高数据同步效率。实验结果表明,该方法适合广域网异构数据库的异步数据同步。
张春玲吕震宇刘遵峰
关键词:异构数据库数据同步
应用EAI实现电子商务与ERP集成的实践研究被引量:4
2009年
本文提出电子商务与ERP集成是现代制造企业的迫切需要与必然趋势,分析了利用EAI进行业务流程集成、应用集成、数据集成的三模式,指出数据集成是关键,最后给出了利用用友EAI进行集成的实例。
张春玲吕震宇
关键词:EAI电子商务ERP数据集成
kNN在文本分类中的应用研究被引量:4
2008年
随着网络技术与数字图书馆的迅猛发展,在线文档迅速增加,自动文本分类已成为处理和组织大量文档数据的关键技术。kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用。本文介绍了kNN分类算法的思想以及两种不同的决策规则,并通过实现的文本分类系统对基于离散值规则的kNN方法和基于相似度加权的kNN方法进行实验比较。实验结果表明,基于相似度加权的kNN方法的分类性能要优于基于离散值规则的kNN方法。
吕震宇赵爽林永民
关键词:文本分类KNN
结构化文档检索模型的改进研究
2010年
针对已有的基于贝叶斯网络的结构化文档检索模型存在的偏好小结构单元的问题,提出了一种改进的检索模型推理算法,算法考虑了结构单元对查询术语的覆盖程度,避免了在推理过程中只使用相关概率排序带来的问题。实验表明检索模型应用该推理算法能有效提高结构化文档的检索性能。
赵爽吕震宇林永民
关键词:结构化文档贝叶斯网络信息检索
共2页<12>
聚类工具0