您的位置: 专家智库 > >

国家自然科学基金(70903047)

作品数:8 被引量:62H指数:5
相关作者:余传明张小青陈雷周丹陆颖更多>>
相关机构:上海理工大学中南财经政法大学武汉大学更多>>
发文基金:国家自然科学基金上海市教育委员会重点学科基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术文化科学经济管理更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 2篇经济管理
  • 2篇文化科学

主题

  • 2篇支持向量
  • 2篇支持向量机
  • 2篇向量
  • 2篇向量机
  • 2篇基于支持向量...
  • 2篇本体
  • 1篇虚拟化
  • 1篇映射
  • 1篇云计算
  • 1篇特性分析
  • 1篇自组织
  • 1篇自组织映射
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇网络
  • 1篇文本挖掘
  • 1篇无标度网络
  • 1篇小世界
  • 1篇命名实体识别
  • 1篇海量

机构

  • 7篇上海理工大学
  • 7篇中南财经政法...
  • 1篇武汉大学

作者

  • 8篇余传明
  • 3篇陈雷
  • 3篇张小青
  • 1篇崔荣波
  • 1篇安璐
  • 1篇郭飞
  • 1篇黄建秋
  • 1篇许晓兵
  • 1篇陆颖
  • 1篇屈振新
  • 1篇周丹

传媒

  • 3篇情报学报
  • 1篇图书情报知识
  • 1篇计算机应用
  • 1篇现代图书情报...
  • 1篇情报理论与实...
  • 1篇计算机系统应...
  • 1篇国家自然科学...

年份

  • 1篇2012
  • 4篇2011
  • 4篇2010
8 条 记 录,以下是 1-9
排序方式:
基于支持向量机的产品属性识别研究被引量:7
2010年
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法。为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注。针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估。在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%。实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果。
余传明陈雷张小青
关键词:支持向量机
以云计算为支撑的海量本体推理
2011年
为了解决海量本体可推理的问题,以云计算平台为支撑,将本体schema转换为图结构,并设计相应的推理策略,以Map/Reduce为计算模型,重写推理规则,设计推理算法,在Map过程中通过一次迭代实现推理,在Reduce过程中消重,解决了海量资源描述框架模式(RDFs)本体的推理问题,在合理时间实现了海量本体的推理。实验显示,一亿条三元组的推理时间没有超过4 min,证明算法是有效的。
屈振新余传明
关键词:云计算海量本体
基于支持向量机的产品属性识别研究
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法。为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取了3 701条,对其进行了手工标注。针对手工标注语料库,利用支...
余传明陈雷张小青
关键词:支持向量机
文献传递
一种虚拟化的服务器集群模型被引量:7
2011年
随着经济与电子商务的高速发展,企业与用户的业务交互次数呈现出几何级数增长的趋势,然而企业服务器的利用率却只有15%~30%。阐述了在Linux平台上运用虚拟化技术将企业现有的服务器虚拟成多台服务器,同时运用负载均衡调度算法对虚拟的多台Linux客户机进行集群的方案模型,以达到强化企业业务的持续性,加固数据的完整性和安全性、降低IT部门在整个企业范围内的成本的目的。
崔荣波许晓兵陆颖
关键词:虚拟化服务器集群负载平衡LINUX平台
基于自组织映射的期刊主题专业化与综合性分析被引量:5
2012年
本文通过计算60种有代表性的图书情报类英文期刊从2006年至2008年的主题数量与方差,将被调查期刊按照其主题专业化与综合性分为四类。在每类期刊中选取影响因子最高的期刊,利用自组织映射的成分图分析特定期刊的主题特点。结果发现,大多数(占85%)期刊较为均衡地报导有限数量的主题;少数(占13.3%)期刊呈现出较强的综合性,即较为均衡地报导数量较多的主题;个别(占1.7%)期刊涉猎广泛,且具有明显的主题侧重;不存在高度专业化的期刊。其中,期刊的主题数量与主题侧重程度差异(由方差反映)呈现同向变化的规律,即期刊的主题数量越多,其主题侧重程度差异也越大,反之亦然。
安璐余传明
关键词:自组织映射
基于LDA模型的评论热点挖掘:原理与实现被引量:21
2010年
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
余传明张小青陈雷
从客户评论中识别命名实体——基于最大熵模型的实现被引量:2
2011年
介绍命名实体识别的基本概念,分析两种命名实体识别的基本方法:基于规则的命名实体识别方法和基于统计的命名实体识别方法,并以最大熵模型为理论基础,对中文菜名识别进行实证研究。根据中文命名实体的特点,设计6种特征模板。实验结果表明,在简单特征模板的基础上增加标注特征能有效提高命名实体的识别效果。对改进识别效果有用的特征依次为:标注特征、词性组合特征、后向词性依赖特征和词形特征。
余传明黄建秋郭飞
关键词:命名实体识别最大熵模型文本挖掘
情感词汇共现网络的复杂网络特性分析被引量:11
2010年
本文从情感计算这一热点研究问题出发,分析了情感词汇共现网络的定义与构建原理,阐述了对其小世界效应、无标度特性、网络弹性、度相关性等复杂网络统计学特性进行研究的方法。为了检验这些统计学特性,从22157条网络评论中抽取出1284个情感词汇,并通过统计其在12000条评论语句中的共现情况建立了情感词汇共现网络。经计算,该网络的平均最短路径为2.89,群聚系数为0.19,表明其具有小世界效应;该网络的顶点度和边权重都呈幂律分布,表明其具有无标度特性。研究结果还表明,情感词汇共现网络的顶点度、顶点强度和顶点交互系数之间具有正相关性,是同类混合网络。
余传明周丹
关键词:复杂网络小世界无标度网络
从Wikipedia中获取本体:原理与方法研究被引量:10
2011年
wikjpedia作为一个大型的知识库,正逐渐被人们应用于不同的领域。在本体构建领域,wikipedia以其丰富的组织结构为大规模协作式的本体学习提供了有效的环境,利用wikipedja进行本体学习逐渐成为一个新的研究热点。本文从这一角度出发,在剖析Wikipedia基本结构的基础上,分析和比较了从类别结构图、信息盒和定义句中获取本体概念和实例的相关原理和方法,阐述了利用wikjpedia获取本体关系的原理,分析了基于结构特征、基于词典、基于句法和基于混合方式的模式匹配方法,以及基于结构特征和文本特征的统计学习方法,并对利用各种方法获取本体关系的效果进行了比较。
余传明张小青
关键词:本体学习
共1页<1>
聚类工具0