您的位置: 专家智库 > >

聂建云

作品数:8 被引量:75H指数:6
供职机构:蒙特利尔大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金江西省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 7篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇情感
  • 2篇图像
  • 2篇图像标注
  • 1篇对齐
  • 1篇多分类器
  • 1篇信息检索
  • 1篇一体化
  • 1篇语义
  • 1篇语义距离
  • 1篇语义模糊
  • 1篇语义模糊性
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇属性约简
  • 1篇特征提取
  • 1篇统计翻译模型
  • 1篇平行文
  • 1篇平行文本
  • 1篇情感分类
  • 1篇情感分析

机构

  • 8篇蒙特利尔大学
  • 2篇内蒙古大学
  • 2篇同济大学
  • 2篇江西财经大学
  • 2篇上海大学
  • 1篇华南理工大学

作者

  • 8篇聂建云
  • 2篇廖国琼
  • 2篇苗夺谦
  • 2篇刘德喜
  • 2篇吴伟
  • 2篇张志飞
  • 2篇万常选
  • 2篇岳晓冬
  • 2篇高光来
  • 1篇刘喜平
  • 1篇江腾蛟
  • 1篇廖述梅
  • 1篇钟敏娟
  • 1篇张晶
  • 1篇陈江
  • 1篇刘晓华

传媒

  • 3篇中文信息学报
  • 1篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇数字图书馆论...

年份

  • 1篇2018
  • 1篇2016
  • 4篇2015
  • 1篇2006
  • 1篇2001
8 条 记 录,以下是 1-8
排序方式:
实现一体化的跨语言和多语言信息检索被引量:2
2006年
许多研究已经探讨了跨语言和多语言信息检索问题,并提出了多种实现方法,特别是针对查询的翻译。但是大多数的方法都将跨语言检索问题看成是两个分开的步骤:查询的翻译和单语检索。而对于多语言信息检索,则另外再加上一个结果合成的步骤。在本文中,我们提出一种一体化的检索方法,即将查询的翻译看成是整个检索过程的一部分。使用这种一体化的方法能充分将翻译和检索中的不确定性结合起来,从而达到更好的整体优化,也能将单语言信息检索的方法用于跨语言及多语言信息检索。
聂建云
关键词:查询翻译
一种基于改进的支持向量机多分类器图像标注方法被引量:9
2015年
针对多标签图像标注问题,提出一种改进的支持向量机多分类器图像标注方法。首先引入直方图交叉距离作为核函数,然后把传统支持向量机的输出值变换为样本到超平面的距离。基于这两点改进,采用一种特征选择方法,从众多的图像特征中,选择那些相互之间冗余度较小的视觉特征,分别建立分类器,最终形成以距离大小为判别依据的支持向量机多分类器模型。此外,在建立分类器时,考虑到训练图像中不同标签类样本分布的不均匀,引入了一个关于图像类标签的概率分布值做为分类器的权重系数。实验采用ImageCLEF提供的图像标注数据集,在其上的实验验证了所采用的特征选择算法和多分类模型的有效性,其标注精度要优于其他传统分类模型,并且,实验结果与最新的方法相比也具有一定的竞争力。
吴伟聂建云高光来
关键词:支持向量机图像标注多分类器
一种融合语义距离的最近邻图像标注方法被引量:5
2015年
传统的基于最近邻的图像标注方法效果不佳,主要原因在于提取图像视觉特征时,损失了很多有价值的信息。提出了一种改进的最近邻分类模型。首先利用距离测度学习方法,引入图像的语义类别信息进行训练,生成新的语义距离;然后利用该距离对每一类图像进行聚类,生成多个类内的聚类中心;最后通过计算图像到各个聚类中心的语义距离来构建最近邻分类模型。在构建最近邻分类模型的整个过程中,都使用训练得到的语义距离来计算,这可以有效减少相同图像类内的变动和不同图像类之间的相似所造成的语义鸿沟。在ImageCLEF2012图像标注数据库上进行了实验,将本方法与传统分类模型和最新的方法进行了比较,验证了本方法的有效性。
吴伟高光来聂建云
关键词:图像标注特征提取最近邻语义距离
基于分类的微博新情感词抽取方法和特征分析被引量:18
2018年
情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发布和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种.
刘德喜聂建云万常选刘喜平廖述梅廖国琼钟敏娟江腾蛟
否定句的情感不确定性度量及分类被引量:8
2015年
情感分类是社交媒体大数据分析的有力手段之一.否定句作为一种普遍且特殊的句子现象,其情感分类的研究具有重要的意义.否定词语和情感词语在否定句情感分类中同样重要,已有方法仅仅考虑否定词语修饰情感词语的情况,忽视否定词语本身反映情感的作用.为了统一解决否定词语修饰和不修饰情感词语情况下的分类问题,提出了基于决策粗糙集的否定句情感分类模型.构造词典并结合句际关系计算子句情感值,根据子句情感值提出基于KL散度的句子情感不确定性度量方法;然后融合多个特征,特别是与否定相关的独立否定特征和显著副词特征,用于否定句的特征表示;最后提出基于决策相关程度的决策正域约简算法,生成否定句情感分类决策规则.实验结果验证了该模型的有效性以及情感不确定性度量对于情感分类的作用.
张志飞苗夺谦聂建云岳晓冬
关键词:情感分类否定句属性约简
中文微博情感词提取:N-Gram为特征的分类方法被引量:12
2016年
情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限。一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词。该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的。为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类。实验结果表明,该方法较传统基于共现的方法要好。实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题。
刘德喜聂建云张晶刘晓华万常选廖国琼
强语义模糊性词语的情感分析被引量:7
2015年
语义的模糊性给词语的情感分析带来了挑战。有些情感词语不仅使用频率高,而且语义模糊性强。如何消除语义模糊性成为词语情感分析中亟待解决的问题。该文提出了一种规则和统计相结合的框架来分析具有强语义模糊性词语的情感倾向。该框架根据词语的相邻信息获取有效的特征,利用粗糙集的属性约简方法生成决策规则,对于规则无法识别的情况,再利用贝叶斯分类器消除语义模糊性。该文以强语义模糊性词语"好"为例,对提出的框架在多个语料上进行实验,结果表明该框架可以有效消除"好"的语义模糊性以改进情感分析的效果。
张志飞苗夺谦岳晓冬聂建云
关键词:情感分析语义模糊性粗糙集贝叶斯分类
利用平行网页建立中英文统计翻译模型被引量:16
2001年
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构信息。实验表明 ,所训练的翻译模型能达到 80 %的准确率。对于象跨语言信息检索这样的应用 ,这样的准确率已经能大致满足需要。这一工作表明 。
聂建云陈江
关键词:统计翻译模型跨语言信息检索平行文本
共1页<1>
聚类工具0