您的位置: 专家智库 > >

张颖怡

作品数:11 被引量:106H指数:6
供职机构:南京理工大学经济管理学院信息管理系更多>>
发文基金:国家社会科学基金国家自然科学基金教育部人文社会科学研究基金更多>>
相关领域:文化科学自动化与计算机技术经济管理更多>>

文献类型

  • 10篇期刊文章
  • 1篇会议论文

领域

  • 7篇文化科学
  • 6篇自动化与计算...
  • 1篇经济管理

主题

  • 5篇学术
  • 5篇抽取
  • 4篇用户
  • 3篇学术论文
  • 3篇博文
  • 2篇信息分类
  • 2篇信息行为
  • 2篇学术博客
  • 2篇研究方法
  • 2篇用户分类
  • 2篇用户信息行为
  • 2篇关键词抽取
  • 2篇标签
  • 1篇信息抽取
  • 1篇信息推荐
  • 1篇信息挖掘
  • 1篇眼动
  • 1篇饮食
  • 1篇用户兴趣
  • 1篇用户兴趣建模

机构

  • 11篇南京理工大学
  • 3篇南京大学
  • 1篇中国科学技术...
  • 1篇匹兹堡大学

作者

  • 11篇章成志
  • 11篇张颖怡
  • 2篇陈果
  • 1篇李蕾
  • 1篇卢超
  • 1篇陈果
  • 1篇高星

传媒

  • 5篇情报学报
  • 1篇图书情报工作
  • 1篇图书情报知识
  • 1篇图书馆论坛
  • 1篇现代图书情报...
  • 1篇数据分析与知...

年份

  • 1篇2022
  • 2篇2021
  • 2篇2020
  • 2篇2019
  • 2篇2016
  • 2篇2015
11 条 记 录,以下是 1-10
排序方式:
学术博客用户的博文分类行为研究--以科学网博客为例
学术型博客不断发展促使网络学术资源不断增长。为了有效地对网络学术资源进行分类,很多学术型博客网站引入博文分类机制。对用户的博文分类行为进行研究,有助于理解学术博客中用户进行分类的规律,从而促进博文分类系统的优化。目前国内...
张颖怡章成志陈果
关键词:用户分类学术博客
不同学科领域的用户标签标注行为差异研究——以新浪微博用户的标签为例被引量:3
2016年
文章以新浪微博中用户标签作为研究对象,从微博中收集用户基本信息与用户标签信息,依据用户标签分类体系对用户标签进行人工分类;然后分析标签类型、标签类型分布熵、用户平均标签个数、用户平均标签长度等标签标注行为指标在不同学科领域中的差异,以及从高频和不同标签个数分组两个角度分析上述行为指标在不同学科领域的差异。研究表明,标签类型、平均标签个数在不同学科领域中有显著性差异;不同学科领域高频标签中,标签类型存在较大差异;在不同标签个数分组下,用户标签类型在不同学科领域下无明显差异,用户的平均标签长度随着个数的增多呈递减趋势。
池雪花张颖怡高星卢超章成志
关键词:标签分类用户信息行为
用户饮食偏好挖掘及应用研究被引量:7
2019年
[目的/意义]饮食是人类生存和发展的基本条件之一。挖掘用户的饮食偏好,能够解释不同用户在饮食习惯上的差异。用户饮食偏好挖掘方法的提出,能够拓宽饮食研究的路线。[研究设计/方法]以'大众点评'网站上的用户评论为数据源,结合情感分析,利用基于关键词的向量空间模型方法构建用户饮食偏好模型,在此基础上为网络用户推荐餐馆信息;并提出一种用户饮食偏好模型的评价方法以评估模型构建的效果。[结论/发现]基于用户近期评论内容构建的饮食兴趣模型能够预测用户未来的饮食偏好。根据用户饮食偏好进行餐馆推荐,可在一定程度上为用户提供感兴趣、高质量的餐馆信息,满足用户个性化的饮食需求。[创新/价值]从情感分析的角度,基于用户生成内容挖掘用户饮食偏好,以满足用户的个性化饮食需求;提出的用户兴趣模型评价方法能够有效分析模型的有效性。
岳子静张颖怡章成志
关键词:情感分析用户兴趣建模信息推荐
科研用户博文关键词标注行为差异研究——以科学网博客为例被引量:7
2015年
【目的】为优化标注系统提供依据,同时丰富网络环境下用户标注行为的研究。【应用背景】不同人群的关键词标注行为差异研究是用户信息行为研究中的一个重要方面。【方法】从标注系统使用方式、关键词结构以及标注动机三个角度选取关键词标注比率、用户标注关键词比率、用户标注关键词平均个数、用户标注关键词平均长度以及用户标注关键词重用率5个标注行为指标,分析科学网博客中不同类型用户标注行为的差异。【结果】分析结果发现,不同职业、专业、注册时间、发博文频率以及职称的用户在部分标注行为上存在显著性差异,但不同性别以及学历的用户在主要标注行为上不存在显著性差异。【结论】学术博客可以根据不同类型用户的标注行为差异,对博文标注系统进行优化。
张颖怡章成志池雪花李蕾
关键词:社会化标签科研用户
基于关键词的学术文本聚类集成研究被引量:12
2019年
文本聚类是一种无监督且高效的文本类别划分方法。从文本中抽取的关键词代表了文本主旨内容,基于关键词的文本聚类是当下主流方式之一。在学术文本聚类研究中,主要使用单一的聚类方法。目前,一部分提升聚类性能的方法被提出,聚类集成是其中之一。因此,根据聚类集成思想,本文开展了基于关键词的学术文本聚类研究。为分析聚类集成在学术文本聚类中的有效性,本文比较了非集成聚类算法与聚类集成算法的性能。同时,为分析关键词对聚类集成性能的影响,本文分析了不同关键词抽取方法和不同关键词个数下学术文本的聚类结果。实验结果表明,聚类集成算法能够提升学术文本聚类的性能。其中,当使用TextRank作为关键词抽取方法时,学术文本聚类结果较佳;随着关键词个数的增加,学术文本类别划分性能随之提升。
张颖怡章成志章成志
关键词:抽取文本聚类主题划分聚类集成
学术论文中问题与方法识别及其关系抽取研究综述被引量:5
2022年
[目的/意义]问题和方法是学术论文的重要组成部分.将散落在学术论文中的问题与方法进行有效组织,例如问题与方法识别及其之间的关系抽取,可挖掘学术论文中的隐性知识,促进学科的方法体系和问题体系构建.对学术论文中问题与方法识别及其关系抽取的相关研究工作的梳理,有助于把握该研究的发展趋势、发现该研究中存在的不足,并为未来的工作提供借鉴和指导.[方法/过程]在学术论文的问题和方法的挖掘方面,现有研究围绕4个研究点展开,分别是问题与方法及其关系定义、问题与方法及其关系标注数据集构建、问题与方法识别及其关系抽取的模型设计以及问题与方法及其关系的应用.本文分别对这4个研究点进行梳理,归纳总结现有学术论文中问题和方法知识挖掘的现状.[结果/结论]分析发现,在问题与方法的相关定义中,较少结合科学哲学中的问题学等理论进行定义;在问题与方法数据集构建中,存在数据集重复标注的现象,另外,开源数据集集中在自然科学领域且一般为英语语料,中文开源语料稀缺;在问题与方法识别及其关系抽取中,现有抽取模型性能较低;有关问题和方法的研究不应止步于词语识别和关系抽取,需对挖掘出的知识进行深入分析和应用.
张颖怡章成志DAQING HE
关键词:关系抽取
学术博客用户的博文分类行为研究——以科学网博客为例被引量:5
2016年
学术博客的不断发展促使网络学术资源不断增长。为了有效地对网络学术资源进行分类,很多学术博客网站引入博文分类机制。对用户的博文分类行为进行研究,有助于理解学术博客中用户分类的规律,从而促进博文分类系统的优化。目前国内外学者开始关注学术博客中的用户行为与分类机制,但缺乏对用户的博文分类行为的研究。为分析学术博客中的不同学科的用户分类行为,本文以科学网博客为例,分析不同学科用户的系统分类与个人分类使用结构,并分析系统分类以及个人分类与各学科的关联度。基于以上分析结果,本文最后为学术博客分类系统的优化提出相应的建议。
张颖怡章成志陈果
关键词:用户分类学术博客
关键词提取研究综述被引量:30
2021年
【目的】对关键词提取研究的主要方法、相关特征以及评价方法进行总结梳理,为后续的关键词提取研究提供借鉴。【文献范围】以"Keyword Extraction"、"Keyword Generation"、"Keyphrase Extraction"、"Keyphrase Generation"、"关键词抽取"、"关键词生成"等检索式在Web of Science、DBLP、Engineering Index、Google Scholar、CNKI和万方等数据库进行检索,结合个人积累与文献溯源得到代表性文献89篇。【方法】梳理关键词提取的发展脉络,从研究方法、相关特征与评价方法三个主要方面对关键词提取的相关研究进行深入分析与总结。【结果】关键词提取方法随着机器学习技术的发展,逐步从特征驱动的模型转向数据驱动的模型,并面临数据标注、评价规范等问题。【局限】更为关注关键词提取研究中主流的方法。【结论】本文通过对关键词提取方法,尤其是关键词生成方法进行总结,阐明了关键词提取方法的研究重心从特征转向数据的趋势与原因,并指出现有关键词提取评价体系所存在的缺陷。
胡少虎张颖怡章成志
关键词:关键词抽取
通用语料的眼动数据对微博关键词抽取的性能提升探究被引量:2
2021年
眼动数据记录了浏览者在浏览信息时的眼球轨迹,已有研究依据眼动数据度量阅读者在不同单词上的注意力强弱,并进一步将该特征加入微博关键词抽取模型中,从而提高抽取模型的性能。然而,目前的微博关键词抽取模型仅考虑通用领域眼动数据的总注视时长这一特征,尚未全面探究眼动数据对微博关键词抽取任务性能的影响。因此,本文将从眼动特征的选择、眼动特征与文本特征的组合这两个方面,全面考察通用语料的眼动数据对微博关键词抽取任务性能的影响。同时,由于眼动数据集与测试数据集在数据规模上相差较大,使得眼动特征过于稀疏,进而影响其作用的发挥,本文提出了一个眼动数据的扩充方案用于解决这一问题。
章成志胡少虎张颖怡
关键词:关键词抽取
基于学术论文全文的研究方法实体自动识别研究被引量:27
2020年
研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该学术论文使用或该学术论文引用该研究方法实体用于分析或比较。梳理学术论文使用的研究方法实体,可以帮助学者快速了解学术论文的主旨内容。总结学术论文引用的研究方法实体,有助于理清学科领域中研究方法的演变和发展模式。因此,本文将研究方法分为论文使用研究方法和论文引用研究方法。本文比较双向长短时记忆网络等8种神经网络研究方法实体自动抽取模型,从中选择最优的模型进行研究方法实体的识别。实验结果表明,基于字向量的、结合条件随机场的双向长短时记忆网络联合训练模型在研究方法识别任务中表现出最高的性能。以《情报学报》近10年的论文全文为依据,分析抽取出的研究方法实体的使用情况。统计分析结果发现,情报学学科中与实验法相关的研究方法使用频次和引用频次均最高。
章成志张颖怡
关键词:命名实体识别
共2页<12>
聚类工具0