您的位置: 专家智库 > >

国家自然科学基金(91024009)

作品数:3 被引量:22H指数:2
相关作者:王厚峰李广一范超蒙新泛徐戈更多>>
相关机构:北京大学闽江学院更多>>
发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 3篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 1篇动词
  • 1篇多步
  • 1篇形容
  • 1篇形容词
  • 1篇引擎
  • 1篇人人网
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇社团结构
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇随机场
  • 1篇缩略
  • 1篇缩略语
  • 1篇索引
  • 1篇条件随机场
  • 1篇图算
  • 1篇图算法
  • 1篇评级

机构

  • 6篇北京大学
  • 1篇闽江学院

作者

  • 6篇王厚峰
  • 1篇张龙凯
  • 1篇徐戈
  • 1篇焦妍
  • 1篇何正焱
  • 1篇蒙新泛
  • 1篇李广一
  • 1篇范超

传媒

  • 2篇中文信息学报
  • 1篇软件学报

年份

  • 1篇2014
  • 2篇2013
  • 3篇2011
3 条 记 录,以下是 1-6
排序方式:
基于多步聚类的汉语命名实体识别和歧义消解被引量:17
2013年
命名实体识别和歧义消解是自然语言理解的重要研究内容。针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法。首先通过两轮聚类将命名实体与知识库实体定义链接,然后通过层次聚合式聚类对知识库中未出现的实体进行聚类,最后进行普通词的识别和基于K-Means聚类的结果调整。在CLP-2012的汉语命名实体识别和歧义消解评测数据上的实验表明,该文的方法表现出良好的性能,在测试集上的F值高出评测参赛队伍最好水平6.46%,达到86.68%。
李广一王厚峰
关键词:命名实体识别聚类
采用无标注语料的动词和形容词主观性评级
2013年
为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(ranking).在汉语主观性词表构建中,提出使用主体线索和汉字主观性.5个标注人员对随机选择的500个单词进行主观性标注,据此构建主客观标准集,并将其用于各种设置下的实验结果评估.实验结果显示,当被标注的单词出现频率较高时,所提出的方法能够超过或者匹配人工标注.此外,尽管文中只使用了无标注的数据,但还有更多的先验知识(如语义词典等)可以被引入到该方法中.
徐戈蒙新泛王厚峰
关键词:主观性评级
社交网络中的社团结构挖掘被引量:5
2014年
社交网络已经成为现代人们在线交流并交换信息的重要途径之一。以国内的人人网为例,大量的年轻人,尤其是学生,以此为平台,相互讨论感兴趣的话题。人与人之间因为学习关系、工作关系、共同的兴趣等诸多因素关联起来;以大学生交流为主体的社交网则更有可能因为在相同院、系、所而关联在一起,从而呈现出社团结构。该文以人人网的真实数据,使用CNM算法来验证这一假设;同时,还利用社会网络的结构知识对CNM算法作了改进,提高了社团发现的精度。所挖掘的社团结构关系还表明,高校不同院系和学科形成的社团具有各自的特点。
范超王厚峰
关键词:社交网络社团结构人人网
基于机器学习方法与搜索引擎验证的缩略语预测
在自然语言中广泛使用的缩略语是重要的新词来源之一,成为了自然语言处理的一大问题。本文研究了从完整形式预测缩略语形式的方法。首先,使用CRF模型对完整形式预测,形成一定量的缩略候选,再利用搜索引擎得到的结果信息对各候选依次...
焦妍王厚峰
关键词:缩略语CRF模型
文献传递
商品品牌名称挖掘
百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识。在商品品牌名称抽取的挖掘中,我们提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和开放分类,我们使用不同的准则计算...
何正焱王厚峰
关键词:半监督学习图算法
文献传递
文本摘要中的句子抽取方法研究
抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要。本文提出了一种句子抽取方法。基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根据标注结果抽出句子以生成摘要。由于不在摘要中的句子的数量远...
张龙凯王厚峰
关键词:文本摘要句子抽取条件随机场
文献传递
共1页<1>
聚类工具0