公共文化服务平台

2024年7月27日星期六

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

郑海清: 作品数：3 被引量：17H指数：2; 供职机构：复旦大学信息科学与工程学院计算机科学系更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

牛军钰复旦大学信息科学与工程学院计算...
林琛复旦大学信息科学与工程学院计算...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
1篇学位论文

领域

3篇自动化与计算...

主题

2篇中文
2篇文本分类
1篇信息处理
1篇支持向量
1篇支持向量机
1篇中文文本
1篇中文信息
1篇中文信息处理
1篇文本处理
1篇文本分类方法
1篇文本聚类
1篇向量
1篇向量机
1篇聚类
1篇聚类算法
1篇类方
1篇后缀树
1篇计算机
1篇计算机应用
1篇STC

机构

3篇复旦大学

作者

3篇郑海清
2篇牛军钰
1篇林琛

传媒

1篇上海师范大学...
1篇中文信息学报

年份

2篇2007
1篇2006

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

特定领域半监督文本分类系统的设计与实现: 这是一个科学飞速发展的时代，借助计算机等工具以及人类历史上长期的知识积累，各个学科的信息越来越深入和系统，人们迫切需要将这些特定领域的知识进行系统化的分析和归类从而为以后更深入的研究做好准备，于是特定领域内的文本分类成为...; 郑海清; 关键词：文本分类; 文献传递

基于STC的中文文本聚类算法被引量：5: 2006年; 提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果,首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案。; 王国强郑海清牛军钰; 关键词：后缀树文本聚类文本处理

一种基于紧密度的半监督文本分类方法被引量：12: 2007年; 自动的文本分类已经成为一个重要的研究课题。在实际的应用情况下,很多训练语料都只有一个数目有限的正例集合,同时语料中的正例和未标注文档在数量上的分布通常也是不均衡的。因此这种文本分类任务有着不同于传统的文本分类任务的特点,传统的文本分类器如果直接应用到这类问题上,也难以取得令人满意的效果。因此,本文提出了一种基于紧密度衡量的方法来解决这一类问题。由于没有标注出来的负例文档,所以,本文先提取出一些可信的负例,然后再根据紧密度衡量对提取出的负例集合进行扩展,进而得到包含正负例的训练集合,从而提高分类器的性能。该方法不需要借助特别的外部知识库来对特征提取,因此能够比较好的应用到各个不同的分类环境中。在TREC’05(国际文本检索会议)的基因项目的文本分类任务语料上的实验表明,该算法在解决半监督文本分类问题中取得了优异的成绩。; 郑海清林琛牛军钰; 关键词：计算机应用中文信息处理文本分类支持向量机

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张