您的位置: 专家智库 > >

董志安

作品数:49 被引量:61H指数:3
供职机构:北京信息科技大学更多>>
发文基金:国家自然科学基金国家社会科学基金北京市教委科技发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 42篇专利
  • 7篇期刊文章

领域

  • 11篇自动化与计算...

主题

  • 14篇抽取
  • 12篇向量
  • 9篇相似度
  • 8篇中文
  • 6篇新闻
  • 6篇句子
  • 6篇抽取方法
  • 5篇相似度计算
  • 4篇正确率
  • 4篇图像
  • 4篇文本
  • 4篇矩阵
  • 4篇聚类
  • 4篇词性
  • 3篇短语
  • 3篇语言模型
  • 3篇识别方法
  • 3篇体育
  • 3篇中文专利
  • 3篇自动抽取

机构

  • 49篇北京信息科技...
  • 1篇北京工业大学
  • 1篇北京理工大学
  • 1篇首都师范大学
  • 1篇中国电影科学...
  • 1篇北京城市系统...

作者

  • 49篇董志安
  • 48篇吕学强
  • 3篇李宁
  • 2篇李雪伟
  • 1篇张恒
  • 1篇刘克会
  • 1篇李江龙

传媒

  • 2篇北京大学学报...
  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇小型微型计算...
  • 1篇数据分析与知...

年份

  • 2篇2023
  • 4篇2022
  • 6篇2021
  • 1篇2020
  • 18篇2019
  • 12篇2018
  • 2篇2017
  • 2篇2016
  • 1篇2015
  • 1篇2013
49 条 记 录,以下是 1-10
排序方式:
一种体育新闻自动写作模板库构建方法
本发明涉及一种体育新闻自动写作模板库构建方法包括写作模板计算、触发条件构建,首先根据已分好的类别对模板数据进行相似度计算找到相同的模板,其次是利用CRF对模板进行触发条件识别,最终形成触发条件‑模板;写作模板计算包括基于...
吕学强张乐董志安孙少奇
文献传递
一种新闻话题检测方法
本发明涉及一种新闻话题检测方法包括:步骤1)对新闻语料集进行预处理,对文本信息进行关键词抽取;步骤2)采用抽取出的关键词集,通过聚类的方法,计算新闻报道与话题类簇之间的相似度,得到关键词类簇,选出具有代表性的关键词作为报...
吕学强游新冬董志安李宁
文献传递
一种图像标注方法
本发明涉及一种图像标注方法,包括以下步骤:利用改进的FCM聚类算法对数据集中的每一个标签样本进行聚类,将不同语义的数据集划分为不同的类,得到每一个类的聚类中心集合;计算图像到各个类的聚类中心的欧式距离,计算得到图像到各个...
吕学强董志安
文献传递
融合实体关键字特征的医疗领域实体分类方法
本申请公开了一种融合实体关键字特征的医疗领域实体分类方法,包括:文本向量化操作;特征提取;序列标注。本申请实施例提供的融合实体关键字特征的医疗领域实体分类方法,采用TF‑IDF辅助构建关键字表,将这些关键字作为特征输入模...
吕学强游新冬董志安
文献传递
一种关键词自动抽取方法
本发明涉及一种关键词自动抽取方法,包括:抽取技术标准中的通用词,抽取候选关键词,针对候选关键词过滤通用词后,综合位置特征、词共现特征以及上下文语义特征计算候选关键词权重得分,根据候选关键词权重得分范围计算动态阈值,利用动...
吕学强董志安
文献传递
一种中文专利文献术语自动识别方法
本发明涉及一种中文专利文献术语自动识别方法,包括以下步骤:步骤1):基于专利标题自动生成词性规则;步骤2):手工构建停用词表;步骤3):对生成的所述词性规则按照所含词性的个数进行分类;步骤4):利用TermRank排序算...
吕学强董志安
文献传递
一种改进模糊C均值聚类的图像标注方法被引量:1
2018年
本文主要利用图像底层特征以及图像标签的语义信息对图像进行自动标注,在此基础上提出了改进模糊C均值(FCM)聚类的标注方法.首先结合图像特征以及同类、异类样本间的关系信息,融合聚类中心之间的距离,改善了算法中距离测度较为单一的问题.在目标函数中将传统的距离测度改为同类样本距离与异类样本距离之差,体现了同类样本的密度和异类样本的稀疏程度,提高了标注准确率.然后使用改进后的算法对每类图像进行聚类,计算待标注图像到各个聚类中心的平均距离来判断其类别.之后计算图像到各个子类的聚类中心的距离,并统计所属类内的标注词即为图像的标注词.利用Corel5K和iaprtc12来验证算法的可行性,通过实验对比不同测度以及分析不同标注模型的结果,表明该方法有效的提高了标注准确率.
李长磊吕学强张凯董志安
关键词:FCM聚类算法图像标注聚类中心
一种汉语自动生成文本的自动评价方法
本发明涉及一种汉语自动生成文本的自动评价方法,包括汉语语法特征分析、文本篇章特征分析、字符串相似度特征分析和回归分析评价的步骤,汉语语法特征分析是对汉语的表层表达进行分析和评价,分析语言的语法和表达;文本篇章特征分析是对...
吕学强董志安
文献传递
文字识别矫正的方法
本申请公开了一种文字识别矫正的方法,包括:构建专业词库;构建识别结果区域矩阵;矫正。本申请的文字识别矫正的方法,通过引入语言模型,统计条件概率预测最佳符合词库的识别结果,通过检测项对应关系,进行前后矫正,进一步提高识别精...
吕学强游新冬董志安
文献传递
一种基于K-means的能耗感知的数据分类方法
本发明涉及一种基于K‑means的能耗感知的数据分类方法,包括:首先从存储系统中提取指定数据指定时间段中每一天的访问频次,然后针对每一个数据构建相应的季节性特性数组,进而利用K‑means算法对数据进行聚类,设定相应的类...
游新冬吕学强董志安
文献传递
共5页<12345>
聚类工具0