您的位置: 专家智库 > >

宋砚

作品数:16 被引量:13H指数:1
供职机构:南京理工大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金北京市科技新星计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇专利
  • 4篇期刊文章
  • 2篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 11篇视频
  • 5篇镜头
  • 4篇视频字幕
  • 4篇图像
  • 4篇字幕
  • 4篇聚类
  • 4篇均值聚类
  • 3篇色情
  • 2篇电影
  • 2篇多模态融合
  • 2篇新闻
  • 2篇新闻视频
  • 2篇信息提取
  • 2篇信息提取方法
  • 2篇语言类型
  • 2篇原始视频
  • 2篇人脸
  • 2篇人脸模型
  • 2篇人声
  • 2篇视频节目

机构

  • 13篇中国科学院
  • 3篇南京理工大学
  • 1篇天津大学
  • 1篇中国科学院研...

作者

  • 16篇宋砚
  • 13篇刘安安
  • 11篇张勇东
  • 10篇唐胜
  • 10篇李锦涛
  • 2篇庞琳
  • 1篇颜成钢
  • 1篇林守勋
  • 1篇刘石
  • 1篇宁波

传媒

  • 2篇2008中国...
  • 1篇通信学报
  • 1篇计算机应用研...
  • 1篇软件学报
  • 1篇计算机与现代...

年份

  • 1篇2023
  • 1篇2015
  • 1篇2014
  • 3篇2010
  • 5篇2009
  • 5篇2008
16 条 记 录,以下是 1-10
排序方式:
一种基于时空条带模式分析的新闻主播镜头检测方法
本发明公开了一种基于时空条带模式分析的新闻主播检测方法,包括:从经过编辑的新闻视频中截取连续的N帧作为一组,并提取水平时空条带和垂直时空条带;提取水平时空条带和垂直时空条带中所对应的图像特征,得到相应的特征向量;通过聚类...
刘安安李锦涛张勇东唐胜宋砚
文献传递
一种多模态融合的采访镜头检测方法
本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的...
刘安安李锦涛张勇东唐胜宋砚
文献传递
一种色情视频检测方法及检测系统
本发明提供一种色情视频检测方法,包括:在待检测视频的视频帧中,利用肤色模型和非肤色模型,计算视频帧的各个象素点的肤色概率值与非肤色概率值;根据视频帧中象素点的肤色概率值与非肤色概率值,为视频帧建立模版图像;根据模版图像,...
刘安安李锦涛张勇东唐胜宋砚
文献传递
基于聚类的视频字幕提取方法被引量:11
2009年
针对现有方法的不足,提出了一种视频中字幕提取的方法。该方法在文字定位步骤中采用多尺度文字定位以及文字区域精确化的方法;得到文字区域后,在文字分割步骤中使用一种改进的K均值聚类方法对其中的像素进行聚类,获得二值化的图像;最后用OCR软件识别得到文字。实验结果表明,该方法应用于网络视频敏感词语检测具有良好的效果。
宋砚刘安安张勇东林守勋
关键词:文字提取OCRK均值聚类
基于无监督方法的视频中的人物识别被引量:1
2014年
基于无监督的显著性学习方法提出一种新颖的人物识别方法。它在训练程序部分不需要身份标签就能提取出突出的特征。首先利用相邻约束斑块匹配在图片对之间构建稠密对应。该方法在处理由于较大的视觉角度变化和人物姿势变化而引起的图片对之间不对应的情况非常有效。其次,它应用一种无监督的方法来学习人物的显著性。为了提高实验的性能,在斑块匹配过程中融合了这种人物的显著性特征。在VIPeR数据集上进行的实验证实了该方法的正确性,且性能略优于文献中提出的e Bi Cov方法及e LDFV方法。
宁波宋砚
关键词:图像处理无监督学习
一种视频字幕信息提取方法
本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字...
刘安安宋砚庞琳李锦涛张勇东唐胜
文献传递
一种基于时空条带模式分析的新闻主播镜头检测方法
本发明公开了一种基于时空条带模式分析的新闻主播检测方法,包括:从经过编辑的新闻视频中截取连续的N帧作为一组,并提取水平时空条带和垂直时空条带;提取水平时空条带和垂直时空条带中所对应的图像特征,得到相应的特征向量;通过聚类...
刘安安李锦涛张勇东唐胜宋砚
文献传递
一种色情视频检测方法及检测系统
本发明提供一种色情视频检测方法,包括:在待检测视频的视频帧中,利用肤色模型和非肤色模型,计算视频帧的各个像素点的肤色概率值与非肤色概率值;根据视频帧中像素点的肤色概率值与非肤色概率值,为视频帧建立模版图像;根据模版图像,...
刘安安李锦涛张勇东唐胜宋砚
文献传递
基于加权排序检索和视觉模式挖掘的商标识别
2015年
为了识别在自然条件下拍摄的图像中所包含的商标,提出了一种基于加权排序检索和视觉模式挖掘的算法。通过特征点相似度的权重大小得到商标的初步识别结果;然后建立特征点对的空间关系模型,再通过数据挖掘方法对空间位置关系所建立的视觉模式进行匹配从而删除误匹配结果,最终实现商标的识别。不同算法在数据集Flickr Logos上的实验结果表明,该算法利用视觉模式能更好地描述商标并且能够利用较少的样图获得较高的查准率和查全率。
刘石宋砚
关键词:图像匹配
一种多模态融合的采访镜头检测方法
本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的...
刘安安李锦涛张勇东唐胜宋砚
文献传递
共2页<12>
聚类工具0