您的位置: 专家智库 > >

赵军

作品数:139 被引量:595H指数:14
供职机构:中国科学院自动化研究所更多>>
发文基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术文化科学语言文字电子电信更多>>

文献类型

  • 71篇专利
  • 38篇期刊文章
  • 29篇会议论文
  • 1篇科技成果

领域

  • 83篇自动化与计算...
  • 15篇文化科学
  • 9篇语言文字
  • 1篇电子电信
  • 1篇一般工业技术

主题

  • 32篇自然语言
  • 26篇语言处理
  • 26篇自然语言处理
  • 17篇中文
  • 15篇自然语言处理...
  • 15篇处理技术
  • 14篇文本
  • 14篇翻译
  • 13篇抽取
  • 12篇存储介质
  • 11篇网络
  • 10篇电子设备
  • 10篇信息处理
  • 10篇信息检索
  • 10篇语言模型
  • 10篇上下文
  • 10篇查询
  • 9篇语句
  • 9篇语料
  • 8篇语料库

机构

  • 138篇中国科学院自...
  • 4篇中国科学院大...
  • 3篇北京大学
  • 3篇哈尔滨工业大...
  • 3篇清华大学
  • 3篇中国科学院
  • 2篇哈尔滨理工大...
  • 2篇华为技术有限...
  • 2篇云知声智能科...
  • 1篇北京邮电大学
  • 1篇复旦大学
  • 1篇北京信息科技...
  • 1篇南京理工大学
  • 1篇苏州大学
  • 1篇武汉大学
  • 1篇山西大学
  • 1篇香港科技大学
  • 1篇新疆大学
  • 1篇中国人民大学
  • 1篇中国科学院软...

作者

  • 139篇赵军
  • 81篇刘康
  • 17篇徐波
  • 14篇张元哲
  • 8篇周光有
  • 8篇徐立恒
  • 8篇杨帆
  • 6篇来斯惟
  • 5篇王根
  • 5篇段湘煜
  • 4篇吕碧波
  • 4篇刘非凡
  • 4篇齐振宇
  • 4篇邹波
  • 3篇韩先培
  • 3篇彭星源
  • 3篇吴友政
  • 3篇刘树林
  • 2篇柯登峰
  • 2篇刘康

传媒

  • 27篇中文信息学报
  • 4篇计算机学报
  • 2篇计算机研究与...
  • 2篇第四届全国学...
  • 1篇自动化学报
  • 1篇江西师范大学...
  • 1篇软件学报
  • 1篇术语标准化与...
  • 1篇中国科学:信...
  • 1篇2008年全...
  • 1篇第二届全国信...
  • 1篇第二届中日自...
  • 1篇第三届学术计...
  • 1篇第五届全国青...
  • 1篇第五届全国信...
  • 1篇第一届全国信...
  • 1篇全国第八届计...
  • 1篇中国中文信息...
  • 1篇中国自动化与...
  • 1篇中国中文信息...

年份

  • 17篇2023
  • 13篇2022
  • 12篇2021
  • 11篇2020
  • 7篇2019
  • 2篇2018
  • 6篇2017
  • 4篇2016
  • 4篇2015
  • 3篇2014
  • 5篇2013
  • 1篇2012
  • 5篇2011
  • 4篇2010
  • 5篇2009
  • 9篇2008
  • 9篇2007
  • 6篇2006
  • 6篇2005
  • 4篇2004
139 条 记 录,以下是 1-10
排序方式:
基于Wikipedia的语义元数据生成被引量:4
2009年
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据生成技术的需求也就变得更加迫切。获得目标语义元数据及得到足够的训练语料是使用自动生成技术的两个基本问题。由于获得目标语义元数据需要专家知识,而获得足够的训练语料需要大量的手工工作,这也就使得这两个问题在构建一个成功的系统时至关重要。该文基于Wikipedia来解决这两个问题:通过分析一个类别中条目的目录表(table-of-contents)来抽取目标语义元数据,通过对分析文档结构和赋予目标结构正确的语义元数据来构建训练语料库。实验结果表明,该文的方法能够有效地解决这两个问题,为进一步的大规模的语义元数据应用系统打下了坚实的基础。
韩先培赵军
关键词:中文信息处理元数据语义元数据语料库构建语义标注
一种融合用户类别标签的相似问题检索方法及装置
本发明公开了一种融合用户类别标签的相似问题检索方法及其装置,所述包括:步骤1、计算每个用户类别标签之间的相似度;步骤2、根据用户输入的查询问题,建立融合用户类别标签的检索模型;步骤3、根据所述融合用户类别标签的检索模型,...
周光有赵军
文献传递
信息检索中基于MLS的语言模型准确性分析
基于语言模型的信息检索技术是一种具有理论优势的信息检索框架,这种技术所面临的一大问题是如何为严重数据稀疏的小文档建立语言模型。许多经验性的平滑技术看似严重地偏离观测数据,似乎背离了建模的准确性原则,但却带来了良好的性能。...
蔡勋梁赵军
关键词:信息检索语言模型
文献传递
一种借助统计机器翻译的答案检索方法及装置
本发明公开了一种借助统计机器翻译的答案检索方法及装置。首先利用统计机器翻译工具将候选答案翻译翻译成其它若干种语言,得到候选答案的若干种等价表示。然后利用矩阵分解的方法,对候选答案的若干种等价表示进行降维数,得到低维的隐含...
周光有赵军
文献传递
一种借助图随机游走的开放类别命名实体抽取方法及装置
本发明公开了一种借助图随机游走的开放类别命名实体抽取方法,该方法包括步骤:步骤1,分析种子在语料中的上下文得到模板;步骤2,使用模板从语料抽取候选实体;步骤3,根据种子实体、模板和候选实体之间的关系构造图;步骤4,在图上...
刘康赵军齐振宇
基于图网络融入词典的中文命名实体识别方法
本发明属于自然语言处理技术领域,具体涉及一种基于图网络融入词典的中文命名实体识别方法、系统、装置,旨在解决基于字的模型的中文命名实体识别方法没有利用词的信息,导致命名实体的识别精度较低的问题。本系统方法包括获取待识别语句...
赵军陈玉博刘康隋典伯
文献传递
利用单语网页挖掘辅助汉英人名反向音译
本文提出一种利用单语言网页挖掘辅助汉英人名反向音译的方法。该方法由两个阶段组成:第一个阶段是矫正过程,统计音译结果被划分成音节,然后将这些音节组成查询,利用基于音节的搜索过程从一个大规模Web词典中搜索与音译候选相似的单...
赵军杨帆
关键词:机器翻译
文献传递
基于表示学习的中文分词算法探索被引量:33
2013年
分词是中文自然语言处理中的一个关键基础技术。通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法。然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试和修改,是一项费时费力的工作。随着基于神经网络的表示学习方法的兴起,使得自动学习特征成为可能。该文探索了一种基于表示学习的中文分词方法。首先从大规模语料中无监督地学习中文字的语义向量,然后将字的语义向量应用于基于神经网络的有监督中文分词。实验表明,表示学习算法是一种有效的中文分词方法,但是我们仍然发现,由于语料规模等的限制,表示学习方法尚不能完全取代传统基于人工设计特征的有监督机器学习方法。
来斯惟徐立恒陈玉博刘康赵军
关键词:中文分词
利用了网络搜索的依存句法的领域自适应方法
一种利用了网络搜索的依存句法领域自适应方法,包括:构建基于K‑Best的候选依存句法树重排序模型,用一个基准模型来产生一组候选依存句法分析树,其中,每一个候选依存句法分析树对应一个概率,从而定义了多个依存句法分析结果的初...
周光有赵军
文献传递
一种汉英反向音译方法及装置
本发明涉及一种汉英反向音译的方法和装置,将待翻译的中文音译名转换成汉语拼音序列表示,借助统计音译模块来生成音译候选;通过修正模块将音译候选修正为真实的英文单词,修正模块借助从大规模的网页上搜集的真实英文单词构成的词汇表;...
赵军杨帆邹波
文献传递
共14页<12345678910>
聚类工具0