公共文化服务平台

张晓艳: 作品数：14 被引量：163H指数：6; 供职机构：国防科学技术大学人文与社会科学学院更多>>; 发文基金：国家自然科学基金教育部“新世纪优秀人才支持计划”国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术电子电信更多>>

合作作者

基于混合统计模型的汉语命名实体识别方法的研究与实现: 命名实体识别技术,即把文本中出现的专有名称和有意义的数量短语识别出来并加以归类。自95年在MUC-6(Message Understanding Conference)会议上首次提出以来,命名实体识别越来越受到自然语言处...; 张晓艳; 关键词：命名实体识别隐马尔可夫模型最大熵模型

基于多向量和实体模糊匹配的话题关联识别被引量：6: 2008年; 本文在对新闻报道理论分析及实验验证的基础上,提出一种多向量表示模型,使其在尽量不丢失信息的情况下,对特征集合尽可能细地划分。基于该模型,本文设计了一种模糊匹配的方法用于计算命名实体子向量之间的关联度,它们和多个向量相似度一起用支持向量机进行整合,形成报道模型间的相似度。本文选用TDT4中文语料作为测试语料,将上述模型及模糊匹配技术用于话题关联识别。实验表明,多向量模型能够改进话题关联识别的性能,模糊匹配技术也在一定程度上弥补了精确匹配带来的性能损失。; 张晓艳王挺陈火旺; 关键词：计算机应用中文信息处理

下一代智能光网络故障定位算法的研究: 随着互联网业务的迅猛增长以及波分复用(WDM)技术的飞速发展，智能光网络中承载的信息量越来越大，单个故障可能引起网络中大量信息的丢失，同时产生大量的告警信息，如何快速、准确地故障定位对整个光网络起着十分关键的作用。 ...; 张晓艳; 关键词：智能光网络故障定位多故障告警告警相关性

话题发现与追踪技术研究被引量：21: 2009年; 话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价方法以及发展历史;然后对其多个研究内容提出一个统一研究框架,并对该框架中的关键技术进行了详细分析;最后指出该领域中的关键问题及难点,并对未来研究做出展望。; 张晓艳王挺

基于混合统计模型的汉语命名实体识别方法被引量：24: 2006年; 本文针对三种重要的命名实体,即人名、地名、组织名,提出了一种隐马尔可夫模型(HMM)和最大熵模型(ME)相结合的汉语命名实体识别的方法。该方法的特点在于使命名实体识别和词性标注两个任务一体化;融合两种统计模型进行命名实体识别,其中HMM从整体上(句子范围内)对命名实体识别进行约束,ME则在局部范围内(当前词的上下文范围)估计一个词串被标记为某种命名实体的概率。实验表明,这种方法能较好地识别上述三种命名实体。; 张晓艳王挺陈火旺; 关键词：命名实体识别隐马尔可夫模型最大熵模型

新闻话题表示模型和关联追踪技术研究: 话题发现与追踪研究是对大规模的新闻流数据进行分析,以期发现、追踪、组织其中包含的多个话题。话题被定义为“一个具体事件(或活动)以及与之直接相关的事件(或活动)集合”。自1996年确立研究方向以来,一直是自然语言处理领域的...; 张晓艳

ICIC_Target:目标节点的局部因果关系网络的发现算法: 2016年; 因果关系的研究在于揭示自然规律的和人类社会发展本质及其规律,对人类长久以来的生产生活和科学研究有着非常重要的作用.目前,因果关系的研究受到前所未有的广泛关注,但仍存在诸多困难和挑战.致力于建立一个因果激励/抑制模型以抽象地表示和解释因果的作用机制,并在此基础上提出用于目标节点的局部因果关系网络的自动发现方法框架ICIC和算法ICIC_Target.该方法不预先设定因果结构(如设定为无圈、隐含结构),并根据对因果关系本质的认识,利用初始变量(exogenous variables)和初始团树(IClique)的概念,在判定边和方向之前对变量进行粗略地排序,从而提高了因果关系网络发现的性能.在4个不同类型的数据集上实现了与多种经典方法,如HITON,IC,PC,PCMB等的对比实验,实验结果表明ICIC_Target方法适用范围广,有较好的鲁棒性,同时,从理论上分析证实了ICIC_Target方法具有较好的稳定性和较低的复杂度.; 李岩王挺刘万伟张晓艳; 关键词：因果关系

命名实体识别研究被引量：84: 2005年; 命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的发展过程,分析了主要的方法和技术,并展望了未来的发展趋势。; 张晓艳王挺陈火旺; 关键词：自然语言处理文本信息处理研究方法识别技术

LDA模型在话题追踪中的应用被引量：25: 2011年; 随着对LDA模型的研究越来越深入,文本表示和挖掘能力进一步提高。"话题"是LDA模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把LDA模型用于话题追踪,目的有两个:(一)检验LDA话题对追踪话题的表示能力;(二)检验LDA模型在挖掘训练数据中的追踪话题时,LDA话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于LDA模型的追踪性能更好,但由于粒度不同,LDA模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的LDA模型是下一步工作的目标。; 张晓艳王挺梁晓波; 关键词：LDA模型

基于SVM的多向量文本表示模型话题关联识别研究: 本文在理论分析的基础上,并通过基准实验验证,提出一种多向量表示模型,该模型在尽量不丢失新闻报道信息的情况下,对特征集合尽可能细的划分,在模型比较时采用支持向量机对多个向量相似度进行整合。并在此基础上实现了话题发现与追踪中...; 张晓艳王挺陈火旺; 关键词：SVM