您的位置: 专家智库 > >

孙媛

作品数:17 被引量:25H指数:4
供职机构:中央民族大学信息工程学院更多>>
发文基金:国家自然科学基金国家语委科研项目中央民族大学自主科研计划项目更多>>
相关领域:自动化与计算机技术农业科学语言文字更多>>

文献类型

  • 14篇期刊文章
  • 3篇会议论文

领域

  • 14篇自动化与计算...
  • 1篇农业科学
  • 1篇语言文字

主题

  • 8篇藏语
  • 6篇抽取
  • 5篇实体关系抽取
  • 5篇关系抽取
  • 5篇藏文
  • 4篇向量
  • 3篇信息处理
  • 3篇语言
  • 3篇神经网
  • 3篇神经网络
  • 3篇网络
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇数据集
  • 2篇自动分词
  • 2篇自动分词系统
  • 2篇网络模型
  • 2篇向量机
  • 2篇泛化
  • 2篇分词

机构

  • 17篇中央民族大学
  • 3篇教育部
  • 1篇青海师范大学

作者

  • 17篇孙媛
  • 5篇赵小兵
  • 4篇孙媛
  • 2篇朱臻
  • 1篇王利众
  • 1篇李琳
  • 1篇朱丽平
  • 1篇赵倩

传媒

  • 8篇中文信息学报
  • 2篇中国科学数据...
  • 1篇山西农业大学...
  • 1篇软件导刊
  • 1篇中国教育信息...
  • 1篇智能科学与技...

年份

  • 4篇2024
  • 2篇2022
  • 1篇2021
  • 1篇2020
  • 2篇2019
  • 2篇2018
  • 1篇2017
  • 2篇2015
  • 2篇2009
17 条 记 录,以下是 1-10
排序方式:
JCapsR:一种联合胶囊神经网络的藏语知识图谱表示学习模型
2024年
知识图谱表示学习是自然语言处理的一项关键技术,现有的知识图谱表示研究主要集中在英语、汉语等语言,而低资源语言的知识图谱表示学习研究还处于探索阶段,如藏语。该文基于前期构建的藏语知识图谱,提出了一种联合胶囊神经网络(JCapsR)的藏语知识图谱表示学习模型。首先,我们使用TransR模型生成藏语知识图谱的结构化信息表示。其次,采用融合多头注意力和关系注意力的Transfomer模型表示藏语实体的文本描述信息。最后,采用JCapsR进一步提取三元组在知识图谱语义空间中的关系,将实体文本描述信息和结构化信息融合,得到藏语知识图谱的表示,相比基线系统,联合胶囊神经网络JCapsR模型提高了在藏语知识图谱上实体链接预测的性能,相关研究为其他低资源语言知识图谱表示学习的拓展优化提供了参考借鉴意义。
孙媛梁家亚陈安东赵小兵
基于改进YOLOv5s的苹果病害检测技术研究
2024年
[目的]面对大规模的苹果园种植和管理,传统的果园巡检容易出现误检、少检的现象,并且传统的苹果病害检测模型参数量庞大难以实现移动端的轻量化部署,因此,设计一个高效并且轻量的苹果病害检测模型可以实现对苹果病害的有效预防与精准管理,从而改善苹果品质与增加果园经济收入。[方法]针对以上需要,提出了一种基于YOLOv5s的改进算法。以常见的炭疽病和褐斑病为主要研究对象,采集苹果表皮病害图像构建果园苹果病害数据集,通过Labelimg工具对图像进行标注与分类;引入GhostNet轻量化模块对主干特征提取网络进行替换,使用更小的参数量来捕获更多的特征信息,达到模型轻量化的效果,便于后期移动端的部署;引入SimAM无参注意力机制加强模型对通道和空间信息的同时关注,在不添加任何参数量的基础上对重要的病害特征赋予更高的优先级,提高模型的准确性;引入SIoU边界框回归损失函数来优化预测框对于目标病害的准确定位,通过重新定义角度惩罚度量帮助预测框快速定位到准确的轴,同时借助遗传算法优化θ的取值,实现提升模型训练和推理能力的效果。[结果]改进后的模型参数量和浮点运算数(FLOPs)比原始模型减少了30.2%和33.8%,在达到轻量化的基础上,mAP@0.5达到93.7%,mAP@0.5:0.95达到63.3%,分别优于YOLOv5s原始算法1.6%和0.7%。[结论]改进后的模型在实现轻量化的同时也达到了较好的检测性能,不仅实现了苹果病害的高效识别,也为其他农作物的病害检测提供了技术支持与参考依据。
王帅王利众朱丽平孙媛
关键词:苹果病害目标检测
《多语种智能信息处理专题》卷首语
2022年
多语种智能信息处理是人工智能发展的前沿方向和关键要点。为了更好地服务于国家“一带一路”倡议发展规划,中国人工智能学会成立了多语种智能信息处理专业委员会,旨在实现语言相通、信息相通,为“一带一路”上各国家各民族的经贸相通、文化相通与民心相通贡献力量。其中,多语种数据共享与评测是多语种智能信息处理的基础保障。
赵小兵孙媛孙媛
关键词:智能信息处理多语种数据共享卷首语一带一路
基于联合模型的藏文实体关系抽取方法研究被引量:9
2018年
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏、实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法。基于藏文实体关系抽取任务,提出以下方案:(1)针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高。(2)藏文是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果证明了方法的有效性。(3)该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式,如SVM算法和LR算法,准确率提高了30%~40%。
夏天赐孙媛
关键词:词性标注
面向机器阅读理解的藏文数据集TibetanQA
2022年
机器阅读理解是自然语言处理的关键任务,旨在考察机器是否具有理解自然语言的能力。目前,中英文领域的机器阅读理解取得了很大的进展,模型的性能已经超过了人类的水平,其中公开数据集起到了非常重要的作用,如斯坦福大学的SQuAD数据集。而对于低资源语言,如藏文,由于缺乏大规模公开的数据集,机器阅读理解的相关研究还处于起步阶段。因此,本文构建了面向藏文机器阅读理解的数据集,数据集包含631篇文章,903个段落,形式为excel文件。其中,第一列为当前文章ID,第二列为文本标题,第三列为段落,第四列为问题,第五列为问题对应的答案。其文本数据来自云藏网,问题和答案是由20位藏语专业人员进行人工录入和标注,类型涉及自然、文化、教育等12个领域。本数据集的发布,对于促进藏文信息处理的发展具有重要的价值。
孙媛旦正错刘思思赵小兵
关键词:藏文少数民族语言数据集
藏语交集型歧义字段切分方法研究
本文探讨了改进的最大概率分词算法在藏语自动分词系统中对交集型歧义字段处理中的应用,旨在为臧语言处理提供理论依据。
孙媛罗桑强巴杨锐赵小兵
关键词:歧义字段信息处理
基于SVM和泛化模板协作的藏语人物属性抽取被引量:8
2015年
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。
朱臻孙媛
关键词:SVM
Ti-Reader:基于注意力机制的藏文机器阅读理解端到端网络模型
2024年
机器阅读理解旨在教会机器去理解一篇文章并且回答与之相关的问题。为了解决低资源语言上机器阅读理解模型性能低的问题,该文提出了一种基于注意力机制的藏文机器阅读理解端到端网络模型Ti-Reader。首先,为了编码更细粒度的藏文文本信息,将音节和词相结合进行词表示,然后采用词级注意力机制去关注文本中的关键词,利用重读机制去捕捉文章和问题之间的语义信息,自注意力机制去匹配问题与答案的隐变量本身,为答案预测提供更多的线索。最后,实验结果表明,Ti-Reader模型提升了藏文机器阅读理解的性能,同时在英文数据集SQuAD上也有较好的表现。
孙媛陈超凡刘思思赵小兵
关键词:端到端网络藏文
藏汉跨语言话题模型构建及对齐方法研究被引量:1
2017年
如何获取藏文话题在其他语种中的相关信息,对于促进少数民族地区的社会管理科学化水平、维护民族团结和国家统一、构建和谐社会具有重要意义。目前大多数研究集中在英汉跨语言信息处理方面,针对藏汉跨语言研究较少。如何根据藏语、汉语的特点,并结合目前藏语信息处理的研究现状,实现藏汉多角度的社会网络关系关联,同步发现关注话题并进行数据比较,是迫切需要解决的问题。该文在藏汉可比语料的基础上,利用词向量对文本词语进行语义扩展,进而构建LDA话题模型,并利用Gibbs sampling进行模型参数的估计,抽取出藏语和汉语话题。在LDA话题模型生成的文档-话题分布的基础上,提出一种基于余弦相似度、欧氏距离、Hellinger距离和KL距离四种相似度算法的投票方法,来实现藏汉话题的对齐。
孙媛赵倩
关键词:LDA
基于SVM和泛化模板协作的藏语人物属性抽取
提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法.该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化.针对规则方法的局限性,该文在模板的基础上,采用SVM...
朱臻孙媛
关键词:藏语支持向量机
共2页<12>
聚类工具0