于槐
- 作品数:3 被引量:2H指数:1
- 供职机构:西北民族大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 面向互联网的藏文实体关系模板获取技术研究被引量:1
- 2015年
- 确定实体之间的关系有助于更好的理解文本内容,通过实体关系模板可以从海量无结构的文本中获取大量的实体关系,并予以结构化.本文针对互联网藏文文本的特点,通过对藏文实体进行模板表示,采用基于word2vec的无监督词义相似度计算方法,构建近义词资源,实现了藏文词义相似度计算系统,最终构建一种基于相似度计算的实体关系模板获取模型.通过网络爬虫抓取青海湖藏文网的语料进行试验,实验结果表明本文提出的藏文实体关系模板抽取方法较为有效,达到了较好的实验效果.
- 马宁李亚超于槐加羊吉
- 关键词:藏文互联网
- 基于序列比对方法的藏语人名实体消重研究
- 2011年
- 在对网络藏语文本做信息抽取时,往往由于有很多藏族人具有同一个名字,使研究人员得不到期望的结果。为了解决这种"信息丢失问题",本论述在分析其产生原因的基础上,提出可采用生物学中序列比对的方法与社会网络分析方法中的图聚类算法相结合,对藏语人名进行消重。将人名实体的各个属性抽象成各个序列,进而通过各个序列的对比来统计出每两个相同人名的相似度,在通过社会网络分析方法中图聚类算法的决定该两个人名所表示的是否为同一个人,将表示同一个人的相同人名忽略,进而达到消重。
- 于槐于洪志
- 关键词:社会网络