张永平
- 作品数:4 被引量:2H指数:1
- 供职机构:湖南工业大学计算机学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金湖南省教育厅重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 汽车领域命名实体识别方法研究
- 随着计算机的快速普及,互联网的迅猛发展,各式各样的信息呈爆炸式增长,如何从海量的数据中精准的抽取用户所需信息已成为人们关注的话题。信息抽取的主要目的是将非结构化的自然语言文本转化成半结构化或者结构化数据,便于人们能够准确...
- 张永平
- 关键词:汽车领域命名实体识别叙词表本体特征信息抽取
- 文献传递
- 基于本体特征的汽车领域命名实体识别
- 2016年
- 针对汽车领域命名实体识别中汽车属性名识别的准确率和召回率较低的问题,提出了一种基于本体特征的汽车领域命名实体识别方法。通过扩展现有叙词表,基于叙词表构建汽车领域本体,提取语料中的本体特征,利用CRFs模型对汽车领域命名实体进行识别。实验结果表明,本体特征能够有效地识别出汽车属性实体,准确率、召回率和F值分别为75.60%,66.12%和70.54%。
- 张永平朱艳辉朱道杰王天吉李飞
- 关键词:命名实体识别汽车领域CRFS本体叙词表
- 基于LDA与评价对象的微博观点摘要被引量:1
- 2017年
- 针对微博话题观点摘要问题,提出一种基于LDA与评价对象相结合的微博观点摘要方法.首先,利用LDA模型得到话题的词分布矩阵和文档的话题分布矩阵,把两个矩阵的乘积作为各个词在句子中的权重分布矩阵,再利用词频与词权重分布矩阵的乘积作为词的重要度;然后,通过词的词性标注规则从句子中选择候选评价对象,再计算句子中候选评价对象的稳定性;最后,把句子中所有词的重要度与句子中所有候选评价对象的稳定性的总和作为句子权重,并从大到小排序,再进行观点句识别,并去除相似性较大的句子,抽取前20个句子作为话题观点摘要.实验结果表明,此方法可以有效地抽取微博观点摘要.
- 朱艳辉张永平杜锐徐叶强
- 关键词:LDA
- 一种基于两因素相结合的自适应学习三支决策阈值的算法
- 2016年
- 针对三支决策自动学习阈值问题,综合考虑决策风险总损失和分类器的综合性能两因素,提出一种基于层次分析法的分类器性能综合评价模型,结合决策风险损失建立了自动学习三支决策最优化阈值模型,进而提出一种基于风险损失与评价性能两因素相结合的三支决策自适应阈值算法,实验表明,提出的算法能学习到有效的三支决策阈值,并可以灵活设置权重参数和倍率参数等相关参数,权衡决策风险损失和分类器的综合性能,使决策者在允许的决策风险损失下有效的提高分类器的综合性能.
- 朱艳辉田海龙张永平朱道杰
- 关键词:分类器性能自适应算法阈值