公共文化服务平台

唐晋韬: 作品数：44 被引量：133H指数：5; 供职机构：国防科学技术大学更多>>; 发文基金：国家自然科学基金国家重点基础研究发展计划教育部“新世纪优秀人才支持计划”更多>>; 相关领域：自动化与计算机技术文化科学社会学经济管理更多>>

合作作者

面向中文文本的本体构建和自动扩充: 语义Web是Internet发展的重要趋势，其目的之一在于赋予万维网上所有资源唯一的标志，并在资源之间建立机器可处理的各种语义联系。语义万维网以明确的、形式化的方式来表示信息资源，能够提高异构系统的互操作性，促进知识共享...; 唐晋韬; 关键词：本体构建支持向量机多类分类

Discovering hidden information of gene ontology based on complex networks analysis被引量：3: 2010年; To resolve the ontology understanding problem, the structural features and the potential important terms of a large-scale ontology are investigated from the perspective of complex networks analysis. Through the empirical studies of the gene ontology with various perspectives, this paper shows that the whole gene ontology displays the same topological features as complex networks including ＂small world＂ and ＂scale-free＂,while some sub-ontologies have the ＂scale-free＂ property but no ＂small world＂ effect.The potential important terms in an ontology are discovered by some famous complex network centralization methods.An evaluation method based on information retrieval in MEDLINE is designed to measure the effectiveness of the discovered important terms.According to the relevant literature of the gene ontology terms,the suitability of these centralization methods for ontology important concepts discovering is quantitatively evaluated.The experimental results indicate that the betweenness centrality is the most appropriate method among all the evaluated centralization measures.; 唐晋韬王挺王戟

Reducing semantic bias of annotations for semantic web service discovery被引量：1: 2010年; In order to improve the effectiveness of semantic web service discovery, the semantic bias between an interface parameter and an annotation is reduced by extracting semantic restrictions for the annotation from the description context and generating refined semantic annotations, and then the semantics of the web service is refined. These restrictions are dynamically extracted from the parsing tree of the description text, with the guide of the restriction template extracted from the ontology definition. New semantic annotations are then generated by combining the original concept with the restrictions and represented via refined concept expressions. In addition, a novel semantic similarity measure for refined concept expressions is proposed for semantic web service discovery. Experimental results show that the matchmaker based on this method can improve the average precision of discovery and exhibit low computational complexity. Reducing the semantic bias by utilizing restriction information of annotations can refine the semantics of the web service and improve the discovery effectiveness.; 魏登萍王挺唐晋韬王戟; 关键词：CONTEXT

基于神经网络纠正器的领域分词方法被引量：1: 2017年; 提出了一种基于神经网络的中文分词方法,以提高分词系统向新领域迁移的适应性和灵活性。该文方法采用了对现有分词器分词结果进行纠正的思路。这种基于纠正的两阶段方法与分词模型解耦,避免了对源领域语料和分词器构建方式的依赖。然而现有的基于纠正的方法依赖于特征工程,无法自动适应不同领域。该文利用神经网络对纠正器进行建模,在无需手工设计特征的情况下即可实现领域适应。实验表明,与当前方法相比,该文方法在领域文本上具有更好的分词性能和鲁棒性,尤其在未登录词召回率方面提升显著。; 吴佳林唐晋韬李莎莎王挺; 关键词：中文分词神经网络

实体消歧中特征文本选取研究: 2017年; 在实体消歧问题中,特征文本是指输入实体消歧系统的用于表征实体指称和候选实体的文本,其质量对于实体消歧的性能有重要的影响。论文对特征文本的选取问题进行研究,针对网络文本的特点,综合考虑文本中的特殊字符、特征文本的位置、特征文本是否包含实体指称和特征文本的单句长度等因素,对文本进行筛选和处理,产生特征文本,以提高实体消歧的效果。论文在深度结构语义网(Deep Structured Semantic Model,DSSM)和向量相似度模型(Vector Similarity Model,VSM)两个实体排序模型上验证了特征文本选取方法的效果。结果显示特征文本筛选提高了DSSM上排序准确性,在P@3、P@5和P@10上分别有12.2%、12.3%和12.2%的提高。其中特殊字符处理对VSM有5.5%的提高。实验结果表明,对特征文本进行合理的筛选及清洗,有助于提高实体消岐中候选实体排序步骤的效果。; 庞焜元唐晋韬李莎莎王挺; 关键词：数据清洗

结合显式和隐式变分增强的多文档文献摘要方法及系统: 本发明公开了一种结合显式和隐式变分增强的多文档文献摘要方法及系统，本发明方法包括：将输入文档利用神经话题模型捕获显式的语句话题表示，与初始的摘要语句或者输出的上一句摘要语句融合得到显式融合特征，再利用隐变量模型捕获得到隐...; 李莎莎王攀成王挺刘甚灵唐晋韬李冬刘剑锋龙科含

关系抽取中远监督错误标注消除被引量：1: 2018年; 目前远监督方法被广泛应用于关系抽取任务。然而,远监督方法中存在大量错误标注现象,给远监督方法的学习效果带来了很大的影响。提出利用语义Jaccard度量关系短语与依存词间语义相似性的错误标注消除方法。消除错误标注后的训练数据用于训练模型,完成关系抽取。实验结果表明:该方法可以有效消除错误标注,提高关系抽取的性能。; 汝承森唐晋韬谢松县李莎莎王挺; 关键词：关系抽取语义相似性

基于本体概念结构的SVM多类分类方法及其在本体自动扩充中的应用: ＜正＞1 引言本体是哲学研究中发展出来的一个概念,指形成现象的根本实体。近十多年来,随着研究的日益深入,本体已经远远超过了哲学的范畴,在信息技术、知识工程等方面都有广泛的应用。尤其是本体; 唐晋韬王挺; 关键词：SVM; 文献传递

面向中文文本的时间本体构建和自动扩充: 对时间本体和本体自动扩充的研究是语义web领域的重要研究方向。本文通过对中文时间描述进行深入的分析,设计了一种新的时间本体结构,并构建了一种面向中文描述的时间本体。在此基础上针对中文时间描述的特点选择了词汇特征和句法特征...; 唐晋韬王挺周会平; 关键词：SVM; 文献传递

Linked Data数据集的主题模型建立方法被引量：1: 2017年; 提出了建立Linked Data数据集主题模型的方法.首先,将数据集中的RDF陈述三元组转换成主谓宾结构的语句,从而将Linked Data数据集转化为文本文档;然后,使用LDA算法对所有数据集的文本文档进行主题建模,即可得到每个数据集的主题向量,该向量就是描述数据集内容主题的特征.在Linked Data数据集链接目标推荐问题上,引入数据集的主题特征进行实验.使用数据集主题向量的余弦相似度替换基于记忆的协同过滤推荐算法中的相似度计算模块.结果表明,推荐效果比原始的协同过滤算法有很大提升.; 刘海池王挺唐晋韬宁洪魏登萍刘培磊; 关键词：DATA 数据集主题模型 LDA 推荐系统协同过滤

唐晋韬

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

唐晋韬

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈