您的位置: 专家智库 > >

于士涛

作品数:8 被引量:30H指数:2
供职机构:南开大学更多>>
发文基金:天津市自然科学基金天津市应用基础与前沿技术研究计划天津市科技发展战略研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 8篇自动化与计算...

主题

  • 3篇异构
  • 3篇异构数据集成
  • 3篇数据集
  • 3篇数据集成
  • 3篇问答系统
  • 2篇异构数据集成...
  • 2篇数据集成系统
  • 2篇包装器
  • 2篇MEDIAT...
  • 2篇MODEL
  • 1篇信息检索
  • 1篇知识
  • 1篇知识体系
  • 1篇中介器
  • 1篇识体
  • 1篇搜索
  • 1篇搜索服务
  • 1篇自动问答系统
  • 1篇向量
  • 1篇向量空间

机构

  • 8篇南开大学

作者

  • 8篇于士涛
  • 7篇袁晓洁
  • 4篇师建兴
  • 1篇张海威
  • 1篇杨娜
  • 1篇李志梁
  • 1篇陈秋双
  • 1篇窦志成
  • 1篇宁华

传媒

  • 2篇计算机工程与...
  • 2篇Journa...
  • 1篇计算机研究与...

年份

  • 1篇2009
  • 2篇2008
  • 2篇2007
  • 1篇2006
  • 2篇2004
8 条 记 录,以下是 1-8
排序方式:
异构数据集成中包装器Wrapper的设计
1介绍现今,很多大的企业集团由于历史上的原因都积累了大量的异构数据源。将这些数据源整合起来,为用户提供综合服务有着重要的实用价值,也是这些年数据库研究领域中的热点。很多如TSM-
牛丽萍袁晓洁于士涛李志梁窦志成
关键词:MEDIATOR
文献传递
Question classification in question answering based on real-world web data sets
2008年
To improve question answering (QA) performance based on real-world web data sets,a new set of question classes and a general answer re-ranking model are defined.With pre-defined dictionary and grammatical analysis,the question classifier draws both semantic and grammatical information into information retrieval and machine learning methods in the form of various training features,including the question word,the main verb of the question,the dependency structure,the position of the main auxiliary verb,the main noun of the question,the top hypernym of the main noun,etc.Then the QA query results are re-ranked by question class information.Experiments show that the questions in real-world web data sets can be accurately classified by the classifier,and the QA results after re-ranking can be obviously improved.It is proved that with both semantic and grammatical information,applications such as QA, built upon real-world web data sets, can be improved,thus showing better performance.
袁晓洁于士涛师建兴陈秋双
基于问答网络论坛知识体系的自动问答系统研究
随着信息检索技术的发展,互联网上出现了多种类型的搜索服务。其中应用最为广泛的当数Web搜索引擎服务,实现了对海量Web文档的获取、处理、存储和访问,使用户能够在互联网上方便快捷的查找到所需信息,在人们日常生活中发挥了重要...
于士涛
关键词:信息检索自动问答系统知识体系搜索服务
文献传递
基于Mediation的异构数据集成系统HDIS设计与实现被引量:21
2006年
采用Mediator/Wrapper方式集成分布式异构数据是当今数据库领域的研究热点。论文在分析国外现有产品的基础上,提出了一个基于Mediation的异构数据集成解决方案,并针对该方案设计实现了一个异构数据集成系统HDIS(HeterogeneousDataIntegrationSystem)。该文主要介绍HDIS的整体架构和实现过程中的关键技术。
袁晓洁于士涛李志梁
关键词:异构数据集成中介器包装器
异构数据集成系统中Mediator查询优化算法研究
1前言Mediator体系结构由Wiederhold在1992年首先提出,它适用于规模很大但对查询效率要求不高且源数据经常更新的系统。与传统的数据仓库的一个主要不同是,用户是以一个虚拟的中介模式
袁晓洁李志梁于士涛刘殿鑫张海威
关键词:MEDIATOR
文献传递
Knowledge presentation model for QnA web forums
2007年
For an extract description of threads information in question and answer (QnA) web forums, it is proposed to construct a QnA knowledge presentation model in the English language, and then an entire solution for the QnA knowledge system is presented, including data gathering, platform building and applications design. With pre-defined dictionary and grammatical analysis, the model draws semantic information, grammatical information and knowledge confidence into IR methods, in the form of statement sets and term sets with semantic links. Theoretical analysis shows that the statement model can provide an exact presentation for QnA knowledge, breaking through any limits from original QnA patterns and being adaptable to various query demands; the semantic links between terms can assist the statement model, in terms of deducing new from existing knowledge. The model makes use of both information retrieval (IR) and natural language processing (NLP) features, strengthening the knowledge presentation ability. Many knowledge-based applications built upon this model can be improved, providing better performance.
于士涛袁晓洁师建兴
一种Web问答系统中基于XML片段的语义项模型被引量:2
2007年
问答网络论坛是一种重要的互联网服务形式. Yahoo Answers,Live QnA和百度知道均属此项服务.基于问答论坛所持有的大规模主题数据,可以建立诸多有价值的应用.自动问答系统就是其中之一,它在最近几年十分流行,尤其当TREC的问答方向出现之后.然而,仅采用信息检索方法会造成大量语义信息未能充分利用,问答系统的性能不够令人满意.为利用更多信息,定义一种语义项模型,作为信息检索中文档标引项的改进.语义项以XML片段形式存储,利用语法结构,将自然语言处理中的语义信息引入信息检索.基于语义项而代替标引项构建的问答系统,上层信息检索模型不做任何改动即可得到改善,显示出更好的性能.
于士涛袁晓洁师建兴杨娜
关键词:问答系统向量空间模型
问题分类中基于句法和语义信息的特征选择被引量:5
2008年
问题分类是问答系统中一个非常重要的子模块,其关键在于问题的特征选择。考虑了问题的句法信息和语义信息,提出了一种利用问题疑问词、依存关系、主要动词、中心名词和名词的最高上位词作为特征进行分类的新方法。实验中,采用k-最邻近和朴素贝叶斯两种分类算法对该方法进行测试,结果表明了该方法具有较好的分类效果。在自定义的分类体系上,分别达到了82.2%和83.7%的分类精度,性能高于基于bag-of-words的特征选择方法。
袁晓洁师建兴宁华于士涛
关键词:问答系统
共1页<1>
聚类工具0