国家自然科学基金(61272259) 作品数:8 被引量:5 H指数:2 相关作者: 梁颖红 陆公正 车婷婷 周国栋 朱巧明 更多>> 相关机构: 苏州市职业大学 安阳师范学院 苏州职业大学 更多>> 发文基金: 国家自然科学基金 苏州市科技计划项目 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 交通运输工程 更多>>
紧凑结构多词表达抽取技术综述 被引量:2 2013年 总结紧凑结构多词表达抽取的国内外研究现状,指出汉语多词表达抽取存在的语料构建和特征选择的困难,同时分析目前的解决方法.展望多词表达抽取研究的未来发展趋势. 梁颖红基于用户兴趣的个性化推荐系统比较研究 2013年 个性化推荐系统是解决信息过载的有效途径之一,已广泛应用于电子商务等领域.介绍推荐系统及其组成部分,就个性化推荐系统的几个关键技术进行了阐述和比较,总结推荐系统主要的评价指标,并对未来可能的发展方向进行了初步预测. 尚鲜连 陈静 张苏关键词:推荐系统 个性化 用户兴趣 信息过载 基于Web的未登录词翻译技术的分析 2013年 随着互联网的发展,多种语言之间的信息交换日益增加,跨语言信息检索技术日益发展.未登录词的查询翻译是实现跨语言信息检索的关键技术之一,直接影响跨语言信息检索系统的性能高低.对基于Web的未登录词翻译技术进行了综合阐述和分析,较全面地阐述了当前普遍采用的基于Web中的信息实现未登录词的译文挖掘的各种技术及其特点. 朱敏关键词:跨语言信息检索 查询翻译 未登录词 Research on Chinese negation and speculation: corpus annotation and identification 被引量:1 2016年 Bowei ZOU Guodong ZHOU Qiaoming ZHU关键词:汉语语料库 句法结构 平行推理机制:一种隐式篇章关系检测方法 被引量:2 2014年 篇章是论元经过语义关联和结构化组织形成的自然语言文体.篇章分析研究的核心任务之一是解释论元的语义关系,其中,显式关系因具有直观线索而易于检测,目前检测精度高达90%;相对而言,隐式关系因缺乏直观线索而难于检测,目前精度仅约40%.针对这一问题,基于一种"论元平行则关系平行"的假设,并利用显式篇章关系易于检测的特点,通过平行论元的识别与平行关系的消歧,实现了一种显式关系平行推理隐式关系的隐式篇章关系检测方法.利用标准宾州篇章关系树库(Penn discourse Tree Bank,简称PDTB)对这一检测方法进行评测,结果显示,精确率提升达17.26%. 洪宇 严为绒 车婷婷 梁颖红 姚建民 朱巧明 周国栋关键词:篇章 使用机械分词与特征扫描实现对甲骨卜辞的切分 被引量:2 2013年 依据甲骨文语法及甲骨文词典对甲骨卜辞进行切分,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础.针对甲骨卜辞的切分,采用机械分词与特征扫描相结合的中文分词技术对200条比较完整的卜辞进行切分实验,将只使用机械分词和结合了特征扫描的两种方法进行比较.结果表明,采用机械分词与特征扫描相结合,实现甲骨卜辞的切分的正确率和效率都较高. 陆公正 开金宇关键词:甲骨卜辞 分词技术 机械分词 LUCENE 基于sif和SCAM结合的复制检测算法 2013年 复制检测在知识产权保护等许多领域都有重要的应用.构建一个数据库,该数据库可以用来存储注册文档和预处理,提出一种基于sif和SCAM结合的文本检测改进算法.对该改进算法进行描述并分析改进后算法的优势. 熊志勇 梁颖红关键词:词频 相似度 “一X就Y”格式的多词表达敏感特征提取和选择 2013年 主要研究如何选择和动态使用各自的敏感特征来抽取"一X就Y"结构的MWEs.分析了多词表达研究的现状,参考汉语言学相关专家的研究对"一X就Y"格式进行大致分类,针对该格式采用分词的方法提取特征集,并在训练集中按类别进行敏感特征的选择. 郭翠珍