孙茂松 作品数:356 被引量:2,366 H指数:25 供职机构: 清华大学 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 语言文字 电气工程 更多>>
中文诗歌自动生成方法及装置 本发明实施例公开一种中文诗歌自动生成方法及装置,能自动生成紧密扣题、上下文连贯一致、接近人类创作水平的高质量中文诗歌。方法包括:S1、获取用户输入的关键词,将所述关键词编码为向量,将所述向量存储在第一区域;S2、从所述第... 孙茂松 矣晓沅 李若愚 杨宗瀚文献传递 基于层次结构的多策略中文微博情感分析和特征抽取 被引量:200 2012年 随着Web2.0时代的兴起,与微博相关的研究得到了学术界和工业界的广泛关注。该文使用新浪API获取数据,针对中文微博消息展开了情感分析方面的研究。我们对于三种情感分析的方法进行了深入研究,包括表情符号的规则方法、情感词典的规则方法、基于SVM的层次结构的多策略方法,实验表明基于SVM的层次结构多策略方法效果最好。其次,针对层次结构的多策略方法的特征选择进行了详细分析,包括主题无关、主题相关的特征。实验表明使用主题无关的特征时获得的准确率为66.467%。引入主题相关的特征后,准确率提升至67.283%。 谢丽星 周明 孙茂松关键词:情感分析 SVM 面向大模型的通用工具协同和精细化学习系统及方法 本发明提供一种面向大模型的通用工具协同和精细化学习系统及方法,提升大模型对复杂任务的处理能力。该系统包括不同工具的动态组合机制模块、基于语言指令的统一接口模块、通用工具精细化学习模块和执行过程和结果信息综合推理模块。不同... 刘知远 孙茂松 汪华东 秦禹嘉 胡声鼎 严澜一种网络节点的增强表示方法及装置 本发明实施例提供一种网络节点的增强表示方法及装置,所述方法包括:获取网络节点之间的连接关系;根据所述连接关系和已有的网络表示学习模型获取所述网络节点的表示向量;根据所述连接关系对所述网络节点的表示向量进行更新迭代计算,并... 杨成 孙茂松 刘知远 涂存超文献传递 译文检索方法及装置 一种译文检索方法及装置,属于文本信息处理领域,所述方法包括:构建模型参数可设置的统计机器翻译系统及装置;同时构建参数可设置的文本检索系统与装置;使用最佳的参数组合,结合翻译和检索系统及装置,构建基于机器翻译的译文检索系统... 刘奇 刘洋 柳春洋 孙茂松文献传递 平行语料的构建方法及装置 本发明公开了平行语料的构建方法及装置,其中,该方法包括:确定平行语料库中各翻译词对的翻译概率,所述翻译词对包含源语言词及相应的目标语言词;将翻译词对及相应的翻译概率添加到翻译概率表中;根据翻译概率表对非平行语料库中的短语... 刘洋 董梅平 孙茂松文献传递 短路换相式电流型变频调速系统 2001年 介绍一种采用短路换相式变频调速系统,阐述了短路换相过程、短路开关的选择及控制方式。 孙茂松关键词:电流型变频调速系统 逆变电路 搜索引擎中相关性反馈技术 被引量:27 2001年 As an important component of search engines,the relevance feedback system is very effective for improving the performance of search engines.This paper firstly reviews the history of relevance feedback technology in the past 30 years,then introduces 2 major methods in relevance feedback,i.e.term reweighting and query expansion,and discusses the relevance feedback technologies based on vector space model and statistical ranking model. 陶跃华 孙茂松关键词:搜索引擎 信息检索 查准率 向量空间模型 统计排序 基于无指导学习策略的无词表条件下的汉语自动分词 被引量:65 2004年 探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统计量md ,并引入了峰和谷的概念 ,进而设计了相应的分词算法 .大规模开放测试结果显示 ,该算法关于字间位置的分词正确率为 85 .88% ,较单独使用互信息或t 测试差分别提高了 2 4 7%和 5 6 6 % . 孙茂松 肖明 邹嘉彦关键词:无指导学习 汉语自动分词 互信息 统计量 一种用于知识图谱中知识获取模型的构建方法及系统 本发明提供一种用于知识图谱中知识获取模型的构建方法,包括:构建由多个文本句子为输入数据,以及每个句子内任意两个实体在知识图谱中的关系为分类结果,组成的第一训练集,对第一神经网络进行训练;构建由多个知识图谱中的三元组组成的... 刘知远 韩旭 孙茂松文献传递