郑亚斌
- 作品数:6 被引量:39H指数:2
- 供职机构:清华大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字自然科学总论更多>>
- 基于最大匹配和马尔科夫模型的对联系统
- 对联,雅称"楹联",俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式。可以说,对联艺术是中华民族的文化瑰宝。如何利用计算机自动生成对联是一个值得研究的方向,本文开发了一种基于前向最大匹配和一阶...
- 郑亚斌曹嘉伟刘知远
- 关键词:动态规划对联
- 文献传递
- 基于最大匹配和马尔科夫模型的对联系统
- 对联,雅称“楹联”,俗称对子,它言简意深,对仗工整,平仄协调,是一字一音的汉语语言独特的艺术形式,可以说对联艺术是中华民族的文化瑰宝,如何利用计算机自动生成对联是一个值得研究的方向。
本文开发了一种基于前向最大...
- 郑亚斌曹嘉伟刘知远
- 关键词:汉字处理数理语言学马尔科夫模型
- 文献传递
- 中文博客标签的若干统计性质
- 随着 Wleb2.0理念日益深入人心,博客作为一种网络日志的形式,成为网络上的主要应用之一。而主要出现在博客、网络相册等系统上的,依靠大量用户使用自由选择的词汇作为标签(Tag)来对事物进行标记的人工分类的“大众分类法”...
- 刘知远司宪策郑亚斌孙茂松
- 关键词:标签齐夫定律复杂网络
- 汉语依存句法网络的复杂网络性质被引量:30
- 2008年
- 基于大规模语料库,建立了汉语依存句法网络,并从复杂网络的角度对该网络进行了系统的实验考察。实验结果表明汉语依存句法网络具有复杂网络的两个基本性质:小世界效应和无标度特性,并在其他方面也体现了复杂网络的重要性质。汉语的这些句法上的统计特性,与捷克语、德语和罗马尼亚语等极为相似,说明虽然不同语言有着极为不同的句法规则,但它们具有类似的统计特性,这种共性对人类语言本质的研究具有一定的启发意义。
- 刘知远郑亚斌孙茂松
- 关键词:汉语复杂网络小世界同现
- 中文歌词的统计特征及其检索应用被引量:9
- 2007年
- 我们在歌词上做了一些传统的自然语言处理相关的实验。歌词是歌曲语义上的重要表达,因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实验表明,其分布基本符合齐夫定律。利用向量空间模型的表示,我们可以找到比较相似的歌词集合。另外,我们探讨了如何利用歌词中的时间标注信息进行进一步的分析:例如发现歌曲中重复片段,节奏划分,检索等。初步的实验表明,我们的方法具有一定的效果。
- 郑亚斌刘知远孙茂松
- 关键词:中文信息处理歌词齐夫定律K-近邻节奏
- 中文歌词的统计特征及其检索应用
- 我们在歌词上做了一些传统的自然语言处理相关的实验。大部分的歌曲都具有与其相匹配的歌词,歌词也是歌曲语义上的重要表达。因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实...
- 郑亚斌刘知远孙茂松
- 关键词:歌词齐夫定律K-近邻节奏
- 文献传递