- 基于索引行聚类的英语动词型式自动识别与提取研究
- 型式化语言在自然语言中广泛存在。概括和提取语言型式对语言研究、辞书编纂、语言教学等具有重要意义。传统研究中的型式提取主要采用手工分析方法,耗时费力,无法应对大规模语料。已有的为数不多的型式自动识别研究效果欠佳,适用范围有...
- 于涛
- 关键词:相似度聚类
- 英语动词型式自动识别研究被引量:4
- 2017年
- 本文采用相似度分析的方法,在语料库索引行自动聚类的基础上实现英语动词型式的自动识别与提取。研究发现:第一,检索词的不同、索引行的数量及索引行间的差异程度三者共同影响索引行聚类的准确率;基于聚类内部效度确定索引行分组数量的方法更为灵活、开放,结果也更为可靠,准确率更高。第二,两次聚类中英语动词型式自动识别平均准确率分别达到90.99%和95.91%,均高于前人研究中81%的平均准确率。此外,通过对错误分组索引行的分析发现,导致型式自动识别错误的主要因素为插入语成分及特殊句式。本文所提出的型式自动识别与提取模型不仅具有准确率高和灵活变通的特点,而且具有广泛的适用性。
- 于涛梁茂成
- 关键词:聚类
- If条件句句法语义特征的语体倾向性研究被引量:1
- 2015年
- 英语条件句是句法、语义接口的重要语法现象,是语法研究的核心议题之一,其使用是否具有语体倾向性,少有人涉及。本研究基于当代英语平衡语料库,考察4种语体中if条件句句法和语义层面差异。数据显示:1.If条件句在4种语体中所占比例依次为学术>新闻>小说>通用;2.条件句中时体及情态对4种语体吸引力各有不同;3.假设及开放条件句在4种语体中比例差异较大。以上结果证实if条件句具有较强语体依赖性,语体间相似度在频率与形式语义两个方面体现不同特点。频率上,学术与通用处在两极,处于中间的新闻与小说最为相近;但形式及语义上,通用与学术最为相似,而小说与新闻较为类似。
- 于涛
- 关键词:条件句句法语义语料库
- 调节抑或协同——二语习得社会派内之对比研究被引量:2
- 2014年
- 二语习得社会派范式下的社会文化理论与社会认知理论在哲学基础、理论起源、研究方法及研究对象等方面有众多相似之处,但在语言观、学习观、认知观、关于调节抑或协同等方面又存在诸多差异,这给研究者带来很多困惑,因而对两种理论视角下二语习得研究的异同进行比较分析,可以厘清两者异同,为研究者在二语习得研究实践中理论视角的选择提供帮助。
- 于涛
- 关键词:二语习得社会文化理论社会认知理论
- 英语被动结构多维度对比研究被引量:7
- 2014年
- 三代布朗语料库的建成,使得被动结构动态分阶段历时考察成为可能。本研究对被动语态在英语变体及语体间差异的历时考察发现:1)BE被动结构呈下降趋势,而GET被动结构呈急剧增长的相反态势,同时具有"前30年快,后20年慢"的特点;2)BE长被动结构频数呈下降趋势,且与BE被动结构下降速度一致;3)BE被动结构语义韵变化幅度很小,英语变体间差异不大,但三种语义韵的分布与语体正式程度密切相关。
- 于涛梁茂成
- 关键词:英国英语美国英语语体差异