熊文新
- 作品数:31 被引量:164H指数:8
- 供职机构:北京外国语大学更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金国家自然科学基金更多>>
- 相关领域:语言文字自动化与计算机技术文化科学经济管理更多>>
- 信息检索Query语言分析
- 熊文新
- 关键词:信息检索信息需求
- 对应频率和翻译方向对翻译歧义词加工的影响
- 2023年
- 本文从不同翻译歧义词之间和同一翻译歧义词内部对应频率(英语词对应汉语词以及汉语词对应英语词的频率)差异对比的角度出发,在英汉双语平行语料库中获取翻译歧义词对应频率的统计数据,并通过两个掩蔽启动范式下的词汇判断任务,以反应时为指标,探讨了对应频率及翻译方向对非平衡汉英双语者翻译歧义词加工的影响,并考察了二者的交互效应。研究发现:1)对应频率越高的词,加工反应时越短;2)非平衡汉英双语者能够更快地加工在L2-L1方向的翻译歧义词;3)二者交互效应显著,但两个实验中交互模式存在一定的差异,实验1不同翻译歧义词之间翻译方向对对应频率的影响,体现在L2-L1方向,而实验2同一翻译歧义词内部这种影响在两个翻译方向均有体现。
- 赵全备邢红兵熊文新
- 关键词:翻译方向
- 汉语真需要词间空格吗——对汉语分词连写献疑被引量:4
- 2014年
- 汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语"切分单位"的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。
- 熊文新
- 关键词:汉语分词语言规划
- 借助汉语以义索词的英语用法检索
- 2014年
- 有了一定的表达意图却找不到合适的英语表述方式,是中国学生经常面临的问题。借助句对齐的英汉平行语料库,能够从汉语出发检索出与之对应的英语实例。然而当前基于语言形式的语料库检索,其检索结果必须与用户输入的特定检索项匹配。为尽可能全面准确地获取地道的英语表述,本文借鉴信息检索的查询扩展策略,利用同义词词林等语义资源,介绍一种基于汉语同义表述的意义检索,在检索过程同时利用浅层语法分析,使检索精度得以保证。
- 熊文新
- 关键词:词汇语义双语语料库
- 一个用于英语学习词典编纂的机辅词编系统的实现
- 2008年
- 文章探讨了国内外机辅词典编纂系统的研究现状以及各系统的构架,并围绕学习词典编写体例描述词典数据库的结构及词典语法体系,介绍机辅词典编纂系统的用户界面及反馈回显等人机交互方法如何贯穿于词典编纂的整个过程,最后给出了系统的改进方向。
- 熊文新陈国华
- 关键词:学习词典用户界面
- 信息检索用户查询语句的停用词过滤被引量:23
- 2007年
- 针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。根据候选词语的Bigram属性和句中不同位置的分布特点,给出了在线动态识别停用词的方法。实验结果表明,该文的方法比单纯根据静态停用词表标注效果要好。
- 熊文新宋柔
- 关键词:用户查询停用词
- 基于学习者英语语料的类联接研究概念、方法及例析被引量:35
- 2009年
- 本文主张类联接研究应兼顾词形、语法类别以及篇章和语类等不同语言层面来观察搭配行为。具体可包含:单个语法范畴的类联接、语法串分析、词形与语法范畴的类联接、不连续结构类联接、语法范畴与话语、语体的类联接等。本文结合中国英语学习者语料进行了示例分析,旨在说明可以结合类联接开展中间语对比分析、语体分析等。
- 许家金熊文新
- 关键词:类联接学习者语料库语料库语言学
- 留学生“把”字结构的表现分析被引量:27
- 1996年
- 熊文新
- 关键词:留学生语义模式汉语中介语汉语教程性格因素
- 信息检索需求描述中的词语区域凸显
- 2008年
- 根据对当前主流信息检索测试Query的形式和内容分析,通过正则表达式将SGML形式的Query表述区分为不同描述域和主题功能块,针对处于不同区域的词语实施不同的加权策略。实验表明,结合主题词语的区域凸显和TF×IDF的加权方法比单纯TF×IDF方法MRR值高出26.67%。
- 熊文新宋柔
- 关键词:信息检索功能块
- 留学生汉语语料中“把”字结构的统计与分析
- 本文建立在“汉语中介语语料库系统”较大规模语料基础上,通过“把”字结构与其他相关句式的转换关系,确定“把”字结构使用的有关标准,再根据“把”字结构自身的语义特征、语义分类,对留学生汉语课本、留学生书面汉语语料中出现的“把...
- 熊文新
- 关键词:语法对外汉语教学