林丽
- 作品数:11 被引量:14H指数:2
- 供职机构:中国人民解放军外国语学院亚非语系更多>>
- 发文基金:教育部人文社会科学研究重大课题攻关项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字哲学宗教更多>>
- 从Fillmore文献分析框架语义学发展态势被引量:2
- 2016年
- 框架语义研究是将语言学研究与知识工程实践有机结合的典范。其创始人Fillmore自1975年至2011年间独立或以第一作者撰写的21篇框架语义学重要文献体现出其研究的开拓性和纲领性。系统性地进行文献评述,基本可以展现框架语义研究的主脉,完整归纳出其特点与优势,准确分析其不足与发展趋势。特点与优势是该领域相关研究的重要选题依据,不足和发展趋势将成为该领域相关研究新的方向和突破口。
- 林丽
- 关键词:框架语义学
- 基于核心依存图的新闻事件抽取
- 2016年
- 基于核心依存图(kernel dependency graph,KDG)的事件抽取主要通过语义结构进行匹配。在已构建的越-英-汉南海新闻框架网络基础上,主要对KDG语义分析模式、基于核心依存图的新闻事件抽取分析以及核心依存图生成和新闻事件信息抽取进行研究。研究重点包括典型KDG、零形式框架元素和框架元素融合等特殊KDG的分析模式,面向事件信息抽取的KDG的表示模式和标注例句自动生成KDG的过程。研究结果表明,基于KDG的事件信息抽取方法直观明了、语言学理据充分,具有一定的可行性,对新闻文本中的语义线索发现较为适合。目前已经可以从已完成框架语义标注的例句中自动生成KDG并抽取出相应的事件模型。
- 林丽
- 关键词:事件抽取新闻越南语
- 面向信息处理的越南语主谓谓语句句式转换研究被引量:2
- 2013年
- 越南语和汉语语言类型相同,也存在类似于汉语主谓谓语句的语言现象,但对它的界定和分析常产生分歧,给计算机理解和处理越南语造成了障碍。从HNC(概念层次网络)理论语句句类和格式的角度对越南语主谓谓语句的各种类型进行分类和分析具有重要的意义。总的看来,越南语大多数主谓谓语句习惯采用违例格式和省略辅块标记符号的基本格式。在违例格式的句子中,两个相邻的GBK(广义对象语义块)之间缺少必要的标志符,对其自动识别比较困难;在省略辅块标记符号的基本格式中,需要还原出辅块标志符,这是计算机理解处理越南语语句的一个难点。
- 林丽
- 关键词:越南语主谓谓语句语句格式语言信息处理
- 面向信息处理的越南语主谓谓语句句式转换研究
- 语和汉语语言类型相同,也存在类似汉语主谓谓语句的语言现象,但界定和分析常产生分歧,对计算机理解和处理越南语形成了障碍。从HNC(概念层次网络)理论语句句类和格式的角度对越南语主谓谓语句的各种类型进行分类和分析具有重要的意...
- 林丽
- 基于新闻语料库的越南语框架语义标注研究被引量:3
- 2013年
- 越南是中国的重要邻国,相应的越南语海量信息处理正日益凸显其重要性。参考国内外有关框架语义标注的研究和实践,我们在构建越南语新闻语料库,对越南语文本进行分词和词性标注、命名实体标注等研究的基础上,尝试构建越南语框架语义知识库并初步探索了框架语义标注在越南语新闻事件抽取中的应用。
- 林丽
- 关键词:框架语义越南语新闻
- 越南语给予类动词框架语义分析被引量:1
- 2012年
- 词汇语义的形式化表征是自然语言理解的重要环节,框架语义学重点开展对概念结构和句法—语义映射关系的描写,符合语义知识表示的需求。本文基于框架语义学理论,将越南语中给予类动词作为目标词,较为系统地考察了其句法语义特征并对此进行了分类,尝试建立越南语给予类词元库,并根据不同类型词元及其框架元素构建出给予框架库。
- 林丽毕玉德
- 关键词:自然语言理解框架语义学
- 道教与越南传统文化被引量:1
- 2003年
- 黄敏林丽
- 关键词:道教传统文化民间信仰风俗习惯
- Web语料抓取中基于相似度的URL过滤规则生成算法
- 2014年
- Web语料是语料库的重要组成部分,但对冗余URL的访问开支影响大规模语料爬取工作的质量和效率,使用高效的URL过滤规则可提高Web爬取的质量和效率.因网站虚拟目录下的文件分布不均匀,为发现目标文件聚集区域,提出一种生成URL过滤规则的方法.该方法使用正则表达式将URL元素通配化,归并相同元素后划分为子集,再计算子集内URL之间的相似度,并根据相似程度较高的URL构造虚拟目录树,基于虚拟目录树生成语料爬取的URL过滤规则和分类规则.文中详细介绍虚拟目录树的生成算法,并通过实验对比不同相似度阈值对目录树生成结果和URL过滤效果的影响.
- 陈荟慧舒云星林丽
- 关键词:URL过滤
- 多语种Web新闻语料抓取的通用模型研究被引量:1
- 2013年
- Web语料是外语语料库的重要组成部分,语料抓取系统要适用于不同语种、不同结构的网站。文中介绍了针对内容管理型新闻网站设计的语料抓取软件模型,模型根据新闻网站中标题页和内容页的模版特点,采用正则表达式和动态字符串方法定义信息抓取路径和信息块抓取规则,并通过对抓取路径的去噪和去重过滤,保证每次Web访问均能抓取有效数据。基于该模型的语料抓取工具NPCrawler在C#和SQL Server2005环境下实现,通过在不同结构的多个语种的网站中实际应用证明,Web新闻语料抓取结果命中率和准确率接近1 00%,且抓取效率较高。
- 陈荟慧舒云星林丽
- 关键词:正则表达式多语种WEB爬虫
- 越南语给予类动词的语义结构和层级分类研究
- 词汇语义的形式化表征是自然语言理解的重要环节,框架语义学重点研究对概念结构和句法—语义映射关系的描写,符合语义知识表示的需求。本文基于框架语义学理论,将越南语给予类动词作为目标词,较为系统地考察了其句法语义特征并进行分类...
- 林丽毕玉德
- 关键词:自然语言处理越南语动词框架语义
- 文献传递