国家高技术研究发展计划(2007AA12Z221) 作品数:17 被引量:229 H指数:10 相关作者: 张雪英 闾国年 唐旭日 陈小荷 张春菊 更多>> 相关机构: 南京师范大学 重庆邮电大学 江苏省国土资源信息中心 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国家社会科学基金 更多>> 相关领域: 天文地球 自动化与计算机技术 交通运输工程 经济管理 更多>>
一种基于Bootstrapping的中文领域术语获取算法 目前,领域词典构建正成为自然语言处理广泛应用的重要技术难题。现有的词典构建方法必须依赖大规模语料库和人工预处理,其复杂性和高投入使得其操作较为困难。本文针对小规模语料提出一种无需人工标注语料库的无监督机器学习方法FWBS... 潘霖 张雪英 吉根林关键词:BOOTSTRAPPING 文献传递 面向网页文本的地理要素变化检测 被引量:15 2013年 地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。 王曙 吉雷静 张雪英 赵仁亮 陈晓丹 余浩关键词:网页文本 信息抽取 文本解析 中文文本的地名解析方法研究 被引量:42 2010年 讨论了中文文本的地名解析流程,提出基于条件随机场和篇章地名关系的地名识别方法、基于局部模糊匹配的地名标准化方法以及基于认知显著度的地理编码方法,并构建了地名解析原型系统。实验显示,该系统可以获得较为满意的精确率、召回率和F-1值,同时讨论了地名词典的完备性、地名识别精度以及地名语义歧义消除等影响地名解析性能的主要因素。 唐旭日 陈小荷 张雪英关键词:地名识别 地理编码 地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别 地理空间关系描述的句法模式识别 地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、... 朱少楠 张雪英 张春菊关键词:句法模式识别 地理命名实体分类体系的设计与应用分析 被引量:24 2010年 自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称"GNEC")。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。 张雪英 张春菊 闾国年关键词:地理信息系统 信息共享 GIS时空数据模型在姓氏谱系研究中的应用 2012年 从应用GIS对中华姓氏历史进行分析与模拟的视角出发,提出一个基于事件的姓氏时空谱系数据模型,弥补了现有时空数据模型对姓氏时空分析存在的不足,为GIS对姓氏历史的时空分析研究奠定了基础。 卢刚 黎心灵土地管理空间数据知识与规则体系框架研究 被引量:3 2010年 通过对空间数据知识的介绍和规则归类,研究土地管理空间数据知识与规则体系框架模型,为解决土地管理空间数据的共享、应用探索可行途径。借鉴知识工程的基于领域知识解决数据共享、软件重用等问题的理论与方法,采取比较研究的方法,对比研究GIS一般领域和土地管理领域的知识与规则的相关理论。提出新的空间数据分类方法以及空间数据知识和规则体系的一般框架和挖掘路线,建立一个新的土地管理空间知识体系框架。 舒飞跃 闾国年 陆婧关键词:土地管理 空间数据 网络地图评价指标体系及其应用 被引量:10 2009年 随着因特网技术的迅速发展和普及,网络地图越来越受到大众用户的青睐。结合网络地图的功能和特点,通过分析影响网络地图性能的主要要素之间的层次关系,构建了包括数据、服务功能、搜索性能和操作四个方面的网络地图评价体系及其评价方法,从定量和定性的角度比较分析了MAPbar、MAPabc、百度地图、51地图、Google Map、微软的Windows Live search、搜狗、爱问、雅虎中国等中文网络地图的性能,讨论了中文网络地图存在的主要问题,比如地物命名规范化、自然语言查询、专业化程度、地图数据覆盖度和用户认可程度等方面。该研究可以为网络地图开发人员和用户提供参考,对推广和普及网络地图,具有一定的理科学义和实践价值。 张雪英 申琪君 龙毅关键词:网络地图 评价指标 地图服务 宗地统一编码过程中新旧代码无损转换方法 被引量:5 2012年 研究目的:通过对宗地统一编码分析,研究旧宗地代码向新宗地代码无损转换的方法。研究方法:理论分析与实例验证相结合。研究结果:(1)宗地统一编码过程中,应使用相同的范围作为城镇地籍调查、村庄地籍调查和农村土地利用现状调查的地籍区和地籍子区的范围;(2)对城镇地籍调查、村庄地籍调查中的调查区与街坊组合代码进行压缩,可实现新旧宗地代码的无损转换;(3)江苏省仪征市的转换实践表明该方法可行。研究结论:所有权宗地与使用权宗地新旧代码无损转换方法具有广泛的应用前景。 沈陈华 王德江关键词:地籍