王海起
- 作品数:60 被引量:258H指数:8
- 供职机构:中国石油大学(华东)更多>>
- 发文基金:国家自然科学基金山东省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:天文地球自动化与计算机技术交通运输工程环境科学与工程更多>>
- 微博“路面塌陷”事件的时空分布特征研究
- 2022年
- 选取关键词“路面塌陷”,利用网络爬虫技术收集2013-01-01~2018-01-01期间的8万多条相关微博数据,然后利用BTM模型区分每条微博的主题类别并赋予其情感属性,对“塌陷事件”在时间和空间上的分布特征进行分析;最后引入地理探测器方法的文本角度研究关注度因子与主题因子两者对主观情绪强度的影响机制。结果表明路面塌陷事件的关注度正在逐年下降,塌陷事件数量呈现上升趋势,主观情绪强度较高的多为造成伤亡类的主题事件。通过地理探测器发现相比于关注度因子,主题因子对主观情绪强度空间分异情况的影响力比较大,同时关注度因子、主题因子交互后的因子影响力为非线性增强。为今后路面塌陷相关研究提供参考和指导,为各级决策部门合理处理路面塌陷事件,正确把握舆情态势提供依据。
- 王海起徐建波孔浩然李留珂王琼王志海
- 关键词:主题模型情感分析
- 基于数据驱动的区域交通TOD时段识别方法研究
- 2014年
- 提出了一种基于数据驱动的TOD时段识别方法,对区域不同路口、不同流向、不同时刻的交通流数据,采用多元相关分析、主成分分析等在空间尺度上识别出路网的关键路口和关键交通流向,采用层次聚类在时间尺度上识别出不同的交通状态和各TOD时段.以9个道路交叉口流量数据为应用实例,获取其中6个不同路口方向为关键交通流,并将不同时刻观测值聚类为5种不同的交通状态,进而识别出1d的8个TOD时段,每个时段分别代表干线或区域高、中、低等不同流量时期,表明了该方法的有效性.
- 王海起张腾王劲峰孟斌
- 关键词:交通状态层次聚类
- 基于集成学习算法的PM_(2.5)浓度值预测被引量:3
- 2021年
- 文章分析了PM_(2.5)浓度与其他污染颗粒物及气象因素的相关性,构建出模型的输入特征,基于集成学习算法,选择随机森林(RF)和梯度提升树(GBDT)算法,分别建立PM_(2.5)未来7日浓度预测模型。随机选取2个监测站点的数据用于研究和评估模型。结果表明,与单一回归模型相比,集成学习算法能够较好地捕捉PM_(2.5)浓度与各输入变量间的非线性关系,RF和GBDT模型能够在未来多日PM_(2.5)浓度的预测中表现较好,预测结果较符合PM_(2.5)真实趋势。
- 孔宇王海起张浩然夏可
- 基于粒子群算法的交通信号离线配时优化方法
- 一种基于粒子群算法的交通信号离线配时优化方法,采用实数编码方式表示区域内各信号交叉口的各相位绿灯时间,在粒子群算法求解过程中,不同的配时方案对应于不同的粒子,每个粒子的适应度利用微观交通模拟获取的总延迟时间进行评价,最后...
- 王劲峰王海起韩卫国孙腾达廖一兰
- 文献传递
- 基于R语言的交通流量数据可视化应用被引量:2
- 2019年
- 对于目前交通管理系统采集海量数据利用效率不足的问题,以青岛胶南市的部分交通流量数据为例,通过R语言对交通流量的可视化探索R在交通流量可视化中的应用;利用R语言的简单编码对交通流量数据实现不同形式的可视化;结合胶南市部分路口的监测线圈数据对其交通流量的状况用R进行可视化;通过R绘制地图、趋势图、比例图、分面图、三维图来分析研究R的可视化效果。结果显示,R语言可以通过简洁的代码设计来实现良好的数据分析效果,在可视化数据挖掘中的优势明显。
- 李学伟王海起
- 关键词:可视化R语言
- 利用中文微博数据的地理情感特征挖掘被引量:11
- 2020年
- 情感是一类存在于空间和时间中的地理知识,但其获取存在难度。位置社交网络为情感的度量提供了优质数据源,基于2016年9月19日-25日和2016年10月1日-7日(国庆假期)两周发布的345万条带有地理位置的新浪微博数据,通过清洗、分词以及基于词典的情感度量方法,计算了每条微博的情感倾向,通过情感聚合探测了城市微博情感的空间分布特征,并在格网尺度上分析了微博情感在时空域中的热/冷点模式及趋势。研究表明:微博整体情感倾向以积极为主,个体情感的空间分布具有随机性,城市情感的空间分布极其不均匀,表现为局部地区情感高值/低值聚集区与低-高值/高-低值异常区伴随出现的分片分布特征,且日常时期这种局部差异性更为显著;以时空立方体为格网单元,发现中国东西部地区呈现对立的情感模式,东部以情感热点模式为主,且两个时期表现为不同的时空热点类型,西部则以情感冷点模式突出,且相比于日常时期,国庆假期的冷点模式存在加强趋势。研究结果揭示了微博情感在地理时空域分布的多样性和差异性,为分析中国居民幸福感、指导社会经济发展规划等提供辅助支持。
- 王海起陈冉魏世清桂丽费涛
- 关键词:地理情感情感计算
- 联合词汇增强的中文细粒度地理命名实体识别模型研究被引量:3
- 2023年
- 命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:(1)与无词汇增强功能模型相比,具有词汇增强功能模型在细粒度命名实体识别任务中F1-score提升了10%左右;(2)针对词汇增强方法进行的3处改进使模型在细粒度地理命名实体识别任务中F1-score提升了0.36%~2.35%;(3)与对抗训练改进、随机权重平均改进相比,预训练模型改进对地理命名实体识别精度的影响最大。
- 李发东王海起孔浩然刘峰王志海王琼徐建波单宇飞周啸宇闫峰
- 关键词:命名实体识别自然语言处理
- 基于位置签到数据的城市空间分析与可视化被引量:5
- 2017年
- 微博签到是一种典型的基于位置的社交服务,反映出社交用户与城市公共空间的互动,海量的社交位置签到数据为城市研究提供了全新的视角。本文基于香港、深圳两个城市2014年1月至2015年1月时间段内的新浪微博签到数据,从签到数据空间特性、旅游热点分布和居民活动空间3个方面对城市空间进行了综合分析:空间相关性分析结果表明签到事件在城市空间的分布具有明显的聚集性,并根据空间扫描统计结果依次标识出签到事件高值聚集区;针对旅游类签到数据分析发现两城市旅游关注度的时间变化趋势一致且峰值与我国假期时间分布相吻合,旅游热点主要分布于城市中心地带;以签到事件的规模、强度和集聚程度作为居民活动的表征分析城市活动空间特征,结果表明居民活动的核心圈层受到传统行政区划影响但分布已初步呈现"多心开敞"的空间形态。
- 陈冉王海起孟斌桂丽刘玉
- 基于GAN的高光谱溢油检测实验方案设计被引量:2
- 2022年
- 为实现高精度的海洋溢油高光谱遥感检测,设计了一种基于生成对抗网络(GAN)的高光谱溢油检测实验方案。方案利用光谱归一化和主成分分析方法对高光谱溢油图像进行预处理,以提高计算效率;构建以生成器和判别器对抗训练为特色的GAN网络模型,以实现端到端的溢油检测;利用训练好的判别器对溢油高光谱影像进行分类。为验证新方法的有效性,利用在2010年7月大连新港海上溢油事故中获取的机载高光谱数据开展了实验验证。结果表明,提出的方法在2套数据集上的总体分类精度相对于RF和SVM分别提升了2.33%和0.77%,Kappa系数达到了96.17%和95.56%。可见设计的方案能够实现高精度的溢油检测。
- 宋冬梅王斌王海起樊彦国
- 关键词:高光谱图像
- 基于网格划分的城市短时交通流量时空预测模型被引量:6
- 2022年
- 准确的交通流量预测在帮助交通管理部门采取有效的交通控制和诱导手段以及帮助出行者合理规划路线等方面具有重要意义。针对传统深度学习模型对交通数据时空特性考虑不足的问题,在卷积神经网络(CNN)和长短时记忆(LSTM)单元的理论框架下,结合城市交通流量的时空特性,建立了一种基于注意力机制的CNN-LSTM预测模型——STCAL。首先,采用细粒度的网格划分方法来构建交通流量的时空矩阵;其次,利用CNN模型作为空间组件来提取城市交通流量不同时期下的空间特性;最后,利用基于注意力机制的LSTM模型作为动态时间组件来捕获交通流量的时序特征和趋势变动性,并实现交通流量的预测。实验结果表明,STCAL模型与循环门单元(GRU)和时空残差网络(ST-ResNet)相比,均方根误差(RMSE)指标分别减小了17.15%和7.37%,均绝对误差(MAE)指标分别减小了22.75%和9.14%,决定系数(R2)指标分别提升了11.27%和2.37%。同时,发现该模型在规律性较高的工作日的预测效果好于周末,且对工作日早高峰的预测效果最好,可见该模型可为短时城市区域交通流量变化监测提供依据。
- 王海起王志海李留珂孔浩然王琼徐建波
- 关键词:短时交通流量预测卷积神经网络