付戈
- 作品数:3 被引量:3H指数:1
- 供职机构:国家互联网应急中心更多>>
- 发文基金:国家重点基础研究发展计划北京市科技计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向安全事件新闻的时间抽取与转换被引量:1
- 2015年
- 阐述了事件新闻文本的时间信息抽取与处理对事件研究的重要性,研究了安全事件新闻的时间抽取与转换。考虑到目前采用的基于时间抽取规范TIMEX2/3和机器学习的抽取处理方法得到的时间信息缺少完全统一的形式,在安全事件的舆情发现及分析等场景下很难直接利用的问题,提出了针对安全事件新闻中的时间信息抽取与转换方法。该方法首先对安全事件的新闻根据时间的分类分别对不同形式的时间进行抽取,然后利用六大时间转换算子及时间冲突处理算子输出其时间的年月日时分秒的统一格式。试验表明,采用该方法的抽取结果与使用条件随机场(CRF)的方式进行抽取的结果相差不大,并且在时间转换上的正确率达到90%以上。
- 李明月王树鹏王海平付戈
- 关键词:新闻舆情分析
- 基于散列链的云存储资源使用度量机制研究
- 2013年
- 云存储服务的一种主要收费模式为依据服务提供商度量的客户资源实际使用量进行计费。因此,支付方和服务提供商之间的信任问题成为这种商业计费模式的关键因素,并可能引发安全问题。一方面,云存储服务提供商或者内部人员可能声称更多的客户资源使用量而多收取服务费用;另一方面,支付方可能否认已使用的资源从而减少应支付的费用。提出了一种基于散列链的资源使用度量机制,对不同资源分别产生可验证的证据。对于多数资源,现有云存储计费机制可以依据资源使用总量产生证据,但是考虑到存储量随时间不断波动并且资源的计费不仅与存储量相关还与时间因素相关,因此现有机制不能完全适用。提出的存储资源使用度量机制同时考虑时间和存储量2个因素,利用与计费方式关联的散列链产生证据,实现了原有机制的改进,达到了资源使用的可验证度量目标。
- 刘玫付戈李奕希张鸿刘欣然杜翠兰
- 关键词:散列链
- 面向多应用多租户的消息数据订阅关键技术研究被引量:2
- 2017年
- 针对企业级多应用多租户海量数据分析业务的业务痛点,为了减少数据订阅带来的资源问题,提高资源利用率,促进企业级大数据平台建设及应用的"可持续、集约型"发展,文章提出了一种面向Kafka分布式异步消息中间件的消息数据按需复杂订阅解决方案,实现在多应用多租户环境下根据用户需求进行"行级"及"列级"消息数据订阅功能。并研制了按需复杂订阅原型系统,很好地解决企业级应用的投资大、灵活性差等问题。实验及测试结果表明基于Kafka的复杂规则订阅系统具有较高的数据吞吐率,具有较强的实用性。
- 付戈张欣华李超