邵翔宇
- 作品数:4 被引量:15H指数:3
- 供职机构:国家数字交换系统工程技术研究中心更多>>
- 发文基金:国家重点基础研究发展计划国家科技支撑计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于模板有限自动机的正则表达式匹配算法被引量:3
- 2016年
- 采用规则分组的办法解决DFA状态爆炸问题,随着规则数目的增加,空间压缩效率大大降低。针对此问题提出了模板有限自动机分组算法。该算法基于规则模板对规则集进行分组,各分组分别构建匹配引擎;同时,根据实际规则数目和系统结构改变规则子集的数目,达到更好的匹配效率。理论分析和实验表明,与传统分组算法相比,在存储空间压缩相当情况下,分组数目大大减少;与其他典型的DFA改进算法相比,预处理时间和存储空间有数量级别的缩减,且匹配速率没有明显降低。
- 邵翔宇刘勤让孙淼
- 关键词:正则表达式
- 基于多维立方体的正则表达式匹配算法被引量:5
- 2014年
- 针对特定条件下含有".*"的正则表达式规则相互作用产生的状态爆炸问题,本文提出一种基于多维立方体的确定性有限自动机(Deterministic Finite Automaton,DFA)结构,将冗余状态按维度划分并压缩,并设计相应的多维立方体确定性有限自动机(Multi-Dimension-Cube-DFA,M-D-Cube-DFA)算法,通过构造动态交点的方法实现等价的状态转移.理论分析和仿真实验表明,与DFA算法相比,在维持时间复杂度不变的基础上对状态数目和存储空间进行了对数级别压缩.
- 宫阳阳刘勤让邵翔宇朱圣平邢池强彭志彬贺业里
- 关键词:正则表达式自动机多维立方体
- 基于规则模板的正则表达式分组算法被引量:8
- 2016年
- 采用规则分组的方法解决确定型有限自动机(Deterministic Finite Automata,DFA)状态爆炸问题,随着分组数目的增加,匹配效率大大降低.本文提出正则表达式的输入驱动特性理论,并基于此提出了基于规则模板的分组算法——模板有限自动机.模板有限自动机算法基于规则模板对规则集进行分组,各分组分别构建匹配引擎.理论分析和实验表明,与典型的DFA改进算法相比,预处理时间和存储空间有2~3个数量级别的缩减,且匹配效率没有明显降低.
- 邵翔宇刘勤让谭力波
- 关键词:正则表达式
- 基于多维有限自动机的DFA改进算法被引量:5
- 2015年
- 多个正则表达式规则编译成一个DFA(deterministerfiniteautomata)时,会产生状态爆炸、存储急剧增加的现象。针对最严重的状态爆炸问题,从信息论的角度给出了解释,并提出多维数学模型,将冗余状态分为0维状态和1维状态,通过前者按照维度压缩,后者动态构建的方法将空间复杂度降到理论下界,并在此基础上提出多维有限白动机(MFA,multi—dimensionalfiniteautomata)。实验表明,MFA构造时间比XFA略少,比DFA、STT冗余压缩算法和Hybrid.FA降低了2~3个数量级;存储空间比XFA略高,比DFA、STT冗余压缩算法、mDFA、Hybrid-FA降低了1-2个数量级;匹配时间比DFA、Hybrid.FA略多,但是比XFA略少,比sTT冗余压缩算法和mDFA降低了1-2个数量级。
- 宫阳阳刘勤让杨镇西邵翔宇邢池强焦慧娟彭志彬
- 关键词:正则表达式DFA有限自动机