熊明明 作品数:7 被引量:3 H指数:2 供职机构: 昆明理工大学 更多>> 发文基金: 云南省自然科学基金 国家自然科学基金 云南省教育厅科学研究基金 更多>> 相关领域: 自动化与计算机技术 语言文字 政治法律 更多>>
越南语词法分析方法研究 伴随着计算机的日益普及,互联网的迅猛发展,越南语文本的数量在不停的增长,因而对越南语文本作智能化处理以及获取所需信息的需求日益迫切。在这样的社会需求下,越南语词法分析在自然语言处理技术的地位和作用日益重要。其性能将直接影... 熊明明关键词:最大熵 歧义消解 CRFS 词性标注 文献传递 一种基于条件随机场的越南语分词方法 本发明涉及一种基于条件随机场的越南语分词方法,属于自然语言处理技术领域。本发明包括首先对提取出的越南语语料进行分词建模,再把待分词的句子级测试语料通过建好的模型进行分词。本发明提出的基于条件随机场的越南语分词方法,对越南... 余正涛 熊明明 郭剑毅文献传递 基于最大熵模型的越南语交叉歧义消解 越南语中存在大量的交叉歧义.为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,本文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解.本文通过三种方法整理出包含... 熊明明 刘艳超 郭剑毅 余正涛 周兰江 陈秀琴基于最大熵模型的越南语交叉歧义消解 被引量:1 2017年 越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解越南语交叉歧义。 熊明明 刘艳超 郭剑毅 余正涛 周兰江 陈秀琴关键词:歧义消解 最大熵模型 CRFS 三维刑事诉讼中被害人补偿救济制度研究——基于刑事和解制度的视野 2014年 在社会主义和谐社会的主题下,行刑社会化和刑罚轻缓化趋势日益发展。在我国宽严相济政策下,催生了一种新的纠纷解决方式,即以刑事被害人为中心的,由加害人、受害人和国家参与的三维刑事诉讼结构模式"刑事和解"。我国刑事诉讼法确立了刑事和解制度,这一制度的确立对于被害人权益的保护无疑将发挥重要作用,但我国刑事和解制度对被害人的补偿救济却规定的十分笼统,只是确立了刑事和解的制度而并没有对诸如补偿期限、范围、后果等作出具体的立法,实践中缺乏操作。从三维诉讼中被害人获得补偿救济的正当性入手,在刑事和解制度下对被害人补偿救济制度研究是重要的。 张亚东 熊明明关键词:刑事诉讼 刑事和解 被害人 一种基于条件随机场的越南语分词方法 本发明涉及一种基于条件随机场的越南语分词方法,属于自然语言处理技术领域。本发明包括首先对提取出的越南语语料进行分词建模,再把待分词的句子级测试语料通过建好的模型进行分词。本发明提出的基于条件随机场的越南语分词方法,对越南... 余正涛 熊明明 郭剑毅文献传递 基于CRFs和歧义模型的越南语分词 被引量:2 2017年 通过对越南语词法特点的研究,把越南语的基本特征融入到条件随机场中(Condition random fields,CRFs),提出了一种基于CRFs和歧义模型的越南语分词方法。通过机器标注、人工校对的方式获取了25 981条越南语分词语料作为CRFs的训练语料。越南语中交叉歧义广泛分布在句子中,为了克服交叉歧义的影响,通过词典的正向和逆向匹配算法从训练语料中抽取了5 377条歧义片段,并通过最大熵模型训练得到一个歧义模型,并融入到分词模型中。把训练语料均分为10份做交叉验证实验,分词准确率达到了96.55%。与已有越南语分词工具VnTokenizer比较,实验结果表明该方法提高了越南语分词的准确率、召回率和F值。 熊明明 李英 郭剑毅 毛存礼 余正涛关键词:条件随机场模型 词法