刘彩虹 作品数:17 被引量:39 H指数:3 供职机构: 大连外国语大学 更多>> 发文基金: 教育部人文社会科学研究基金 国家社会科学基金 辽宁省高等学校优秀人才支持计划 更多>> 相关领域: 自动化与计算机技术 文化科学 自然科学总论 经济管理 更多>>
向量内积策略的多支持度正负关联规则挖掘 被引量:1 2011年 在研究负关联规则相关特性的基础上,将向量内积引入到该领域,提出了一种基于向量内积的多最小支持度正负关联规则挖掘算法。考虑到事务数据库中各项集分布不均而导致的单一最小支持度难以设定的问题,采用了多最小支持度策略,设计了一种能同时挖掘出频繁与非频繁项集,以及从这些项集中挖掘出正负关联规则的算法。实验结果表明,该算法仅需扫描一次数据库,且具有动态剪枝,不保留中间候选项和节省大量内存等优点,对事务数据库中负关联规则的挖掘具有重要意义。 刘彩虹 刘强关键词:负关联规则 频繁项集 非频繁项集 建构主义指导下的“网页设计与制作”教学设计 被引量:1 2012年 阐述了在文科高校的"网页设计与制作"课程教学中采用建构主义理论作为指导的理论基础、教学过程、教学设计以及教学中要注意的问题。此教学方法的宗旨不是传授最终真理,而是倡导让学生在教师的引导下,对所学的课题进行探索、分析、研究,更注重在实践操作中培养学生实践能力和探索能力,带动学生对其它相关学科的关注和投入,有益于其他课程的学习。 刘彩虹 祁瑞华关键词:建构主义 网页设计 教学改革 辽宁省协同创新战略联盟网络演化分析与风险研究 被引量:2 2016年 科技进步与经济竞争让企业、高校、科研院所等机构意识到仅依靠自身力量难以满足市场多样化需求,甚至危及生存.事实证明,战略联盟是促进技术创新,维持长期竞争优势的有效手段,本文以基于协同理论的创新战略联盟为研究对象,以辽宁省协同创新战略联盟网络结构的动态演化为研究主线,从复杂网络的角度分析联盟网络的网络特性指标,分析了辽宁省创新战略联盟的发展现状、特点及存在风险,并讨论了战略联盟良性发展的对策,以期望促进辽宁省经济持久健康发展. 刘彩虹 祁瑞华关键词:协同创新 战略联盟 复杂网络 基于向量内积的非频繁项挖掘算法研究 被引量:2 2011年 针对负关联规则中非频繁项集的生成问题,将向量内积引入到该领域。通过对事务数据库的布尔化表示及对数据存储结构的合理分配,提出了一种新的非频繁项集快速生成算法。该算法首先将布尔化所得矩阵中的向量进行内积运算,通过逐层递增的思想,用两级支持度模型来约束非频繁项集与频繁项集的产生,使非频繁项集不仅可由频繁项集之间连接产生,而且可由频繁项集与非频繁项集、非频繁项集与非频繁项集之间连接产生。实验结果表明,该方法仅需扫描一次数据库,且具有动态剪枝、不保留中间候选项、不丢失非频繁项集和节省大量内存等优点,对数据库中负关联规则及各项集中低频率、强相关模式等相关算法的研究具有重要意义。 刘彩虹 刘强 李爱平关键词:数据挖掘 负关联规则 频繁项集 非频繁项集 基于知识库的图书评论主题抽取研究 被引量:3 2019年 【目的】尝试在图书评论主题抽取中引入自然语言语义信息。【方法】将常识知识库的全局语义信息应用到图书评论主题词发现和主题聚类任务中,自动抽取评论中的显性主题词和隐性主题词。【结果】实验结果表明:与双向传播算法相比,基于知识库方法抽取结果的句覆盖率高出30.8%,主题词汇多样性高出0.36%。以此为基础绘制主题词共词聚类图谱,结合知识网络中的节点中心度呈现各个类簇中的关键主题词。【局限】由于目前没有成熟的图书评论领域知识库,本文主题挖掘过程未引入领域知识,还未达到最理想效果。【结论】基于知识库方法有助于提高图书评论主题抽取的句子覆盖率和主题词汇多样性。 祁瑞华 周俊艺 郭旭 刘彩虹关键词:知识库 图书评论 主题抽取 典籍英译作者身份识别研究 被引量:2 2015年 【目的】分析典籍英译作者身份识别的关键问题,提出不完整数据作者身份识别的有效方法。【方法】针对诗词典籍篇幅短小和语料不平衡的特点,建立基于词汇、句子和语篇层面的文体特征向量空间模型,提出用于不完整数据作者身份识别的加权朴素信念分类算法。【结果】加权朴素信念分类算法可以有效改善朴素信念分类算法性能,与目前主流分类算法对比实验表明其在不完整数据集上具有很好的综合性能。【局限】需进一步扩展数据集的样本数量和作者数量,在大数据集上提高文体特征提取效率和作者身份识别的准确性。【结论】提出的多层面文体特征模型和加权朴素信念分类算法在诗词典籍英译作品集上具有较好的准确性和应用性。 祁瑞华 霍跃红 郭旭 刘彩虹关键词:典籍英译 作者身份 不完整数据 基于模块密度的差分进化社区发现技术 2016年 提出了一种基于模块密度的差分进化社区发现算法(community detection based on differential evolutionary algorithm,CDDEA).在CDDEA算法中,通过调节一个参数可以识别出不同层次的社区结构.在真实世界网络和计算机人工合成网络上的实验表明,CDDEA能够有效探测复杂网络中的社区结构. 刘彩虹关键词:复杂网络 差分进化 模块密度 面向工作过程的计算机公共课程教学模式研究 2016年 高校计算机公共教学的基本目标是培养非计算机专业学生的计算机综合应用能力,即能够运用计算机解决本专业教学、工作、科研和日常生活中各种问题的综合能力。本文分析了当前高等外语院校开展计算机公共课程的重要性以及现状,阐述了面向工作过程的计算机公共课程教学模式的主旨思想,结合所在学校的学科特点和教学改革经验,就如何将计算机公共课程与社会需求、学生就业能力储备有机结合进行了探讨,教学实践证明,面向工作过程的计算机公共课程教学模式有益于增强学生的计算思维能力和计算机应用能力。 刘彩虹 祁瑞华 郭旭关键词:教学模式 中文微博作者身份识别研究 被引量:9 2017年 本文针对中文微博篇幅短小、无间隔标记等特点,建立了由词汇特征、浅层句法和深层句法特征集组成的中文微博作者文体特征模型,选取支持向量机、序列最小优化支持向量机、朴素贝叶斯和决策树算法在公开微博语料上进行算法对照实验、特征集组合实验和各组文体特征的作者身份识别实验。实验结果验证了本文模型在中文微博作者身份识别任务中的高准确率、召回率和时间效率。 祁瑞华 郭旭 刘彩虹关键词:中文 基于多层面文体特征的博客作者身份识别研究 被引量:14 2015年 传统的文体风格特征模型不适用于当前大量涌现的网络文本。本文针对以博客为代表的网络文本篇幅短小、表达方式丰富灵活的特点,以内容无关为原则,分别抽取字符特征、词汇特征、句法特征和文本布局等特征,建立了由词汇特征、浅层句法特征、深层句法特征和结构特征组成的多层面文体风格特征模型,并选取朴素贝叶斯、决策树、序列最小优化支持向量机和大规模线性分类支持向量机算法在公开博客语料上进行对照实验。实验结果验证了各个层面特征在作者身份识别中的作用,表明了本文方法的准确性、通用性及其在短文本上的鲁棒性。 祁瑞华 杨德礼 郭旭 刘彩虹关键词:文体特征 作者身份