刘一佳 作品数:11 被引量:23 H指数:3 供职机构: 哈尔滨工业大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 经济管理 金属学及工艺 更多>>
利用部分标注数据提高中文分词准确率的研究 近几年,统计中文分词已经成为学术界研究的主流并且在标注数据丰富的新闻领域取得了很好的性能。但是,在非新闻领域,特别是标注数据较少的领域,统计中文分词的性能仍旧差强人意。人工标注的分词数据较难获得,同时互联网上有大量含有潜... 刘一佳关键词:条件随机场 文献传递 基于序列标注的中文分词、词性标注模型比较分析 被引量:13 2013年 该文对三种不同的分词词性标注模型进行了比较。这三种模型分别为一个序列标注串行模型,一个基于字分类的联合模型和一个将这两种模型使用Stacked Learning框架进行集成的融合模型。通过在《人民日报》、CoNLL09、CTB5.0和CTB7.0四个数据集上进行比较分析,最终实验结果表明分类联合模型能取得比较好的速度,融合模型能取得比较好的准确率,而普通串行模型处于速度和准确率的平衡位置。最后该文将准确率最好的融合模型和相关前沿工作在CTB5.0和CTB7.0上进行了对比,该融合模型均取得了最好的结果。 刘一佳 车万翔 刘挺 张梅山关键词:中文分词 词性标注 LEARNING 项目教学在职业院校课程改革的应用与研究 被引量:1 2016年 采用项目教学法是高职院校对课堂教学的一项改革,为学生在校期间各门课程实践动手能力打下良好的基础,使高职毕业生从事技术、营销、生产、管理、服务等领域的工作,而不是从事科学研究和专业领域的开发、设计工作。将项目教学引入课堂,学生可以将理论和实践有机相结合,为对应工作岗位作准备。 刘一佳关键词:项目教学 课程改革 职业教育 基于动态上下文相关词向量的句子级语言分析技术研究 自然语言处理是人工智能的重要子学科。作为自动处理文本的第一步,将词转换为数值化表示很大程度地影响了自然语言处理的性能。词向量为自然语言的最小语义单元—词提供了包含句法语义信息的稠密向量表示。作为基于神经网络的自然语言处理... 刘一佳关键词:自然语言处理 文献传递 电弧焊工艺参数对超级双相不锈钢覆层焊道特性影响的Matlab仿真研究 被引量:1 2016年 通过响应曲面法构建数学模型,模拟焊接过程,研究电弧电压、送丝速度、焊接速度、喷嘴与金属板的距离及焊枪角度对焊道尺寸的影响。结果表明,电弧弧长、光束行进速度、熔化速率、焊条的电阻热都对余高曲线有影响。同样,电弧弧长、光束行进速度、熔池的电弧推力影响熔深曲线。焊条的熔化速率和电阻热对润湿角有显著影响。 刘一佳 曹凯关键词:超级双相不锈钢 电弧焊 响应曲面 基于感知器的中文分词增量训练方法研究 被引量:3 2015年 该文提出了一种基于感知器的中文分词增量训练方法。该方法可在训练好的模型基础上添加目标领域标注数据继续训练,解决了大规模切分数据难于共享,源领域与目标领域数据混合需要重新训练等问题。实验表明,增量训练可以有效提升领域适应性,达到与传统数据混合相类似的效果。同时该文方法模型占用空间小,训练时间短,可以快速训练获得目标领域的模型。 韩冰 刘一佳 车万翔 刘挺关键词:中文分词 浅论RFID技术综述及其应用现状 被引量:5 2015年 RFID(Radio Frequency Identification)即射频识别技术,利用无线射频信号实现无接触信息传递以自动识别目标对象。RFID技术无需人工干预即可完成物品的信息采集和传输,将其与互联网、移动通信等技术相结合,实现全球范围内的物品跟踪与信息共享,即构成物联网。本文首先简介RFID技术,对RFID技术的研究现状进行综述。 刘一佳关键词:RFID技术 一种中文分词增量学习方法 一种中文分词增量学习方法,涉及中文分词领域。本发明为了解决现有的在源领域切分数据的基础上加入目标领域数据混合训练数据的方法存在的每次数据混合都需要重新训练模型和数据处理量非常大时导致的运算时间长、对硬件要求高的问题。本发... 车万翔 刘一佳 刘挺 赵妍妍文献传递 基于感知器的中文分词增量训练方法研究 文本提出了一种基于感知器的中文分词增量训练方法。该方法可在训练好的模型基础上添加目标领域标注数据继续训练,解决了大规模切分数据难于共享,源领域与目标领域数据混合需要重新训练等问题。实验表明,增量训练可以有效提升领域适应性... 韩冰 刘一佳 车万翔 刘挺关键词:中文分词 一种中文分词增量学习方法 一种中文分词增量学习方法,涉及中文分词领域。本发明为了解决现有的在源领域切分数据的基础上加入目标领域数据混合训练数据的方法存在的每次数据混合都需要重新训练模型和数据处理量非常大时导致的运算时间长、对硬件要求高的问题。本发... 车万翔 刘一佳 刘挺 赵妍妍