公共文化服务平台

2024年7月10日星期三

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

韩月阳: 作品数：4 被引量：30H指数：3; 供职机构：云南大学信息学院更多>>; 发文基金：云南省自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

李远方云南大学信息学院
邓世昆云南大学信息学院
贾时银云南大学信息学院
闻玉彪云南大学信息学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

3篇期刊文章
1篇学位论文

领域

4篇自动化与计算...

主题

2篇中文
2篇中文分词
2篇分词
2篇HADOOP
2篇MAPRED...
1篇信息处理
1篇于字
1篇树结构
1篇统计模型
1篇最短路径
1篇矩阵
1篇矩阵分块
1篇块算法
1篇互信息
1篇分块
1篇分块算法
1篇PAGERA...
1篇XML
1篇HA
1篇K图

机构

4篇云南大学

作者

4篇韩月阳
3篇邓世昆
3篇李远方
2篇贾时银
1篇闻玉彪

传媒

3篇计算机技术与...

年份

4篇2011

共 4 条记录，以下是 1-4

全选清除导出

排序方式：

基于字分类的中文分词的研究被引量：10: 2011年; 中文分词是自然语言处理的前提和基础,利用基于字分类的方法实现中文分词,就是将中文分词想象成字分类的过程。把字放入向前向后相邻两个字这样的一个语境下根据互信息统计将字分成四种类别,即跟它前面结合的字,跟它后面结合的字,跟它前后结合的字,独立的字。在分词的过程中采用了t-测试算法,一定程度上解决了歧义问题。以人民日报为语料库进行训练和测试,实验结果表明,该方法能够很好地处理歧义问题,分词的正确率达到了90.3%,有了明显的提高。; 韩月阳邓世昆贾时银李远方; 关键词：中文分词互信息

Hadoop-MapReduce下的PageRank矩阵分块算法被引量：13: 2011年; PageRank是Web结构挖掘的经典算法,已在Google搜索引擎中取得了巨大成功。但其迭代次数多,时空消耗大,执行速度和收敛速度都还较慢。文中详细讨论了Hadoop-MapReduce的执行流程及其内部实现机制后,提出了一种并行MapReduce实现矩阵分块的PageRank算法,其实质是减少MapReduce框架结构中Map阶段和Reduce阶段的迭代次数,从而减少时空开销。最后搭建Hadoop-MapReduce开源平台,模拟Web结构爬取,比较了传统算法和改进算法的性能。结果表明,改进后的算法迭代次数低,并行效率较高,在模拟环境中PageRank标识网页等级显示其优越性。; 李远方邓世昆闻玉彪韩月阳; 关键词：PAGERANK MAPREDUCE HADOOP 矩阵分块

基于S-EK图最短路径中文分词的研究: 中文分词是中文信息处理的基础。在自然语言理解、语言文字研究、中文文本自动标引、信息检索、机器翻译等领域中,中文分词具有不可替代的作用。因此,中文分词的研究至关重要。　　但是,中文分词的研究水平已经远落后于与它关联的相...; 韩月阳; 关键词：中文分词信息处理最短路径统计模型; 文献传递

基于树结构的MapReduce模型被引量：8: 2011年; MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用。此模型只适用于数据关联性弱、能够高度并行化的程序,未能处理数据关联性强的数据(比如树形结构)。文中详细讨论了MapReduce的实现机制,提出了一种基于树结构的MapReduce模型,它是基于一种聚类聚合的反复轮询过程,聚合时用代替传统的,使模型更具有一般性。最后搭建Hadoop平台来处理XML结构的海量数据,并比对新旧两种模型的效率。实验结果表明,其执行速度明显比传统模型高效。; 李远方贾时银邓世昆韩月阳; 关键词：树结构 MAPREDUCE XML HADOOP

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张