您的位置: 专家智库 > >

胡刚

作品数:8 被引量:10H指数:3
供职机构:云南民族大学电气信息工程学院更多>>
发文基金:国家自然科学基金云南省教育厅科学研究基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...

主题

  • 4篇彝文
  • 4篇网络
  • 3篇网页
  • 2篇信息采集
  • 2篇信息获取
  • 2篇有声
  • 2篇社交
  • 2篇社交网
  • 2篇社交网络
  • 2篇爬虫
  • 2篇网络爬虫
  • 2篇互译
  • 2篇分词
  • 1篇电子词典
  • 1篇信息抽取
  • 1篇信息获取技术
  • 1篇形似
  • 1篇用户
  • 1篇用户行为
  • 1篇舆情

机构

  • 8篇云南民族大学

作者

  • 8篇王嘉梅
  • 8篇胡刚
  • 6篇李炳泽
  • 4篇汤雪
  • 4篇张建营
  • 2篇林睿
  • 1篇赵慧云

传媒

  • 4篇计算机系统应...
  • 3篇网络安全技术...
  • 1篇电子技术与软...

年份

  • 3篇2016
  • 4篇2015
  • 1篇2014
8 条 记 录,以下是 1-8
排序方式:
傣泐文-汉文互译有声电子词典被引量:4
2016年
软件是基于Visual C++6.0和Access 2003工具来完成的,在Unicode字符集模式下进行软件设计,解决当前民族文字软件开发时的系统使用兼容性以及字符的输出乱码等问题.本开发模式使用简单、操作稳定、接口灵活,在便于用户对词汇和语音数据库进行统一处理(备份、打印)的同时,也为其它民族文字翻译软件的开发提供了初期技术指导.目前面向傣族地区的翻译辅助工具还尚未推出,"傣泐文-汉文互译有声电子词典"是傣文信息化领域的一个重要"应用创新"成果,是开展少数民族语言文化信息元表示与提取研究的基础支撑,其作用主要是负责傣文的查询、翻译、朗读等工作.傣汉互译电子词典设计实现了傣汉对照互译、傣语真人朗读、傣语音标显示等常用功能,同时还支持对词库进行添加、修改、删除自定义操作,实现了良好的人机交互功能.
胡刚王嘉梅李炳泽林睿希利补发
关键词:电子词典UNICODE
彝文网络信息获取平台的研究被引量:1
2015年
随着互联网技术的发展和广泛应用,彝文网页数量不断增多,获取彝文信息的范围也越来越大,但查询所需信息的难度也相对增加。文章通过对传统中文网络信息获取平台技术的研究分析,结合彝文网页自身的结构特点,研究了彝文网页信息采集技术和彝文网页信息抽取技术,实现了彝文网络信息获取平台。最后对该平台进行测试,达到了预期结果。
孙善通王嘉梅李炳泽弓盼胡刚
关键词:网络爬虫信息采集信息抽取
基于Windows平台的滇南彝文输入法实现被引量:3
2015年
彝文古籍数量繁多,但却在迅速减少,亟待运用科学手段进行抢救、整理、规范.为满足考古工作者和出版业界的需要,从排版系统中对中英彝文混合输入的实用性考虑出发,采用Unicode国际编码标准,且字库编码区间实现从自造区间到汉字区间的跨越.就Windows操作系统中进行滇南彝文字库设计及输入法实现所涉及到的原理及若干问题进行了阐述,并在此基础上利用多多输入法API进行程序开发,在克服了操作系统应用环境、字库编码区间及方式、文字混合显示等技术障碍后,最终开发出"滇南彝文数字化信息处理平台".无论是从可行性和实用性分析,该平台的第三套"滇南彝文自由拆分模式的一对多形态编码输入法"在很大程度上解决了当前彝文输入法所普遍存在的易学性问题,是一款操作稳定、输入快捷、简单易学的彝文输入法,尤其对彝文信息化的推广具有广泛的使用价值和示范价值.
胡刚王嘉梅张建营孙善通汤雪赵慧云
关键词:字库排版系统
汉英-泰互译有声语料的数据库研究被引量:1
2016年
"汉英-泰互译有声语料库"的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题.本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工与存储,统计出泰文词汇8000多个.然后利用词典翻译和人工校对其进行语料对齐.最后,结合泰文语言语法特征以及句法的语义特点,分类归纳和规范标注泰语语料,构建了5万条左右的的汉英-泰语料数据库.
胡刚王嘉梅李炳泽林睿林碧彤
关键词:语料库舆情
彝文网页信息采集技术研究被引量:3
2014年
本文通过对中文网页采集流程、网络爬虫工作基本原理的分析,再结合彝文网页的特点,对彝文网页信息的采集技术进行了研究,通过聚焦网络爬虫来实现彝文网页信息的采集,并依此来建立一个内容全面的彝文网页信息资源库。
张建营王嘉梅汤雪胡刚
关键词:网络爬虫信息采集
彝文网页文本分词平台被引量:1
2016年
在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、分词算法、结构流程、系统界面和模块、实验结果等方面进行了详细的分析,最终实现彝文网页文本分词平台.最后的结果表明,本平台分词准确率较高,实用性和通用性也较好.
孙善通王嘉梅李炳泽胡刚
关键词:词库
基于泰文社交网络的用户行为可视化方法探讨
2015年
针对大规模社交群体中查询结果过于复杂等问题,将个性化定制和可视化联系起来,能够帮助开发者分析海量数据中的有用信息。本文以泰文版的Facebook为研究对象,结合当前社交网络的OAuth认证、Graph Search社交图谱搜索等原理,对其用户行为可视化方法进行了探讨。考虑到防火墙对Facebook的限制,对自由构建可视化模型的相关泰文文本处理技术还不够成熟。本文利用JJT(Java Scipt Info Vis Toolkit)工具,查询定制了RGraph可视化模型构建的相关参数,并通过Visual.ly数据可视化平台将程序脚本打包成可视化定制模版,实现了基于泰文社交网络行为的可视化图谱。
胡刚王嘉梅李炳泽张建营林碧彤汤雪
关键词:社交网络用户行为可视化
社交网络中泰文信息获取技术研究与探讨被引量:1
2015年
本文通过对社交网络的信息获取技术中的OAuth认证、Deep Web等原理的分析,结合泰文网页的特点,设计泰文信息判别方法,对Facebook的泰文信息获取方法进行了研究,由于防火墙等原因,最后以泰国华人论坛为例,实现了泰文信息的获取,也为下一步的信息分析和挖掘打好了基础。
张建营王嘉梅李炳泽汤雪胡刚
关键词:社交网络DEEPWEB
共1页<1>
聚类工具0