您的位置: 专家智库 > >

国家自然科学基金(60175020)

作品数:5 被引量:42H指数:2
相关作者:王晓龙刘秉权关毅赵岩宇缨更多>>
相关机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术生物学建筑科学更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文

领域

  • 6篇自动化与计算...
  • 1篇生物学
  • 1篇建筑科学

主题

  • 2篇粗糙集
  • 1篇音字转换
  • 1篇优化设计
  • 1篇语料
  • 1篇语言
  • 1篇语言学
  • 1篇语言学知识
  • 1篇语义
  • 1篇语义搭配
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇语义相似度计...
  • 1篇支撑向量
  • 1篇知识发现
  • 1篇上下文
  • 1篇生物学
  • 1篇生物学意义
  • 1篇识别方法
  • 1篇矢量
  • 1篇矢量空间模型

机构

  • 6篇哈尔滨工业大...
  • 1篇大连海事大学

作者

  • 3篇刘秉权
  • 3篇王晓龙
  • 1篇宇缨
  • 1篇张世伟
  • 1篇赵岩
  • 1篇关毅
  • 1篇赵健
  • 1篇邵兵
  • 1篇徐志明
  • 1篇马毅
  • 1篇陈清才

传媒

  • 1篇电子与信息学...
  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇Journa...
  • 1篇哈尔滨商业大...
  • 1篇全国第八届计...

年份

  • 2篇2006
  • 3篇2005
  • 2篇2004
5 条 记 录,以下是 1-7
排序方式:
基于最短平均输入码长的手机键盘布局优化
如何减少输入中英文信息的按键次数,提高输入效率是手机用户很关心的问题。当前手机键盘布局没有考虑到英语的组词规律和汉语的字音特性,增加了用户输入信息的按键次数。本文定义单词(拼音)的平均输入码长,以平均输入码长作为评价标准...
马毅刘秉权徐志明
关键词:优化设计
文献传递
一种基于粗糙集的大规模语料库语言学知识发现模型被引量:2
2004年
文中首先通过语言学特征表来对文本信息进行结构化处理 ,同时实现了对远距离约束的表示 ;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息 ,并利用规则抽取算法过滤特征表中不一致的部分 ,从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后 ,本文研究了模型在汉语词义排歧以及音字转换中的应用 ,在采用了动态规则平滑算法后 ,分别获得了 0 .93和 0 .95的判别精度以及 0 .92和 0 .89的覆盖率 。
陈清才王晓龙赵健
关键词:粗糙集音字转换
COMBINING FEATURE SCALING ESTIMATION WITH SVM CLASSIFIER DESIGN USING GA APPROACH被引量:2
2005年
This letter adopts a GA (Genetic Algorithm) approach to assist in learning scaling of features that are most favorable to SVM (Support Vector Machines) classifier, which is named as GA-SVM. The relevant coefficients of various features to the classification task, measured by real-valued scaling, are estimated efficiently by using GA. And GA exploits heavy-bias operator to promote sparsity in the scaling of features. There are many potential benefits of this method:Feature selection is performed by eliminating irrelevant features whose scaling is zero, an SVM classifier that has enhanced generalization ability can be learned simultaneously. Experimental comparisons using original SVM and GA-SVM demonstrate both economical feature selection and excellent classification accuracy on junk e-mail recognition problem and Internet ad recognition problem. The experimental results show that comparing with original SVM classifier, the number of support vector decreases significantly and better classification results are achieved based on GA-SVM. It also demonstrates that GA can provide a simple, general, and powerful framework for tuning parameters in optimal problem, which directly improves the recognition performance and recognition rate of SVM.
Yu YingWang XiaolongLiu Bingquan
关键词:支撑向量算子
融合聚类触发对特征的最大熵词性标注模型被引量:30
2006年
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择·在最大熵框架下,将选择后的触发对特征加入到词性标注系统中·利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“WA”的数据稀疏问题·实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%·
赵岩王晓龙刘秉权关毅
关键词:词性标注最大熵模型矢量空间模型语义相似度计算
一种基于SVM/RS的中文机构名称自动识别方法被引量:7
2006年
该文提出一种支持向量机(support Vector Machines,SVM)和粗糙集(Rough Set,RS)相结合的巾文机构名称短语识别方法。该方法借助词的基术语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学>J 到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人尾日榴语赳开卉々jIj=『Il请的F信钋剐诀到R,f16%.
宇缨王晓龙刘秉权
关键词:模式识别SVM语义粗糙集语义搭配
几种微阵列基因表达数据分析方法的比较被引量:1
2005年
比较了微阵列基因表达数据处理中的几种方法,包括等级聚类、K-means方法、模糊聚类和自组织树.同时从算法中计算机的时空复杂度和结果的生物学意义两方面,对以上几种方法作了细致的讨论.结果显示,模糊聚类和自组织树都是较理想的方法.
张世伟
关键词:基因表达数据分析方法微阵列模糊聚类生物学意义自组织
基于上下文平均互信息的问句查询扩展模型
信息检索中存在用词歧义的问题,在中文自然语言查询处理中,表达差异问题更加突出。提出了一种基于上下文互信息的问句查询扩展模型,模型首先对训练集文档中的词或词组进行相关分析,计算每对词或词组间的互信息,然后再利用中文语义网与...
邵兵关毅王强王晓龙任瑞春
关键词:自然语言检索查询扩展
文献传递
共1页<1>
聚类工具0