公共文化服务平台

共 5 条记录，以下是 1-7

全选清除导出

排序方式：

基于最短平均输入码长的手机键盘布局优化: 如何减少输入中英文信息的按键次数,提高输入效率是手机用户很关心的问题。当前手机键盘布局没有考虑到英语的组词规律和汉语的字音特性,增加了用户输入信息的按键次数。本文定义单词(拼音)的平均输入码长,以平均输入码长作为评价标准...; 马毅刘秉权徐志明; 关键词：优化设计; 文献传递

一种基于粗糙集的大规模语料库语言学知识发现模型被引量：2: 2004年; 文中首先通过语言学特征表来对文本信息进行结构化处理 ,同时实现了对远距离约束的表示 ;然后借助于面向个体的数据泛化算法来去除语言学特征表中的冗余信息 ,并利用规则抽取算法过滤特征表中不一致的部分 ,从而为相应的自然语言处理任务建立了一个一致、高效的规则库。最后 ,本文研究了模型在汉语词义排歧以及音字转换中的应用 ,在采用了动态规则平滑算法后 ,分别获得了 0 .93和 0 .95的判别精度以及 0 .92和 0 .89的覆盖率。; 陈清才王晓龙赵健; 关键词：粗糙集音字转换

COMBINING FEATURE SCALING ESTIMATION WITH SVM CLASSIFIER DESIGN USING GA APPROACH被引量：2: 2005年; This letter adopts a GA (Genetic Algorithm) approach to assist in learning scaling of features that are most favorable to SVM (Support Vector Machines) classifier, which is named as GA-SVM. The relevant coefficients of various features to the classification task, measured by real-valued scaling, are estimated efficiently by using GA. And GA exploits heavy-bias operator to promote sparsity in the scaling of features. There are many potential benefits of this method:Feature selection is performed by eliminating irrelevant features whose scaling is zero, an SVM classifier that has enhanced generalization ability can be learned simultaneously. Experimental comparisons using original SVM and GA-SVM demonstrate both economical feature selection and excellent classification accuracy on junk e-mail recognition problem and Internet ad recognition problem. The experimental results show that comparing with original SVM classifier, the number of support vector decreases significantly and better classification results are achieved based on GA-SVM. It also demonstrates that GA can provide a simple, general, and powerful framework for tuning parameters in optimal problem, which directly improves the recognition performance and recognition rate of SVM.; Yu YingWang XiaolongLiu Bingquan; 关键词：支撑向量算子

融合聚类触发对特征的最大熵词性标注模型被引量：30: 2006年; 为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择·在最大熵框架下,将选择后的触发对特征加入到词性标注系统中·利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“WA”的数据稀疏问题·实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%·; 赵岩王晓龙刘秉权关毅; 关键词：词性标注最大熵模型矢量空间模型语义相似度计算

一种基于SVM／RS的中文机构名称自动识别方法被引量：7: 2006年; 该文提出一种支持向量机(support Vector Machines,SVM)和粗糙集(Rough Set,RS)相结合的巾文机构名称短语识别方法。该方法借助词的基术语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学>J 到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人尾日榴语赳开卉々jIj=『Il请的F信钋剐诀到R,f16％．; 宇缨王晓龙刘秉权; 关键词：模式识别 SVM 语义粗糙集语义搭配

几种微阵列基因表达数据分析方法的比较被引量：1: 2005年; 比较了微阵列基因表达数据处理中的几种方法,包括等级聚类、K-means方法、模糊聚类和自组织树.同时从算法中计算机的时空复杂度和结果的生物学意义两方面,对以上几种方法作了细致的讨论.结果显示,模糊聚类和自组织树都是较理想的方法.; 张世伟; 关键词：基因表达数据分析方法微阵列模糊聚类生物学意义自组织

基于上下文平均互信息的问句查询扩展模型: 信息检索中存在用词歧义的问题,在中文自然语言查询处理中,表达差异问题更加突出。提出了一种基于上下文互信息的问句查询扩展模型,模型首先对训练集文档中的词或词组进行相关分析,计算每对词或词组间的互信息,然后再利用中文语义网与...; 邵兵关毅王强王晓龙任瑞春; 关键词：自然语言检索查询扩展; 文献传递

全选清除导出

共1页<1>

国家自然科学基金(60175020)