搜索到5341篇“ 向量空间“的相关文章
基于向量空间模型的文本分类研究
2024年
由于传统的文字数据分类处理方法通常要求投入高昂的人力和时间成本进行标注分类,所以这些传统文字数据分类方法不再适应当前信息时代的要求。因此,急需一种高效快捷地实现对海量文本数据的主题选择和自主归类管理的新文本分类技术。经过研究,提出了一个新文本分类方案,通过文本向量空间模型(VSM),把大量非结构化的文本数据转化成高度结构化的文本向量,然后采用K-means聚类方法对文本向量进行聚类分析,实验结果证实了这种方法的高可行性。该方法提供了一种高效、快捷的文本处理和分类方式,能够快速实现主题选择和自主归类管理,值得进一步研究和探索。
刘思杰刘静超郭冰洁张程炳刘一熳
关键词:向量空间模型文本分类K-MEANS聚类
基于向量空间算法进行前端检索的方法
本发明公开了一种基于向量空间算法进行前端检索的方法,属于数据处理技术领域。本发明包括以下步骤:通过针对不同行业和职类设置不同的KG空间,通过描述、段落和句子进行不同维度的重复提取和计算,再与实际场景进行匹配提取命中率最高...
时迎超王杨陈家栋
非拓扑向量空间的拟拓扑向量空间
2024年
拟拓扑向量空间是在向量空间赋予一个拓扑使其满足数乘联合连续,加法分离变量连续的空间,给出生成非拓扑向量空间的拟拓扑向量空间的方法,由此可以得到仿紧的拟拓扑向量空间但不是拓扑向量空间.
杨忠强郑秋楠
关键词:拓扑向量空间仿紧
基于前缀剪枝的大规模向量空间相似检索框架
2024年
针对大规模文本集合下基于权重的相似性查询问题,提出一种支持前缀剪枝的高效检索框架。首先给出向量空间模型下相似性及其带权前缀定义,理论证明了带权前缀剪枝的正确性;其次,面向大规模文本查询,提出一种新的倒排索引结构,利用索引叶节点维护记录的前缀权重,并基于该索引构建高效的相似检索算法;最后,在TF/IDF权重策略下证明该方法能够有效支持大规模带权相似检索。结果表明,其查询效率较Lucene的归并验证策略提升了5倍以上。
刘健博邓凌风李文海田野
关键词:向量空间倒排索引信息检索数据库
基于双树的高维向量空间样本快速搜索方法及装置
基于双树的高维向量空间样本快速搜索方法及装置,从原始数据点集合中过滤出极少量数据点组成剪枝点集合,过滤剩余数据点组成被删点集合,剪枝点集合中数据点最大限度地保留原始数据点集合在多维空间中的分布形态,这样待查点在剪枝点集合...
徐国天
向量空间上的联邦学习双向可验证隐私保护方法及系统
本发明公开了一种向量空间上的联邦学习双向可验证隐私保护方法及系统,首先可信第三方D公布公开参数;用户进行本地训练得到梯度向量,对其盲化后进行承诺,并上传至聚合服务器AS;接着AS验证梯度密文向量的正确性,聚合后得到聚合结...
张明武崔辰美胡承亮李玉梅谌刚
基于三模态向量空间对齐的SMT芯片缺陷检测系统及方法
本发明提供了一种基于三模态向量空间对齐的SMT芯片缺陷检测系统及方法,包括:图像预处理模块、图像特征编码模块、对象特征提取网络、目标定位模块、文本编码模块、文本‑对象匹配器和解码模块。本发明在检测时输入模板信息为模型扩充...
宋子申余一宽
双重共现潜在语义向量空间模型研究
2024年
文本的向量表示对文本聚类研究具有重要意义。共现潜在语义向量空间模型(CLSVSM)通过挖掘共现词对的语义关联性,进一步提升了聚类精度。方法 为补充不共现词对的语义关联性,提出在特征词的基础上引入特征项,形成“文献-摘要-关键词”关系链。首先基于两层潜在语义关系构建双重共现潜在语义向量空间模型(D-CLSVSM)。然后通过改进的词频G指数方法提取高频特征词,对模型矩阵进行压缩。局限:研究对象较为单一,仅研究了中文数据。结果/结论 D-CLSVSM增加了对共现词对及不共现词对的双重语义信息的补充,文本表示更充分,聚类结果更好。
王世昌陈瑾
关键词:文本聚类文本表示
一种基于多维向量空间优化的动态频谱分配方法及系统
本发明公开一种基于多维向量空间优化的动态频谱分配方法及系统,涉及电磁频谱管控技术领域,包括:构建频谱需求信息空间;根据频谱需求信息空间构建未来设定时间段的各时隙内无人系统可用信道矩阵和在各信道内的共享方式矩阵;根据可用信...
陈勇周鑫何攀峰张余钱鹏智杜奕航
特征向量空间滤波方法在室外盗窃空间分析中的应用
2024年
在犯罪空间分析和空间建模过程中,模型残差中的空间自相关问题对模型参数估计的准确度和犯罪相关因素的分析构成了极大的阻碍,模型残差存在显著空间自相关会导致模型的有偏估计及误导性的推断,甚至导致错误的研究结论。本研究采用一种较为新颖的空间统计方法,即特征向量空间滤波方法(Eigenvector Spatial Filtering),来消除犯罪回归模型估计过程中的残差自相关问题,以及由此引发的模型参数有偏估计问题。以此为基础,立足犯罪模式理论和社会解组理论,以浙江省海宁市主城区为研究区,采用2018年1月—2021年9月室外盗窃警情立案数据、海宁市建成环境数据、珞珈一号夜间灯光遥感数据以及WorldPop人口网格数据,在网格尺度上构建基于特征向量空间滤波的泊松回归模型,在消除模型残差自相关、纠正模型参数估计偏误的基础上,识别出海宁室外盗窃犯罪的影响因素。研究发现:(1)基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。该方法可推广至其他计数模型和广义线性回归分析场景中,有助于提升模型参数的准确估计水平,找回因自相关等原因而被遗漏的变量;(2)新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布;(3)人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响;(4)由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃有显著影响,本文同时也对与以往研究结论不一致的地方进行了讨论。
贺力何国喜郑滋椀
关键词:建成环境

相关作者

林鸿飞
作品数:446被引量:2,893H指数:27
供职机构:大连理工大学计算机科学与技术学院
研究主题:生物医学 关系抽取 情感分析 查询扩展 情感
谭真
作品数:120被引量:35H指数:2
供职机构:国防科学技术大学
研究主题:三元组 知识图谱 句子 抽取方法 对齐方法
黄萱菁
作品数:123被引量:1,395H指数:17
供职机构:复旦大学计算机科学技术学院
研究主题:自然语言处理 中文信息处理 计算机应用 句子 信息检索
赵翔
作品数:200被引量:203H指数:7
供职机构:国防科学技术大学
研究主题:三元组 知识图谱 对齐方法 文本 句子
吕学强
作品数:391被引量:1,328H指数:17
供职机构:北京信息科技大学
研究主题:抽取方法 搜索日志 中文 图像 条件随机场