李翀 作品数:45 被引量:102 H指数:6 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家高技术研究发展计划 中央高校基本科研业务费专项资金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 理学 更多>>
一种海量数据文件高效持续受控共享分发方法及系统 本发明公开了一种海量数据文件高效持续受控共享分发方法,其步骤包括:1)选取多个服务器作为接收数据的文件服务器,选取一服务器作为中央服务器,其上设置一数据库,包含一数据文件信息表、一用户表、一用户数据文件类别授权表、一用户... 何晓涛 刘学敏 李翀 柯勇 曾丹基于图神经网络的科研知识图谱人才推荐方法及装置 本发明公开了一种基于图神经网络的科研知识图谱人才推荐方法及装置,包括:抽取待处理科研成果论文数据中各实体的实体特征与实体之间的关联关系信息,建立科研知识图谱;依据实体特征,构成各节点的统一特征表示;通过统一特征表示与关联... 李翀 王宇宸 刘学敏 张金杰 张士波文献传递 一种5G环境下基于Web的实时多人行动路径规划方法及系统 本发明提供了一种5G环境下基于Web的实时多人行动路径规划方法及系统,涉及路径规划技术领域,包括获取待规划路径的人员的实时位置信息、目标点的位置信息和所述待规划路径人员与所述目标点之间的场景信息;通过网络地理信息技术智能... 李翀 单桂华 杨波 李玥 田东 赵青HFC网络组播技术研究与实现 被引量:2 2009年 符合DOCSIS1.1规范的网络接入设备CM需要抑制组播.这种CM使用两种机制控制组播的转发,即设置策略过滤业务参数和专门的组播跟踪算法,而后者有passive IGMP和active IGMP两种模式.根据passive IGMP的要求和CM有固定的主机端口和固定的路由器端口的特点,设计并实现了一种电缆网络IGMP Snooping协议.该协议运行在MAC层,实现侦听CM收到的IGMP报文、维护组播组列表、过滤组播数据的功能.本设计在自主开发的物理层和MAC层芯片组成的HDTV(高清晰度电视)双向系统平台进行测试. 王沁 袁玲玲 张燕 许娜 李翀关键词:HFC IGMP SNOOPING 组播 DOCSIS IGMP 一种分布式用户浏览点击模型算法 被引量:8 2019年 为从海量搜索点击日志中快速挖掘用户行为,提出一种分布式用户浏览点击模型(UBM)算法。原始UBM算法求出的检验度参数E只与搜索结果文档所在排序位置以及上一文档的点击位置有关,且非常稳定,基于此特性,将EM迭代求解转换为抽样估计检验度以求解吸引度的分布式UBM算法。在Spark数据平台上进行仿真,结果表明,与原始UBM算法相比,该算法能够解决点击日志中存在的严重数据倾斜问题,且运行效率较高。 张浩盛伦 李翀 柯勇 张士波关键词:搜索引擎 基于Hive的高可用双引擎数据仓库 被引量:10 2019年 打破信息孤岛,整合异构数据,汇聚共享交换,深度分析挖掘,提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引,设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓库,支持多种方式OLAP分析,进行了可用性、负载均衡、资源管理的优化设计,为后续进行全院数据汇聚挖掘、知识图谱构建、学科态势分析提供了平台支撑.实验表明,系统灵活高效,高可用可扩展,资源调度科学,负载均衡效果明显. 李翀 张彤彤 杜伟静 刘学敏关键词:数据仓库 高可用 OLAP HADOOP 基于Web of Science的PageRank人才挖掘算法 被引量:4 2021年 高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现有的人才挖掘算法进行详细研究和分析;其次,结合WOS论文数据对PageRank人才挖掘算法进行了优化设计和实现,加入了论文发表的时间因子、作者署名排序递减模型、周围作者节点对当前节点的影响、论文被引用量等多维度考量因素。最后,基于热点学科计算机科学某社区近五年的论文数据进行了实验和验证。结果表明,基于社区的挖掘更具有针对性,能够快速定位各学科代表性优秀和潜在人才,且改进后的算法对人才的发现更加客观有效。 李翀 王宇宸 杜伟静 何晓涛 刘学敏 张士波 李树仁关键词:PAGERANK算法 基于爬虫的数据监控系统 被引量:6 2017年 近年来,随着互联网技术的快速发展,云计算服务开始全面普及,大型互联网公司以及中小型企业已经开始提供自己的云计算服务,中国科学院也提供了云计算服务平台——中科院"科技云".本文针对中国科学院"科技云"项目的实际需求,参考已有商业云监控系统的功能和运行模式,设计并实现了一种基于爬虫的数据监控系统.该系统相比商业云监控系统,支持URL(布尔)类型数据监测的同时,增加了对数值类型、文本类型的监测,更好的支持第三方服务的监测,并实现了服务故障警报,监测数据可视化以及监测数据分布式存储. 董博 李翀 刘学敏 董科军关键词:数据监控 网络爬虫 云计算 分布式 一种基于龙芯一号CPU的高效Flash控制器 被引量:4 2009年 为了提高Flash存储设备读写效率,满足CM数据存储的时效性需求,借鉴cache和queue技术,设计一款基于AHB具有Burst读和非阻塞写功能,可重构的Nor Flash控制器.在基于龙芯一号CPU的双向有线网络SoC平台上对其进行了仿真验证,实验表明,在cache和queue的大小为0.5K时,使用该技术Flash的读写速度分别提高了3.3倍和4倍.同时,非阻塞机制提高系统利用率,可重构机制节省了硬件资源. 李翀 王沁 王磊 张晓彤关键词:NOR FLASH SOC CM FPGA 基于区域划分的混合式NDN缓存策略 被引量:4 2019年 针对NDN(命名数据网络)中确定性缓存和概率性缓存进行研究,提出一种确定性缓存和概率性缓存相结合的混合式NDN缓存策略(HDP)。基于区域划分的思想,在网络边缘采用基于热度的确定性缓存策略,在网络核心采用基于缓存收益和内容热度的概率性缓存策略,从而将两种缓存策略的优势相结合,进一步提高NDN缓存性能。仿真实验表明该策略与现有NDN缓存方法相比,能有效提高缓存服务率和命中率,并有助于降低内容访问延迟,改善用户体验。 宋彩风 李翀 刘学敏关键词:缓存技术