暂无评论
FlinkSQL是处理流式数据的重要工具,而Kafka则是流式数据常用的消息队列系统之一。将FlinkSQL与Kafka集成,可以实现高效的数据流处理。通过FlinkSQL的语法和功能,可以轻松地定义
针对现有的微阵列数据集成分类方法分类精度不高这一问题,提出了一种Bagging-PCA-SVM方法。该方法首先采用Bootstrap技术对训练样本集重复取样,构成大量训练样本子集,然后在每个子集上进行
在WSN中采用独立分析(SFA)法求得的单数据流端到端延迟上界有时比整体分析(TFA)法求得的总数据流端到端延迟上界要大,这不符合物理意义。针对这一问题,分析了现有TFA法与SFA法在数据流服务分配机
为改进EMicro算法存在的不足提出了GDF-CUStreams算法。该算法采用网格特征向量存储数据的分布特征,通过更新网格特征向量合并成簇对不确定数据流聚类,对新数据点的到来采用增量聚类。通过网格密
以建立一个强壮的、实时的网络流量分析系统为目标,设计了一个基于数据流的网络流量管理系统。实现了一个能够准实时监视网络运行状况的网络管理系统。试验和试运行表明该系统取得了较好的效果。
码书生成是基于矢量量化压缩体绘制的关键之一,初始码书对码书生成算法有较大的影响。现有的码书初始化方法需要对原始海量数据进行多次迭代,数据频繁在硬盘、内存和GPU(图形处理器)之间进行数据传输,导致算法
基于分布式数据流系统的启发式任务调度算法,顾昕,崔晓燕,在分布式数据流处理系统中,单机节点需要在有限的机器资源下在处于就绪状态的任务算子中选择最合适的任务进行调度,这是一个经典
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算
提出一种基于衰减窗口的实时数据流聚类算法PDStream。算法首先对数据空间进行网格划分,采用改进的维度树结构维护和更新数据流的摘要信息,设计了一种周期性剪枝策略,周期性地剪去维度树中的稀疏网格,最后
为了提高软件可靠性分配的有效性, 提出了一种基于层次和数据流驱动的软件可靠性分配方法。该方法对传统的重要度、复杂度度量方法进行改进; 针对软件系统开发初期体系结构中系统模块层次关系及模块间数据流关系进
暂无评论