Sequencer:一种检测复杂数据集中的一维序列的算法 源码
音序器 一种检测复杂数据集中的一维趋势(=序列)的算法。 概述 Sequencer是一种尝试揭示数据集中主要序列(如果存在)的算法。 为此,它对集合中的对象进行重新排序,以产生描述其相似性的最伸长的歧管,这些相似性以多尺度方式并使用度量标准集合进行测量。 一般而言,它结合了来自四个不同度量的信息:欧氏距离,Kullback-Leibler发散度,Monge-Wasserstein或地球移动器距离以及能量距离。 它通过将输入数据中的每个对象划分为单独的部分(块),并估计块之间的成对相似性,来考虑数据的不同尺度。 然后,它将每个块中的信息汇总到每个度量标准和规模的单个估算器中。 定序器使用描述多尺度相似性的图的形状。 特别是,它利用这样一个事实,即数据集中的连续趋势(序列)会导致图形变长。 通过将图的伸长率定义为品质因数,Sequencer可以优化其超参数(距离度量和小数位数),并选择对数据
文件列表
Sequencer-master.zip
(预估有个95文件)
Sequencer-master
sequencer
sequencer_.py
71KB
distance_metrics.py
13KB
__init__.py
66B
elongation_estimation.py
4KB
images
natural_image_example.png
277KB
synthetic_data_seq_box_plots.png
840KB
requirements.txt
71B
暂无评论