Variance_Reduced_Replica_Exchange_Stochastic_Gradient_MCMC:通过减少方差来加速副本交换(ICLR'21

thought3407 4 0 ZIP 2021-03-30 15:03:30

方差减少的副本交换SGHMC 尽管在近凸问题中减小梯度方差具有优势,但理论与实践之间的自然差异是在非凸问题中是否应避免梯度噪声。为了填补这一空白,我们仅关注于噪声能量估计量的方差减小以利用理论加速度,而不再考虑噪声梯度的方差减小,因此具有动量的随机梯度下降(M-SGD)的经验经验可以自然地进口。要求 Python 2.7 或类似麻木 CUDA 分类:批次大小为256的CIFAR100上的ResNet20 动量随机梯度下降(M-SGD),具有500个时期,批量为256个,学习率不断降低 $ python bayes_cnn . py - sn 500 - chains 1 - lr 2e-6 - LRanneal 0.984 - T 1e-300 - burn 0.6 随机梯度哈密顿量蒙特卡洛(SGHMC),在预热期间具有退火温度,之后具有固定温度 $ python baye

文件列表

Variance_Reduced_Replica_Exchange_Stochastic_Gradient_MCMC-main.zip (预估有个56文件)

Variance_Reduced_Replica_Exchange_Stochastic_Gradient_MCMC-main

trainer.py 8KB

.gitignore 113B

bayes_cnn.py 4KB

output

cifar100_resnet20_batch_256_lr_2e-6_T_0.001_cycle_5_burn_0.7_seed_24439_74.40 116KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_5e6_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_58476 0B

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_5e6_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_0_seed_31604 7KB

cifar100_resnet20_batch_256_chain_2_T_0.003_LRgap_0.66_Tgap_0.2_F_5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_0_seed_47841 7KB

cifar100_resnet20_batch_256_chain_2_T_0.003_LRgap_0.66_Tgap_0.2_F_5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_5056 0B

cifar100_resnet20_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_0_p_2_burn_0.6_alpha_0.3_cycle_1_seed_47211_74.43 157KB

cifar100_resnet20_batch_256_chain_1_T_1e-300_seed_67154_71.81 66KB

cifar100_resnet20_batch_256_lr_2e-6_T_0.001_cycle_5_burn_0.7_seed_37225_74.08 116KB

cifar100_resnet20_batch_256_lr_2e-6_T_0.001_cycle_5_burn_0.7_seed_82929_74.34 116KB

cifar100_resnet20_batch_256_chain_2_T_0.003_LRgap_0.66_Tgap_0.2_F_5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_1682 0B

cifar100_resnet20_batch_256_chain_1_T_1e-300_seed_81391_71.68 66KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e7_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_0_seed_27443 7KB

cifar100_resnet20_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_18803_74.78 303KB

cifar100_resnet32_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_0_p_2_burn_0.6_alpha_0.3_cycle_1_seed_35902_76.86 167KB

cifar100_resnet32_batch_256_lr_2e-6_T_0.001_cycle_5_burn_0.7_seed_79580_76.42 116KB

cifar100_resnet20_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_0_p_2_burn_0.6_alpha_0.3_cycle_1_seed_29292_73.06 156KB

cifar100_resnet20_batch_256_chain_1_T_1e-300_seed_64760_72.19 66KB

cifar100_resnet32_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_72638_77.19 293KB

cifar100_resnet32_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_87124_77.54 309KB

trial_1

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_416 82KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_86549 97KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_92302 96KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_34759 81KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_17593 96KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_89053 152KB

cifar100_resnet20_batch_256_chain_2_T_0.001_LRgap_0.66_Tgap_0.2_F_1e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_99062 126KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_83464 126KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_99973 107KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_34179 97KB

cifar100_resnet20_batch_256_chain_2_T_0.001_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_89770 96KB

cifar100_resnet20_batch_256_chain_2_T_0.001_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_31653 81KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_92294 96KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_38155 110KB

cifar100_resnet32_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_0_p_2_burn_0.6_alpha_0.3_cycle_1_seed_45730_76.05 167KB

cifar100_resnet20_batch_256_chain_2_T_0.0003_LRgap_0.66_Tgap_0.2_F_5e6_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_31965 9KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e7_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_97873 1KB

run.log 0B

cifar100_resnet20_batch_256_chain_2_T_0.01_LRgap_0.66_Tgap_0.2_F_1.5e5_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_seed_85674_75.17 315KB

cifar100_resnet20_batch_256_chain_2_T_0.001_LRgap_0.66_Tgap_0.2_F_1.5e6_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_32983 9KB

cifar100_resnet32_batch_256_lr_2e-6_T_0.001_cycle_5_burn_0.7_seed_84935_76.91 116KB

cifar100_resnet20_batch_256_chain_2_T_0.0001_LRgap_0.66_Tgap_0.2_F_1.5e7_VR_1_p_2_burn_0.6_alpha_0.3_cycle_1_adapt_c_1_seed_69699 0B

sgmcmc.py 2KB

models

cifar

__init__.py 62B

resnet.py 4KB

__init__.py 0B

tools

transforms.py 2KB

__init__.py 61B

.bak

neural_network.py 6KB

neural_network.pyc 7KB

torch_tools.py 3KB

data_manipulation.py 5KB

README.md 2KB

grid_search.py 893B

用户评论

暂无评论

论文研究通过出院状态减少住院时间

这项研究评估了纽约锡拉丘兹（Syracuse）医院出院状态对缩短住院时间的影响。它着重于2008年至2018年之间两个最大的住院服务，即成人医学和成人手术。在锡拉丘兹的医院中，成人医学的平均住院时间

20 2020-07-17
ngrx run通过减少动作产生效果源码

NgRx运行从NgRx减速器返回副作用作为数据概括效果在化简器的return语句中描述为数据当减速器返回时,效果将运行由效果创建的事件将转换为动作,然后分派回商店因此,您可以通过简单的操作

5 2021-05-03
通过减少零件集成的新颖方法

通过零件缩减进行积分是量子场论中大多数现代多回路计算的标准组成部分。我们提出一种新颖的策略，以克服基于Laporta算法的当前可用的还原程序的局限性。关键思想是根据从有限域上的约简获得的数值样本构

11 2020-07-19
袋鼠通过运行多个协作有限状态机来加速字符串匹配

袋鼠:通过运行多个协作有限状态机来加速字符串匹配

1 2021-04-17
Cryptanalysis of round reduced ASCON

Cryptanalysis of round-reduced ASCON

7 2021-02-08
bishe副本副本.rar

光照强度采集、土壤湿度采集、空气温湿度采集、根据土壤湿度打开继电器灌溉土壤、GSM发送短信监测数据

16 2021-04-25
Neural Networks and the Bias Variance Dilemma

Stuart Geman在1992年的论文，周志华的机器学习中也提到过，关于偏差泛化误差的计算也源自这篇论文。英文的。

39 2018-12-07
Iterative Robust Minimum Variance Beamforming

Iterative Robust Minimum Variance Beamforming

9 2021-04-05
如何选择外部电阻来减少接地负载电流源误差

运算放大器通常用于在工业流程控制、科学仪器和医疗设备等各种应用中产生高性能电流源,现在介绍几种电流源电路,它们可以提供通过浮动负载或接地负载的恒流。

11 2020-08-19
系统优化总结修改注册表来减少预读取

系统优化总结：修改注册表来减少预读取，减少进度条等待时间，效果是进度条跑一圈就进入登录画面了，开始→运行→regedit启动注册表编辑器，找HKEY_LOCAL_MACHINE\SYSTEM\Curr

23 2019-02-16

Variance_Reduced_Replica_Exchange_Stochastic_Gradient_MCMC:通过减少方差来加速副本交换(ICLR'21

文件列表

用户评论

推荐下载