测试高级图像处理和文本提取算法通常会遇到缺少大数据集的问题。这个虚假的美国纳税申报表(2016-19年度W-2陈述)的公共数据集,可帮助数据科学家测试图像数字化和降噪算法。 Fake W-2 (US Tax Form) Dataset_datasets.txt READ_ME_FIRST_Data_Summary.xlsx W2_Truth_and_Noise_DataSet_02.xlsx W2_Truth_and_Noise_DataSet_01.xlsx Fake W-2 (US Tax Form) Dataset_W2_Multi_Clean_DataSet_02_datasets.ZIP Fake W-2 (US Tax Form) Dataset_W2_Multi_Noisy_DataSet_02_datasets.ZIP Fake W-2 (US Tax Form) Dataset_W2_Clean_DataSet_01_datasets.ZIP Fake W-2 (US Tax Form) Dataset_W2_Noisy_DataSet_01_datasets.ZIP