由于人们日益关注环境问题,尤其是空气污染,因此预测一天是否被污染对人们的健康至关重要。为了解决这个问题,本研究基于大数据和机器学习模型对地面臭氧水平进行了分类,其中被污染的臭氧日为1级,非臭氧日为0级。本研究中使用的数据集来自UCI该网站包含休斯顿,加尔维斯顿和布拉索里亚地区的各种环境因素,这些因素可能会影响臭氧污染的发生[1]。首先填充此数据集以进行进一步处理,然后进行标准化以确保每个特征具有相同的权重,然后将其分为训练集和测试集。此后,在地面臭氧水平的预测中使用了五种不同的机器学习模型,并比较了它们的最终准确性得分。总之,在Logistic回归,决策树,随机森林,AdaBoost和