基于ML的生物监测教程 ML教程,于2019年5月1-6日在哥伦比亚Villa de Leyva举行。 本教程的目的是分析元条形码数据(amplicon测序),以预测养鱼场对底栖生物多样性的环境影响。 为此,将大底栖动物种类的目视观察作为确定影响程度的“基础事实”,并将描述完整的真核生物群落的元条形码数据用作变量(或特征)。 本教程介绍了随机森林分类器的数据导入,操作,训练和交叉验证。 它还涵盖了用于减少数据维数和模型调整(超参数优化)的功能选择。 本教程完全用R完成。本教程的介绍幻灯片在 R脚本已包含所有分析步骤的注释。