颜色分类leetcode fastknn:用于大型数据集的快速k最近邻分类器

慢慢地 5 0 zip 2024-10-06 06:10:36

颜色分类leetcode快速KNN具有收缩估计器的快速k最近邻分类器,用于类成员概率。为什么是fastknn?fastknn现在可以使用,看看如何使用fastknn来提高你在Kaggle比赛中的表现的例子。在几秒钟内构建具有大型数据集(> 100k行)的KNN分类器。使用\"dist\"估计器预测更多校准概率减少对数损失。根据各种损失函数找到最好的k参数,使用n折交叉验证。为您的数据集绘制漂亮的分类决策边界。进行特征工程并从数据集中提取信息量高的特征。在Kaggle中竞争。试一试,让我知道你的想法!快速最近邻搜索fastknn方法基于库实现了k-最近邻(KNN)分类器。ANN是用C++编写的,能够在O(N log N)时间内为给定数据集中的每个点找到k个最近邻。该包提供了一个简单的界面来使用R ANN库。FastKNN分类器fastknn是为处理非常大的数据集(> 100k行)而开发的,非常适合比赛。对于大型数据集,它可以比R包中流行的knn方法快50倍。此外,fastknn为类成员概率提供了一个收缩估计。

用户评论
请输入评论内容
评分:
暂无评论