回声根概述EchoRoot是一款概念验证应用程序,以一个问题为指导:机器学习技术能否发现在线色情广告中的性交易迹象?先前的研究表明,在不同的广告中,“有时会使用相同的电话号码为不同年龄/描述、不同地点、不同时间的个人做广告。” 这项研究提供了一个起点,可以从后台分析性广告中的文字。为了将数据科学用于社会公益,EchoRoot探索了基本机器学习概念贝叶斯分类器的应用,以利用使人口贩运如此普遍的广告。
特征数据科学家(用户)可以从数据库中读取训练文本、标签文本、过滤文本(删除HTML标签、UTF-文字、换行符和全部小写),将文本转换为机器可读的TFIDF向量。然后用户可以训练(和重新训练)分类器。可以在一行代码中更改分类器的类型。然后用户可以对新输入进行分类,并将信息保存到字典中,然后可以使用该字典制作直方图,以查看分布式分类数据。
为了更深入了解贝叶斯分类器的工作原理,您可以参考机器学习贝叶斯分类器。若您对机器学习的概念感兴趣,可以查阅机器学习概念。对于更具体的应用案例,您可以参考python机器学习_音乐分类器实现。
暂无评论