人口普查名称性别 用于构建和分析美国人口普查名称映射到性别的仓库。 资料来源: : 随着数据和分析的建立,我将添加到描述中。 描述 我想探索一个有趣的挑战,这些挑战正面临着使用机器学习基于非性别因素评估信用价值或就业情况的公司。 尽管性别从来都不是算法的一部分,但其中的一些算法已显示出偏见和歧视性(请参阅Apple Card和Goldman Sachs, )。 通常,公司不会收集性别信息,但是为了评估算法,需要为数据分配性别(男对女)。 一种方法是使用美国人口普查数据。 此数据根据一个人的出生年份和地区来计算该人的每个名字的性别出现次数。 有许多名称显然是按性别键入的,并且始终显示为“男”或“女”。 但是,许多名字并不清楚是男性还是女性。 该存储库的目的是开发一个模型,该模型可用于基于名称的特征来确定名称的性别。 脚本目录 001_mk_data.r-创建name_gende