在Pandas中 求差集没有专门的函数。处理办法就是将两个DataFrame追加合并,然后去重。解决思路是这样的:对于有同样Index的a,b两个DataFrame,如果现在要求a对b的差集,那么可以连续两次扩充a,使用append方法然后使用drop_duplicates方法对a进行去重,并且参数keep=False。原理很简单,也很巧妙,连续扩充2次a,那么新扩充完后的DataFrame中来自b的row肯定是重复的,去重时候,b全部被删除,与此同时,a中跟b重复的row也会顺带着被删除。

Pandas DataFrame求差集的示例代码

Pandas DataFrame求差集的示例代码

Pandas DataFrame求差集的示例代码