NLP过程中经常会对互联网文本进行清洗,目前互联网与用户越来越多的使用表情发表评论、动态,该部分内容目前对于NLP来讲属于噪声,所以整理了emoji表情的unicodecodepoint,并转化为python3当中的str,方便进行后期的数据清洗与整理。