natural language processing 源码
第十二单元—加密货币的故事 背景 最近有很多关于加密货币的新闻大肆宣传,因此,您可以盘点有关比特币和以太坊的最新新闻头条,以便更好地了解每种硬币的当前公众情绪。 我使用自然语言处理来了解有关比特币和以太坊的最新新闻中的情绪。 我还应用了基本的自然语言处理技术,以更好地理解与硬币价格有关的其他因素,例如文章中提到的常用单词和短语以及组织和实体。 指示 情绪分析 我使用了来获取有关比特币和以太坊的最新新闻,并为每个硬币创建一个情感分数的DataFrame。 自然语言处理 在本节中,我将使用NLTK和Python将每个硬币的文本标记化。 接下来,我查看了每种硬币的ngram和单词频率。 我使用NLTK来生成N = 2的ngram。 我列出了每个硬币的前10个字。 最后,我为每个硬币生成了词云,以总结每个硬币的新闻。 命名实体识别 在本部分中,我为两种硬币都建立了一个命名实体识别模型,并
文件列表
natural-language-processing-master.zip
(预估有个10文件)
natural-language-processing-master
Analysis
crypto_sentiment.ipynb
481KB
crypto_sentiment.pdf
5.93MB
Images
sentimental.jpeg
75KB
btc_word_cloud.png
660KB
eth_ner.png
481KB
eth_word_cloud.png
782KB
btc_ner.png
501KB
暂无评论