nlp in practice:用于解决实际文本数据问题的入门代码。 包括:Gensim Word2Vec短语嵌入具有逻辑回归的文本分类具有pyspark的单词
NLP实践 使用这些NLP,文本挖掘和机器学习代码示例和工具来解决现实世界中的文本数据问题。 笔记本/来源 第一列中的链接将您带到带有源代码的子文件夹/存储库。 任务 相关文章 来源类型 描述 python脚本 使用PySpark提取大量数据的短语。 使用这些短语注释文本或将这些短语用于其他下游任务。 python脚本+笔记本 使用字数统计或tfidf可视化热门关键字 笔记本 如何正确使用Word2Vec以获得所需的结果 python脚本 如何使用PySpark读取带有字数示例的不同格式的文件 笔记本 如何使用TF-IDF和Python的SKLEARN从文本中提取有趣的关键字 笔记本 有关如
文件列表
nlp-in-practice-master.zip
(预估有个36文件)
nlp-in-practice-master
.gitattributes
150B
text-classification
notebooks
Text Classification with Logistic Regression.ipynb
112KB
images
data_set_categories.png
19KB
dataset_date_histogram.png
6KB
README.md
988B
data
暂无评论