HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理源码

specialty23758 11 0 ZIP 2021-02-06 05:02:52

HanLP:汉语言处理 || || 面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP实现功能完善,性能高效,架构清晰,语料时新,可自定义的特点。穿越世界上最大的多语言种语料库,HanLP2.1支持包括简繁中英日俄法德内部的104种语言上的10种联合任务:分词(粗分,细分2个标准,强制,合并,校正3种),词性标注(PKU,863,CTB,UD四套词性规范),命名实体识别(PKU,MSRA,OntoNotes三套规范),依存句法分析(SD,UD规范),成分法分析,语义依存分析(SemEval16,DM,

文件列表

HanLP：中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理 (预估有个568文件)

HanLPClientTest.java 2KB

TokenInput.java 635B

DocumentInput.java 624B

SentenceInput.java 632B

BaseInput.java 672B

HanLPClient.java 7KB

LICENSE 11KB

README.md 7KB

Makefile 634B

references.bib 20KB

data_format.md 5KB

ctb.md 8KB

pku.md 19KB

863.md 6KB

semeval16.md 8KB

ctb.md 6KB

ptb.md 7KB

sd.md 8KB

pku.md 8KB

.gitignore 4KB

用户评论

暂无评论

中文命名实体提取

中文命名实体提取，能够取出中间的人名、地名、组织机构名等，不错的资料

32 2018-12-18
2018年文本分类文本校对自然语言处理论文附宗成庆统计自然语言处理

包含文本分类，文本自动校对，《统计自然语言处理》等多篇论文，图书等资源，所有论文基本都是2018年8月以后发表的，只有少数两篇是2017年的

40 2018-12-20
MALLET基于Java的统计学自然语言处理文档分类聚类主题建模

MALLET是一个基于Java的软件包进行统计自然语言处理，文档分类，聚类，主题建模，信息提取以及其他机器学习应用到文本。

26 2019-09-05
BERT系列命名实体识别

本文是BERT实战的第二篇,使用BERT进行命名实体识别(序列标注类任务)。 1. 准备 1.1 环境 python 3.7; pytorch 1.3; transformers 2.3 (安装教程)

18 2021-01-16
命名实体识别技术综述

命名实体识别是自然语言处理中的热点研究方向之一,目的是识别文本中的命名实体并将其归纳到相应的实体类型中。

9 2020-10-08
命名实体识别标记语料

已经标记号label的中文命名实体识别的语料库，采用BIM标志形式。包括人名（PERSON）、地点（LOCATION）、时间（TIME）及机构名（ORGANIZATION）。

39 2019-05-15
python命名实体识别demo

Python named entity recognition demo

44 2019-06-23
命名实体识别算法综述

总结了从90年代到21世纪初，命名实体识别算法的发展和现状，个人感觉总体还是不错的

52 2018-12-28
Python HybridBiLSTMCRF命名实体识别

Hybrid Bi-LSTM-CRF命名实体识别

22 2020-07-23
编译原理词法分析句法分析

有良好的界面，提供简单的文法的词法分析和句法分析，词法分析输出符号表和词法分析结果，句法分析可以输出每一步的分析过程，功能强大清晰！

20 2019-03-31

HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理 源码

文件列表

用户评论

推荐下载

HanLP:中文分词词性标注命名实体识别依存句法分析语义依存分析新词发现用自动生成的摘要进行文本分类聚类拼音简繁转换自然语言处理源码