discover archetype:使用Watson Natural Language了解在文本语料库中发现原型源码

tournament3527 0 0 ZIP 2021-02-22 16:02:36

在您的记录系统中发现原型记录系统在我们周围的世界无处不在,从音乐播放列表,工作清单,医疗记录,客户服务电话,Github问题等开始。原型被正式定义为一种模式或模型,所有事物都相同类型被复制。更非正式地说,我们可以将原型视为类别,类,主题等。当我们通读这些记录集时,我们的思想自然会将这些记录归为一些原型集合。例如,我们可以将歌曲集分类为易于听,古典,摇滚等。此手动过程适用于少量唱片(例如几十个)。大型系统可以拥有数百万条记录,因此我们需要一种自动化的方式来处理它们。另外,在没有这些记录的先验知识的情况下,我们可能事先不知道记录中存在的原型,因此我们还需要一种方法来发现可以采用的有意

文件列表

discover-archetype-master.zip (预估有个35文件)

discover-archetype-master

.travis.yml 116B

python

show_archetype.py 1KB

cloud_object_store.py 3KB

__init__.py 0B

convert_rtf.py 367B

find_archetype.py 17KB

notebook

WATSON_Document_Archetypes_Analysis_Showcase.ipynb 27KB

LICENSE 11KB

CONTRIBUTING.md 771B

__init__.py 0B

doc

source

images

ui-arch-screenshot.png 251KB

architecture.png 45KB

.gitignore 41B

README.md 8KB

web-app

app.py 112B

application

extensions.py 59B

models.py 952B

assets

style.css 224B

__init__.py 3KB

pages

upload

layout.py 3KB

callbacks.py 3KB

nlu.py 3KB

match

layout.py 3KB

callbacks.py 3KB

analyzer.py 2KB

dashboard

layout.py 4KB

callbacks.py 2KB

home

layout.py 1KB

analysis

archetypes.py 3KB

corpus.py 490B

requirements.txt 164B

.gitignore 19B

README.md 3KB

instance

config.py.sample 325B

MAINTAINERS.md 3KB

用户评论

暂无评论

CASIA汉语情感语料库.rar

中科院自动化所录制的情感语料库,数据库包括奖金10000条语音。发音为中文数据库包括angry、fear、happy、neutral、sad和surprise六种情绪,四个演员对300句相同文本和10

23 2020-05-04
汉语语音情感语料库.rar

数据集用于语音情感分析训练数据库。可以用于机器学习，深度学习。该数据集是CASIA语料库，该数据只用于学习。

66 2020-05-17
人民日报语料库

人民日报语料库

61 2018-12-08
康奈尔电影对话语料库

康奈尔电影对话语料库，英文。

62 2019-01-12
美国当代英语语料库60000

美国当代英语语料库 COCA Frequency 60000,适用于欧路，mdict等第三方词典

456 2019-01-15
分词库和语料库.zip

人民日报2014语料库和很多行业的中文分词库，如财经，地点，电视剧，电影等。如果有需要的可以在此处下载哦。

23 2020-05-19
英文词性标注语料库

英文分词语料库，共有198796行，每个单词都有词性标注，对句话的结束都有句号，便于处理。覆盖大部分主流行业的语料。例如：Newsweek/NNP,/,trying/VBGto/TOkee

136 2020-05-15
casia汉语情感语料库.zip

该数据库(http://www.chineseldc.org/resource_info.php?rid=76)由中国科学院自动化研究所录制,由4位录音人(2男2女)在纯净录音环境下(信噪比约为35d

34 2020-06-20
语料库的赋码工具

（1）显示赋码首字母，如名词以N开头、动词以V开头。（2）包含特定赋码首字母的各种语言特征。（3）用户自定义的各种语言特征，如被动语态等。（4）显示所选语言特征的正则表达式，用户也可在此编辑表达

37 2019-02-16
小黄鸡_未分词_语料库

来源于人人网小黄鸡语料库，经过一部分处理后，但是并没有分词，可以用于对于中文的常用对话系统训练，也可以进行普通的中文自然语言处理。

60 2019-02-19

discover archetype:使用Watson Natural Language了解在文本语料库中发现原型 源码

文件列表

用户评论

推荐下载

discover archetype:使用Watson Natural Language了解在文本语料库中发现原型源码