discover archetype:使用Watson Natural Language了解在文本语料库中发现原型 源码
在您的记录系统中发现原型 记录系统在我们周围的世界无处不在,从音乐播放列表,工作清单,医疗记录,客户服务电话,Github问题等开始。原型被正式定义为一种模式或模型,所有事物都相同类型被复制。 更非正式地说,我们可以将原型视为类别,类,主题等。 当我们通读这些记录集时,我们的思想自然会将这些记录归为一些原型集合。 例如,我们可以将歌曲集分类为易于听,古典,摇滚等。此手动过程适用于少量唱片(例如几十个)。 大型系统可以拥有数百万条记录,因此我们需要一种自动化的方式来处理它们。 另外,在没有这些记录的先验知识的情况下,我们可能事先不知道记录中存在的原型,因此我们还需要一种方法来发现可以采用的有意
文件列表
discover-archetype-master.zip
(预估有个35文件)
discover-archetype-master
.travis.yml
116B
python
show_archetype.py
1KB
cloud_object_store.py
3KB
__init__.py
0B
convert_rtf.py
367B
find_archetype.py
17KB
notebook
WATSON_Document_Archetypes_Analysis_Showcase.ipynb
27KB
暂无评论