project zayd data:抓取数据分析 源码
安装 git clone 创建virtualenv pip3 install -r requirements.txt 脚本: scrape_corpus.py : pckl/ 并将1664个根词输出到pckl/和csv/ wordsFromSurah.py : 从pckl/读取1664个根词, pckl/ 114个包含json对象的文件输出到/json-surah-words ,每个对象中都包含每个/json-surah-words 。
文件列表
project-zayd-data-master.zip
(预估有个51文件)
project-zayd-data-master
constants.py
112B
download_audio.py
2KB
wordsFromSurah.py
4KB
roots_in_ayahs-2.ipynb
79KB
levels.py
2KB
word_order.ipynb
57KB
data-sources
surahs_json.tar.gz
1.2MB
quran-uthmani.xml
1.45MB
暂无评论