recipenlg:用于产生RecipeNLG纸中可见结果的脚本和笔记本集 源码
RecipeNLG:用于半结构化文本生成的烹饪食谱数据集 这是代码的存档,用于生成数据集和结果,可用于我们的INLG 2020文件: 令人兴奋的是什么? 我们发布的数据集包含2231142个烹饪食谱(> 200万个)。 与该区域中的任何其他数据集相比,它的处理方式更为谨慎,并提供了更多的样本。 数据集在哪里? 请访问我们项目的网站: 进行下载。 注意:数据集包含我们收集的所有数据,包括从其他数据集中收集的所有数据。 要仅访问我们收集的配方(没有12而不是1/2等),请过滤数据集以获取source = Gathered。 这样可以产生约160万个质量更好的配方。 我在研究中使用了数据集。 如何引用你? 使用以下BibTeX条目: @inproceedings{bien-etal-2020-recipenlg, title = "{R}ecipe{NLG}: A Cooking
文件列表
recipenlg-main.zip
(预估有个82文件)
recipenlg-main
eval
evaluation.ipynb
11KB
scraping-scripts
06-comparisons_plots.ipynb
52KB
04.4-dataset-find-similar.sh
97B
recipes1M-transform.ipynb
1KB
04.1-cleanse-positive-pairs-dataset.py
997B
extra-01-remove_different_language_recipes.ipynb
11KB
crawling_prep.ipynb
200KB
暂无评论