MediaSum:媒体总和 源码
媒体总和 这个大规模的媒体采访数据集包含463.6K笔录和摘要,这些笔录是从NPR和CNN的采访笔录和概述/主题描述中收集的。 请将您对本数据集的使用仅限于研究目的。 并请引用我们的论文: MediaSum:用于对话汇总的大规模媒体采访数据集 朱晨光*,刘洋*,梅洁和曾梵志(*:平等贡献) 计算语言学协会( NAACL )北美分会,墨西哥,墨西哥,2021年。 { "id": "NPR-11", "program": "Day to Day", "date": "2008-06-10", "url": "https://www.npr.org/templates/story/story.php?storyId=91356794", "title": "Researchers Find Discriminating Plants", "summary": "T
文件列表
MediaSum-main.zip
(预估有个7文件)
MediaSum-main
figures
data_comparison.png
70KB
data_distribution.png
36KB
data_split.png
46KB
example.png
55KB
data
train_val_test_split.json
6.03MB
README.md
265B
README.md
3KB
暂无评论