文本分析项目 源码
德语句子的自动复杂度评估 团队成员 里奥·阮·拉乌尔·贝格·康拉德·斯特劳布·蒂尔·诺彻 邮件地址 现有代码片段 利用的图书馆 运行代码(稍后将设置主入口点) 下载数据集: python download_data.py 项目状态 数据分析 我们的主要数据源是TextComplexityDE 19数据集( ),其中包含1000个德语句子,由外语学习者在7点Likert量表上标记为A级和B级,其中1表示低复杂度,高可读性句子,而7则相反。 其中900个句子来自23篇德国Wikipedia文章,其余100则来自Leichte Sprache。 数据集中的每个句子至少由5个人标记,数据集中
文件列表
text-analytics-project-master.zip
(预估有个56文件)
text-analytics-project-master
.example.env
26B
.github
workflows
test.yml
606B
lint.yml
345B
src
utils
sample.py
855B
regression.py
2KB
暂无评论