NLP实验室分配 任务 : 在数据集上完成您分配的任务。 这是您的双语语料库或平行语料库。 开发一个python程序来分割Bangla数据集中的句子。 将程序另存为nlp_sent_ .py。 在nlp_sent_ .pdf中写一些关键意见 开发一个python程序来标记Bangla数据集。 将程序另存为nlp_tokenizer_ .py。 在nlp_tokenizer_ .pdf中写一些关键观察 开发一个python程序来完成以下任务:(将程序另存为nlp_histogram_ .py。)。 完成后,我们将提供对并行数据集的访问权限,以便您可以执行以下任务。 从并行语料库中提取以下统计信息: 英方 孟加拉边 语料库大小(以词为单位),不包括标点符号 语料库大小(以字符为单位),不包括空格 平均句子长度(以字为