Ta上传的资源 (0)

1.使用任意方法实现任一类中文名实体识别; 2.给定足够规模的测试文本,在其上标注至少100个实体识别结果(以附件形式提供); 3.计算出实体识别的准确率和召回率,并给出计算依据; 4.针对识别结果中存在的问题给出具体分析;

中文自动分词1.使用任意分词方法实现汉语自动分词;2.给出至少1000个句子的分词结果(以附件形式);3.计算出分词结果的正确率,并给出计算依据;4.用实例说明所用分词方法分别对“交叉歧义”和“组合歧义”的处理能力;5.提交实验报告,给出详细实验过程和结果;提交源代码和可执行程序。

汉字字频统计1.给出前100个汉字高频字的频率统计结果;2.分别给出前1、20、100、600、2000、3000、6000汉字的字频总和;3.计算汉字的熵值;4.针对不同规模语料重复上述实验;5.以图表的形式表示上述结果;6.提交实验报告,给出详细实验过程和结果;提交源代码和可执行程序。

本文详细介绍了哈尔滨工业大学编译原理实验课中的一项重要实验——词法分析。通过对实验过程、实验结果以及实验分析的全面阐述,本文将帮助读者更好地理解和掌握该实验内容。
Java 239