实体名识别哈工大中文信息处理实验二实验报告 1.使用任意方法实现任一类中文名实体识别; 2.给定足够规模的测试文本,在其上标注至少100个实体识别结果(以附件形式提供); 3.计算出实体识别的准确率和召回率,并给出计算依据; 4.针对识别结果中存在的问题给出具体分析;
中文自动分词哈工大中文信息处理实验二实验报告 中文自动分词1.使用任意分词方法实现汉语自动分词;2.给出至少1000个句子的分词结果(以附件形式);3.计算出分词结果的正确率,并给出计算依据;4.用实例说明所用分词方法分别对“交叉歧义”和“组合歧义”的处理能力;5.提交实验报告,给出详细实验过程和结果;提交源代码和可执行程序。
汉字字频统计哈工大中文信息处理实验一实验报告 汉字字频统计1.给出前100个汉字高频字的频率统计结果;2.分别给出前1、20、100、600、2000、3000、6000汉字的字频总和;3.计算汉字的熵值;4.针对不同规模语料重复上述实验;5.以图表的形式表示上述结果;6.提交实验报告,给出详细实验过程和结果;提交源代码和可执行程序。