中国科学院研究生院信息学院硕士生课程刘群教授主讲。本课程为计算机软件与理论专业研究生的专业基础课。通过本课程的学习,使同学掌握计算语言学的基本理论,了解自然语言处理的常用模型和算法,初步具备从事相关领域研究工作的能力。内容提要:第一章概论介绍计算语言学的研究对象,研究手段,学科特点,历史趋势等。第二章词典词典编纂,组织,检索等。第三章语料库语料库收集,整理,对齐,检索,基于语料库的知识获取。第四章词法分析正则语法与有限状态自动机,HMM与词性标注,汉语词语切分,未定义词识别等。第五章句法分析各种形式语法理论(短语结构语法,范畴语法,链语法,GB,LFG,