DATA130006:自然语言处理

DATA130006: 自然语言处理


教师信息

授课教师 魏忠钰(副教授)
电子邮箱 zywei@fudan.edu.cn
办公室 新金博大厦 1407
个人主页 http://www.sdspeople.fudan.edu.cn/zywei/

课程介绍

本课程是计算机学科的核心课程,面向本科高年级学生。本课程的内容主要涵盖自然语言处理的基础知识,主要包括文本的预处理,语言模型,文本分类,情感分析,文本聚类,特征选择,序列标注等内容,为后续解决更复杂的自然语言问题奠定基础。


课程内容

第零章 自然语言处理导论 课件
介绍Python和NLTK 课件
第一章 正则表达式和最小编辑距离 课件
文本预处理 课件
第二章 语言模型 课件
拼写校正 课件
语料库资源和SRILM 课件
第三章 文本分类和朴素贝叶斯 课件
情感分析 课件
第四章 主题分析的语言模型 课件
文本聚类 课件
第五章 主题分析的语言模型 课件
使用NLTK进行文本分类 课件
第六章 最大熵模型 课件
信息抽取 课件
第七章 嘉宾讲座:知识图谱 课件
特征选择 课件
第八章 序列标注 课件
第九章 词性标注 课件
统计自然语言解析I 课件
自动内容抽取(ACE)简介 课件
第十章 统计自然语言解析II 课件
第十一章 词汇化的PCFGs 课件
依赖关系解析 课件
第十二章 词表示 课件
第十三章 神经网络基础 课件 Tensorflow资料
第十四章 课程复习 课件
CNN和RNN基础 课件
课件打包下载

教材及参考书目

  • Foundations of Statistical Natural Language Processing, C. Manning and H Schutze, 1999.
  • Speech and Language Processing (2nd Edition), an Jurafsky and James H. Martin, 2009.
  • Natural Language Processing with Python, Steven Bird, Ewan Klein, and Edward Loper, 2009.


感谢斯坦福大学,伊利诺伊大学厄巴纳-香槟分校分享幻灯片中使用的材料。