Font Size

Cpanel
简体中文(中国)English (UK)

课程讲授

本科生课程:信息检索

课程简介:本课程讲授文本信息检索的基本方法与技术,主要内容包括:信息检索的重要性及其应用、信息检索基本框架、文本分析及自动标引、潜在语义分析、信息检索模型、相关反馈、检索评价、检索界面与可视化、Web信息检索、信息抽取等。

授课老师:孙茂松教授

主要章节

1. 引言

1.1. 信息检索的意义

1.2. 简史

1.3. 文本信息检索当前的主要研究方向及挑战

1.4. 如果没有分词,中文搜索引擎将会怎样

1.5. 典型系统考察及其发展趋势

2. 信息检索系统的基本框架

2.1. 信息检索基本模型

2.2. IR基本文件结构

2.3. 针对倒排文件的基本操作

2.4. 对倒排文件的进一步考察

3. 文本分析及自动标引

3.1. 标引

3.2. Term的自动抽取及其加权

3.3. 个简单的自动标引过程

3.4. 向量表示与相似度计算

3.5. Thesaurusterm自动关联

3.6. 自动标引实验分析

4. 信息检索实验系统SMART及其特点

4.1. SMART与向量空间模型

4.2. 文本的自动聚类

4.3. 相关反馈

5. 检索评价

5.1. 检索评价的两个角度:EfficiencyEffectiveness

5.2. Effectiveness

5.3. Efficiency

6. 用户界面与可视化

6.1. 信息访问过程与检索界面的基本组成

6.2. 文本集选择

6.3. Query描述

6.4. 上下文

6.5. 利用相关判断

6.6. 搜索过程的界面支持

7. 信息检索的其它模型

7.1. 布尔模型

7.2. 概率模型

7.3. 扩展布尔模型

7.4. Bayesian网络模型

7.5. 潜在语义分析

8. 信息检索典型应用之一:信息抽取

8.1. 信息抽取过程

8.2. 基本技术手段

9. 信息检索典型应用之二:Web信息检索

9.1. 概述

9.2. PageRank

9.3. HITS

 

研究生课程:计算语言学

当前位置:Home 课程讲授