《数据库新技术》教学大纲
课程编号:006016012 | 课程名称:数据库新技术 Database Technology | 学时数:20 | |
开课时间:(√ )秋季/()春季 | 授课对象:(√)硕士/()博士 | 学分:1 | |
开课学院:计算机科学与工程学院 | 先修课程: 操作系统,软件工程,程序设计语言(Java/C++),计算机网络,数据库技术 | ||
一、教学目的
本课程面向硕士研究生,学习数据库领域研究的新进展、新理论、新技术。通过对分布式数据库、面向对象数据库、数据仓库、数据挖掘、特种数据库等基本理论的学习,使学生能够掌握各类数据库的基本原理,并把它们用到具体的应用环境中。
二、教学内容与要求
本课程共20学时,分为以下六章:
第一章 数据库技术回顾和展望(4学时)
主要内容数据库技术回顾包括:概述,数据库技术三个发展阶段, 数据库新技术发展方向, 数据库技术的演化发展等,数据库管理系统包括数据库管理系统软件分层体系结构, 每层的设计与实现技术,数据库管理系统的目录结构、并发控制、恢复技术、查询优化和索引技术的原理和实现。
了解:
1. 本课程的目的是为数据库的各种数据模型、关键技术及发展趋势提供一个高屋建瓴的综合性介绍。
2. 分布式数据库、面向对象数据库、数据仓库等的基本概念及面临的主要挑战
3. 了解数据库新技术的特点和发展方向
掌握:
从数据库技术发展中, 掌握数据库学科的相关概念:
1) 数据库发展的三个阶段
2) 数据模型及其发展, 三级模式
3) 数据库的独立性, 数据库的体系结构
4) 新一代数据库发展的技术思路和方向
5) 数据库管理系统的目标、功能、系统结构
6) 数据库管理系统的目录结构、并发控制、恢复技术、查询优化和索引技术的原理和实现。
重点与难点:
本章重点是使学生明白本课程的意义;数据库技术发展, 数据库模型的发展, 新的数据库技术的特点和发展方向, 数据库管理系统的目标、功能、系统结构, 数据库管理系统的目录结构、并发控制、恢复技术、查询优化和索引技术的原理和实现。 难点是掌握从数据库技术发展的三个阶段,数据模型相关内容和发展, 数据库管理系统的目标、功能、层次结构和的演化过程,并发控制、恢复技术、查询优化和索引技术的原理。
第二章 面向对象数据库(2学时)
面向对象程序设计方法, 面向对象数据模型, 面向对象数据库管理系统的组成和设计,对象_关系数据库中的基本数据类型扩充、 复杂对象、继承、 规则等, 对象_关系数据库的设计和实现。
了解:
面向对象方法的基本思想、面向对象数据类型, 面向对象相关概念和应用,面向对象数据模型和面向对象数据库管理系统、对象关系数据库管理系统及其相关产品的特点和实现原理。
掌握:
1. 面向对象方法和面向对象数据模型
2. 面向对象数据库关系系统及其内容
3. 对象关系数据库管理系统,对象关系数据模型
4. 扩展关系模型到对象关系模型的四种方法
重点与难点:
重点理解面向对象数据模型、面向对象数据库管理系统的内容、扩充关系数据模型到关系对象模型的几种方法,关系对象数据库管理系统的实现方法。难点是面向对象数据模型及面向对象数据库管理系统的内容、扩展关系数据模型到关系对象模型的几种方法及其实现。
实践环节:
第三章 XML(3学时)
半结构化、非结构化数据的结构和管理、文件系统和XML数据管理,XML数据交换的标准的格式设计,XML数据的查询和存储,XML数据数据库模型, WEB数据的提取和集成,XML和关系数据库的数据转换, WEB环境下基于XML的数据发布
了解:
1. Web Service基础, 面向服务架构的技术标准
2. XML数据交换的标准、数据格式
3. XML数据的存储、XML的业务应用
掌握:
1. XML,XML DTD, XML Schema的概念
2. 面向服务架构SOA的概念及其涉及的各种范畴
3. XML数据的查询和转换,XPATH, XQUERY的语法和使用
4. XML数据模型及其和关系模型的转换和存储
重点与难点:
重点是掌握XML,XML DTD, XML Schema,XPATH, XQUERY 基本原理与核心支撑技术;难点是理解XML数据模型及其和关系模型的转换和存储的复杂性及其非技术因素范畴。
实践环节:
基于xml实现的文本搜索: 使用DB2的XML text search部件,对文本的不同属性信息,进行分别查找。其中的内容包括:对文本进行建立索引,对XML Text的不同属性中的文本进行查找。 本课题要求:学习DB2 version9中的XML相关资料,结合XML的构造,使用Xquery实现文本的搜索。进一步的工作,构造原始的XML数据集,供文本搜索器使用。
第四章 数据库的体系结构分布式数据库(3学时)
数据库的体系结构, 分布式数据库的定义、特点、模式结构,分布式数据库的分布透明,分布式数据库管理系统, 分布式数据库的查询处理和优化, 分布事务管理(恢复和并发控制), 发展前景和应用趋势等。
了解:
数据库的体系结构包括单机和网络结构、分布式结构、并行结构等的定义、特点、模式结构, 各种体系结构下数据库的设计和实现的基本原理和方法。分布式对象数据模型和数据库系统, 分布式数据库管理系统及其应用。
掌握:
分布式数据库的定义、特点、扩展的数据处理模式;分布式数据库的数据分布透明处理的原理和方法,分布式数据库管理系统, 分布式数据库的查询处理和优化, 分布事务管理(恢复和并发控制), 发展前景和应用趋势等。
重点与难点:
本章的重点是掌握分布式数据库的数据库的定义、特点、模式结构;理解分布式数据库的数据透明处理;难点是分布式数据库管理系统设计与实现和分布式数据库的查询处理和优化;理解分布式数据库环境体系的复杂性。
作业:
设计和开发小型分布式图书馆系统的数据库系, 要求如下:
1) 数据必须存放在至少3个站点上,数据的划分对用户完全透明。
2) 系统必须支持基本的SQL查询语句(可以不包含嵌套),并能将查询结果反映到界面上。
3) 系统必须支持数据划分,可以选择支持水平划分,垂直划分,水平+垂直划分或者混合划分。
4) 用户查询要进行分解和优化,然后转交底层数据库管理系统执行。
5) 各分站点服务器界面上必须能显示出所接受和发送的命令,以及命令的处理过程。必须直接显示到界面上,不允许记录到log文件中。
6) 主站点要显示生成查询分解和优化过程。
第五章 数据仓库与数据挖掘(4学时)
数据仓库系统的系统结构, 数据仓库系统的数据组织, 构建数据仓库的方法及实现步骤, 数据重建; 数据挖掘的定义, 数据挖掘系统体系结构, 数据挖掘所发现的知识分类, 数据挖掘处理过程模型, 数据挖掘的功能, 数据挖掘常用技术, 数据仓库和数据挖掘在各个领域的应用实例研究等。
了解:
为什么要建立数据仓库,数据仓库数据和数据库管理系统数据的区别和联系,数据仓库的应用; 数据挖掘的定义, 数据挖掘的方法分类和知识分类, 数据挖掘的功能等。
掌握:
数据仓库的四大核心特征,数据仓库系统的系统结构, 数据仓库系统的数据组织, 数据仓库的设计原则, 元数据的相关内容和实现的方法,构建数据仓库的方法及实现步骤, 数据重建; 数据挖掘的定义, 数据挖掘系统体系结构, 数据挖掘所发现的知识分类, 数据挖掘处理过程模型, 数据挖掘的功能, 数据挖掘常用技术等。
重点与难点:
重点数据仓库的四大核心特征,数据仓库系统的系统结构、数据组织、设计原则,元数据库的设计和实现方法,数据仓库的设计和实现步骤; 数据挖掘系统体系结构, 数据挖掘所发现的知识分类, 数据挖掘不同的处理过程模型, 数据挖掘常用技术包括关联、聚类、分类、统计等。
作业:
利用不同的算法设计(关联分析算法)和实现一个小型数据挖掘系统: 了解关联规则在数据挖掘中的应用,对给定数据集用Apriori算法进行挖掘,找出其中的频繁集并生成关联规则。
第六章 特种数据库(4学时)
重点是空间数据库、多媒体数据库和移动数据库, 了解其它特种数据库如时态数据库、时空数据库、主动数据库、、工程数据库、 实时数据库、内存数据库等。
了解:
了解特种数据库:主动数据库、时态数据库、时空数据库、移动数据库、工程数据库、多媒体数据库、实时数据库、内存数据库等的定义、数据模型、特点、组成、设计要求、功能和相关的应用。
掌握:
移动数据库包括嵌入式数据库、空间数据库和多媒体数据库的定义、数据模型、数据处理和数据存储的特点、数据库系统的组成部分、数据库的各个功能的设计要求、数据查询及其优化的设计与实现的原理、数据库管理系统的各项特殊的要求和处理功能及其相关的应用。
重点与难点:
重点掌握移动数据库包括嵌入式数据库、空间数据库和多媒体数据库的数据模型、数据存储、数据查询语言的扩充、各种新的数据索引的原理和实现。难点是掌握具体算法的设计思想以及在现有基础上寻求改进。
作业:
设计和开发电子科技大学数字校园的原型系统(可以选B/S或C/S模式),内容包括了解学校各个字系统的功能,数据流程, 数据接口等, 在此基础上, 设计和开发一个具有电子科技大学特色的数字校园的原形系统。要求实现空间数据的输入\查询\测量及其属性的相关操作.1) 空间信息的要求: (1)校园图, (2)楼,(3)楼层, (4)房间 2) 空间信息的功能: 输入校园地图 , 楼层和管线的平面图 (1)浏览、编辑地图, (2)测量地图, (3)地物统计 (4)综合查询等