维普资讯 http://www.cqvip.com 计算机教育・・・・・・ 本栏目责任编辑:王力 女性IT教育研究支持系统数据仓库的设计研究 宋阳秋 (广东女子职业技术学院,广东广州511450) 摘要:我院关于女性IT教育的研究已经取得了一些成果,日常的教学管理在校园网上也积累了大量可用于女性IT教育研究的数 据。如何利用这些信息资源为女性IT教育研究服务,也是我院重要的研究课题。本文针对女性IT教育研究支持系统需求特点,提出了3 层结构化的研究支持系统的体系结构,并提出了支持系统数据仓库的设计思路和实现方法 关键词:女性IT教育:研究支持系统;数据仓库:体系结构 中图分类号:TP311 文献标识码:A 文章编号:1009—3044(2007)13-30282—02 SONG Yang--qiu Research of Data Warehouse for Women s IT EducationaI Research Suppo ̄System (Guangdong Women S Polytechnic Conege,Guangzhou 51 1450,China) Abstract:The research for women S IT education has been obtained a few production in our conege.through the application of campus network tO daily teaching mangement,large amoun ̄of data for women S IT educational research have been accumulated.HOW to utilize these data to suppoft women S IT educational research is the hot spot in the deeper research,and is che important task of research tOO.In this paper. According tO the features of the Women S IT educational research,a three-layers-architecture of the Women S IT eductional research sup— port system is put forward and how tO design and implement the data warehouse is discussed for the research support system. Key words:women S IT education;research support system;data warehouse;architecture 1引言 广东女子职业技术学院是广东省唯一的一所公立女子高等 学府,致力于新型女性人才的培养和开发,因此,女性教育是学院 一个永恒的话题。计算机系是学院唯一理工类专业的系,而女性 学习包括IT专业在内的理工类专业与男性相比存在较大差异已 有关教学活动的诸多因素发生变化,因此支持系统需求也不断改 变。比如,计算机技术不断发展,课程的内容也随之改变,支持系 内毒歉磊 外奄敦螽 统需求也必然会受到影响。 根据女性I1’教育支持系统需求的特点,女性IT教育支持系统 的体系结构设计如图1所示。这个体系结构分为三层,分别如下: (1)源数据层 是共识,因此,对女性IT教育的研究是计算机系的一个重要教研 主题。为此,计算机系申报了“女性特色教育”省级课题的“适合女 性特色高等职业教育IT专业课程体系研究”子课题,经全体教师 的努力.项目已取得了一些成果,并应用于教学中,取得了良好的 教学效果。 学院自1999年开始进行校园网建设,至今已覆盖全校的教 源数据层数据源由内部数据源和外部数据源构成,内部数据 源主要包括基于校园网的各种应用系统的数据库、网络中心的各 种文档和备份数据库,以及学院信息数字化规划范围内的其它数 据资源:外部数据源包括校园网之外的各类数据库和数据资源, 既可来源于学院之内,也可以来源于同类院校、培训机构。 学、科研和行政管理单位,除了提供常规的lntemet信息服务外, 还运行有校园网教学管理平台应用系统、图书馆网络管理应用系 统、网上辅助教学系统,以及网上选课服务等。这些系统在完成日 常教学业务处理的同时.也积累了大量关于教学方面的数据。在 这些海量的数据中必然蕴藏着大量有利于研究女性IT教育的数 据,因此.建立一个包含各种IT教学信息的数据仓库是实现我院 女性I1’教育研究支持系统的关键一步。 、 二一-、 二) 教1 、 — 分 线计分折工^ 折 一、—— 咽 膏披 警 I艘 1 应 用 正 联机分折工^ 教蠢I芑翔工^ 台 教 I茎I 2女性IT教育研究支持系统结构 女性IT教育的研究实质是突显女性特色的IT教育,其核心 是构建适合女性IT教育的课程体系,一是课程与教学要适合女 生,课程与教学目标适合女生的发展;二是课程与教学内容要适 合女生,根据女生的特点和优势,挖掘她们的潜能。女性I1’教育 研究支持系统需求有以下特点: (1)支持系统需求涉及多方面数据。比如,要了解学生对某一 门课程的学习情况,就要涉及到学生、教师、教材等方面的因素, 数据量不仅大、时间跨度长,而且必须是来源于多方面的。 (2)支持系统需求目标定性困难、难以量化。女性学习IT专 业与男性相比,确实存在差异,这主要有主观和客观两方面的因 素。客观上.女性在学习方面逻辑思维能力逊于男性,善于形象思 维和机械记忆。教学内容和教学模式对男女差异重视不够;主观 上.主要表现为自信心不足,兴趣的指向偏向文科,用机械记忆代 替理解记忆。 豫数据层 信息及f理层 Ilttg- ̄不层 图1女性IT教育研究支持系统体系结构 (2)信息及管理层 . 信息及管理层的核心就是数据仓库。针对支持系统需求目标 定性困难、难以量化的特点,本层作为中介层对数据进行处理。数 据仓库通过对原始数据进行收集、分类、筛选,形成能够对女性IT 教育研究提供支持的多重粒度级的数据库,实现对原始数据的统 管理和信息转换。同时,为数据表示层分析应用平台构造更高 一粒度级的数据集市和知识挖掘库,以提供数据支持。 (3)数据表示层 数据表示层由分析应用平台构成,主要包括统计分析工具、 OLAP工具、数据挖掘工具等。通过分析应用平台提供的各种分析 工具,能较好地适应支持系统需求不稳定的特点。 总之.女性IT教育研究支持系统的3层结构适应了系统需求 的特点.通过数据仓库进行衔接,实现了数据驱动,又相互独立, (3)支持系统需求不稳定。主要表现在内容上的不稳定,由于 收稿日期:2007—05—31 作者简介:宋 ̄方面的研究。 (1968一),男,江西奉新人,在读硕士研究生,广东女子职业技术学院计算机系讲师,主要从事网络安全、管理信息系统开发 282 电脑知识与技术 维普资讯 http://www.cqvip.com 本栏目责任编辑:王力 任何一层的维护对其他层所产生的影响是非常小的。 ・・・・・・计算机教育・ 度的级别,数据仓库中的粒度确定是数据仓库开发过程中需要解 决的最重要的单一设计问题,贯穿于数据仓库设计的始终。在设 计的各个阶段要注意考虑相关的实体和维度数据的粒度级别.数 据细化程度越高,粒度级就越小:反之.数据综合程度越高.粒度 级就越大。同时,还要考虑到对于某一种信息来说所包含的粒度 3女性IT教育研究支持系统数据仓库的设计 3.1支持系统数据仓库的结构 女性IT教育研究支持系统数据仓库的结构具有一般性,如 图2所示,包括早期细节级、当前细节级、轻度综合数据级(数据 集市)、高度综合数据级。数据是由操作型环境导人数据仓库的. 相当数量的数据转换通常发生在由操作型级别向数据仓库级别 传输过程中,因此,早期细节级是数据准备级,一般是直接从数据 源抽取并简单处理过的数据当前细节级做准备。当前细节级包含 了全部的对支持决策有用的信息.是对数据源的全面的信息描述 和转化,是支持分析的基本依据。如果数据一旦过期.就由当前细 节级进入早期细节级。综合后的数据由当前细节级进入轻度综合 数据级。轻度综合数据级和具体主题相关,是数据集市和知识挖 掘库的整理和归档。数据经过进一步的综合后由轻度综合数据级 进入高度综合数据级。高度综合数据级的数据能够直接匹配数据 挖掘算法,往往是应用于更具体主题的数据集市或知识挖掘库在 数据仓库中的归档。 一…………~………一……………~、, ~ , ui=-g- ̄向日目 国曰目、 图2支持系统数据仓库的结构 3.2主题域 正如前所述,女性IT教育研究的核心是构建适合女性学习 的IT课程体系,在教学过程中兼有教与学两个方面,因此,典型 的主题域包括课程、教师、学生。主题域及其子主题域结构如图3 所示 图3支持系统主题域结构 3.3数据模型设计 为了便于联机数据分析.数据仓库需要简明的、面向主题的 模式。最流行的数据仓库数据模型是多维数据模型,这种模型以 星型模式、雪花模式、事实星座模式形式存在。这里使用星型数据 模式,其中数据仓库包括一个包含大批数据和不含冗余的中心表 (事实表),以及一组小的附属表(维表),每维一个。图4是以成绩 主题为例设计的Scale数据仓库的星型模型。 Scale有三个维,分别是Time、Couse、Student,该模式包含一 个中心事实表Scale,它包含三个维的关键字和两个度量 (num—scale和grade_scale)。 3.4粒度 粒度是指数据仓库的数据单位中保存数据的细化或综合程 级别,以及每种粒度级别包含的数据。如表1所示。 Trtat ScIk 蛙衰 事实衰 图4 Scale数据仓库的星型模式 表1 部分信息在不同主题中的粒度级别 、、\主题 学鼙主题 成绩主题 毕业信息 造讽主题 信息、\ —个学生的入学成绩 7Ii —个学生藁rr讽程成绩 7Ii 低 低 —个学生的rr选修讽程 低 7Ii 4支持系统数据仓库的实现 本着数据驱动的原则.女性IT教育研究支持系统的开发流程 n譬q# t 采用基于数据驱动的CLDS螺旋式开发流程。在设计过程中,由数 据开始,将数据集成,然后在不断的应用中矫正数据。 支持系统数据仓库的CLDS开发由当前细节级开发和支持分 析循环两个阶段构成。在当前细节级开发阶段完全建立支持系统 的数据仓库的当前细节级.并且准备好软硬件环境.这一阶段只 开发一次,不进入CLDS循环。支持分析循环是CLDS开发流程的 的循环体,随着需求和应用的不断增加,新的主题将会增加,旧的 主题也会被扩展,同时数据集市和知识挖掘库的归档不断为数据 仓库的早期细节级和当前细节级添加数据。如图5所示。 图5 支持系统数据仓库开发流程 5结束语 基于数据仓库的女性IT教育研究支持系统对我院的女性IT 教育研究必将起到一个积极的推动任用,而数据仓库在支持系统 体系结构中起着承上启下的作用,既是重点,也是难点。本文对支 持系统数据仓库体系构建进行了有益的探索,并在实践中基本得 到实现。而本文更深层的目的在于,希望本文能起到一个抛砖引 玉的作用.让更多关心女性IT教育的学者来探讨这个课题。 参考文献: 【llW.H.Inmon.数据仓库【M】.北京:机械工业出版社,2000. 『2]Jiawei Han,Micheline Kamber.数据挖掘概念与技术【M】.北 京:机械工业出版社.2001. 【3】张俊平.基于数据仓库的高校信息决策系统的设计研究[J】. 浙江工贸职业技术学院学报,2006,6(2). 『41刘飞兵.运用数据挖掘技术优化大学英语多媒体教学[J】. 外语电化教学,2006(1 o1. 【5】夏秀峰,等.数据仓库设计中低粒度数据的分割策略研究 『J1.计算机工程,2006,32(17).