内容简介
数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。
《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在SQL 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。
《数据仓库与数据挖掘技术》可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。
目录
第1章 数据挖掘和数据仓库概述
1.1 数据挖掘引论
1.1.1 数据挖掘的由来
1.1.2 数据挖掘的定义
1.1.3 数据挖掘的功能
1.1.4 数据挖掘的常用方法
1.2 数据仓库引论
1.2.1 数据仓库的产生与发展
1.2.2 数据仓库的定义
1.2.3 数据仓库与数据挖掘的联系与区别
1.3 数据挖掘的应用
1.3.1 数据挖掘的应用领域
1.3.2 数据挖掘案例
1.4 常用数据挖掘工具
1.4.1 数据挖掘工具的种类
1.4.2 评价数据挖掘工具优劣的指标
1.4.3 常用数据挖掘工具
小结
习题
第2章 数据仓库
2.1 数据仓库的基本概念
2.2 数据仓库的体系结构
2.2.1 元数据
2.2.2 粒度的概念
2.2.3 分割问题
2.2.4 数据仓库中的数据组织形式
2.3 数据仓库的数据模型
2.3.1 概念数据模型
2.3.2 逻辑数据模型
2.3.3 物理数据模型
2.3.4 高层数据模型、中间层数据模型和低层数据模型
2.4 数据仓库设计步骤
2.4.1 概念模型设计
2.4.2 技术准备工作
2.4.3 逻辑模型设计
2.4.4 物理模型设计
2.4.5 数据仓库的生成
2.4.6 数据仓库的使用和维护
2.5 利用SQL Server 2005构建数据仓库
小结
习题
第3章 联机分析处理技术
3.1 OLAP概述
3.1.1 OLAP的由来
3.1.2 OLAP的一些基本概念
3.1.3 OLAP的定义与特征
3.2 OLAP中的多维分析操作
3.2.1 钻取
3.2.2 切片和切块
3.2.3 旋转
3.3 OLAP的基本数据模型
3.3.1 多维联机分析处理
3.3.2 关系联机分析处理
3.3.3 MOLAP和ROLAP的比较
3.3.4 混合型联机分析处理
3.4 OLAP的衡量标准
3.5 基于SQL Server 2005的OLAP实现
小结
习题
第4章 数据预处理
4.1 数据预处理概述
4.1.1 原始数据中存在的问题
4.1.2 数据预处理的方法和功能
4.2 数据清洗
4.2.1 属性选择与处理
4.2.2 空缺值处理
4.2.3 噪声数据处理
4.2.4 不平衡数据的处理
4.3 数据集成和变换
4.3.1 数据集成
4.3.2 数据变换
4.4 数据归约
4.4.1 数据归约的方法
4.4.2 数据立方体聚集
4.4.3 维归约
4.4.4 数据压缩
4.4.5 数值归约
4.4.6 离散化与概念分层生成
小结
习题
第5章 关联规则方法
5.1 关联规则的概念和分类
5.1.1 关联规则的概念
5.1.2 关联规则的分类
5.2 Apriori算法
5.2.1 产生频繁项集
5.2.2 产生频繁项集的实例
5.2.3 从频繁项集产生关联规则
5.3 FP-Growth算法
5.3.1 FP-Growth算法计算过程
5.3.2 FP-Growth算法示例
5.4 利用SQL Server 2005进行关联规则挖掘
小结
习题
第6章 决策树方法
6.1 信息论的基本原理
6.1.1 信息论原理
6.1.2 互信息的计算
6.2 常用决策树算法
6.2.1 ID3算法
6.2.2 C4.5算法
6.3 决策树剪枝
6.3.1 先剪枝
6.3.2 后剪枝
6.4 由决策树提取分类规则
6.4.1 获得简单规则
6.4.2 精简规则属性
6.5 利用SQL Server 2005进行决策树挖掘
6.5.1 数据准备
6.5.2 挖掘模型设置
6.5.3 挖掘流程
6.5.4 挖掘结果分析
6.5.5 挖掘性能分析
小结
习题
第7章 统计学习方法
7.1 朴素贝叶斯分类
7.1.1 贝叶斯定理
7.1.2 朴素贝叶斯分类
7.2 贝叶斯信念网络
7.2.1 贝叶斯信念网络
7.2.2 贝叶斯网络的特点
7.2.3 贝叶斯网络的应用
7.3 EM算法
7.3.1 估计�玨��个高斯分布的均值
7.3.2 EM算法的一般表述
7.4 回归分析
7.4.1 一元线性回归
7.4.2 多元线性回归
7.4.3 非线性回归
7.5 利用SQL Server 2005进行线性回归分析
小结
习题
第8章 人工神经网络方法
8.1 人工神经网络的基本概念
8.1.1 人工神经元原理
8.1.2 人工神经网络拓扑结构
8.1.3 人工神经网络学习算法
8.1.4 人工神经网络泛化
8.2 误差反向传播(BP)神经网络
8.2.1 BP神经网络的拓扑结构
8.2.2 BP神经网络学习算法
8.2.3 BP神经网络设计
8.3 自组织特征映射(SOFM)神经网络
8.3.1 SOFM神经网络的拓扑结构
8.3.2 SOFM神经网络聚类的基本算法
8.3.3 SOFM神经网络学习算法分析
8.4 Elman神经网络
8.4.1 Elman神经网络的拓扑结构
8.4.2 Elman神经网络权值计算
8.5 Hopfield神经网络
8.5.1 Hopfield神经网络的拓扑结构
8.5.2 Hopfield神经网络学习算法概述
8.5.3 离散Hopfield神经网络
8.5.4 连续Hopfield神经网络
8.6 利用SQL Server 2005神经网络进行数据挖掘
8.6.1 数据准备
8.6.2 挖掘流程
小结
习题
第9章 聚类分析
9.1 聚类概述
9.1.1 聚类简介
9.1.2 聚类的定义
9.1.3 聚类的要求
9.2 聚类分析中的相异度计算
9.2.1 聚类算法中的数据结构
9.2.2 区间标度变量及其相异度计算
9.2.3 二元变量及其相异度计算
9.2.4 标称型变量及其相异度计算
9.2.5 序数型变量及其相异度计算
9.2.6 比例标度型变量及其相异度计算
9.2.7 混合类型变量的相异度计算
9.3 基于划分的聚类方法
9.3.1 �玨��-平均算法
9.3.2 �玨��-中心点算法
9.4 基于层次的聚类方法
9.5 谱聚类方法
9.5.1 谱聚类的步骤
9.5.2 谱聚类的优点
9.5.3 谱聚类实例
9.6 利用SQL Server 2005进行聚类分析
9.6.1 挖掘流程
9.6.2 结果分析
小结
习题
第10章 粗糙集方法
10.1 粗糙集的基本概念
10.1.1 等价关系与等价类
10.1.2 信息表与决策表
10.1.3 下近似与上近似
10.2 基于粗糙集的属性约简
10.2.1 属性约简的有关概念
10.2.2 基于粗糙集的几种属性约简算法
10.3 基于粗糙集的决策规则约简
10.3.1 决策规则的定义
10.3.2 决策规则的约简
10.4 粗糙集的优缺点
10.4.1 粗糙集的优点
10.4.2 粗糙集的缺点
小结
习题
第11章 复杂结构数据挖掘
11.1 文本数据挖掘
11.1.1 文本数据的特点
11.1.2 文本挖掘的定义
11.1.3 文本挖掘的主要任务
11.1.4 文本挖掘的一般过程
11.1.5 文本挖掘的应用
11.2 Web数据挖掘
11.2.1 Web数据的特点
11.2.2 Web挖掘的定义
11.2.3 Web挖掘分类
11.2.4 Web挖掘过程
11.2.5 Web数据挖掘的应用
11.3 空间数据挖掘
11.3.1 空间数据的复杂性特征
11.3.2 空间数据挖掘的定义
11.3.3 空间数据挖掘知识的类型
11.3.4 空间数据挖掘的用途
11.4 多媒体数据挖掘
11.4.1 多媒体数据挖掘的概念
11.4.2 多媒体挖掘的分类
小结
习题
参考文献
前言/序言
数据仓库与数据挖掘技术 epub pdf mobi txt 电子书 下载 2024
数据仓库与数据挖掘技术 下载 epub mobi pdf txt 电子书 2024
评分
☆☆☆☆☆
11A.2.1
评分
☆☆☆☆☆
数据仓库的数据模型
评分
☆☆☆☆☆
从上面的介绍中可以看出,数据仓库技术可以将企业多年积累的数据唤醒,不仅为企业管理好这些海量数据,而且挖掘数据潜在的价值,从而成为通信企业运营维护系统的亮点之一。正因为如此,
评分
☆☆☆☆☆
聚类分析H中的相异度计算
评分
☆☆☆☆☆
《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在SQL 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。
评分
☆☆☆☆☆
Server
评分
☆☆☆☆☆
原始数据中存在的问题
评分
☆☆☆☆☆
书籍数据仓库与数据挖掘技术装帧精美,张兴会将司空见惯的文字融入耳目一新的情感和理性化的秩序驾驭,从外表到内文,从天头到地脚,三百六十度的全方位渗透,从视觉效果到触觉感受始终追求秩序之美的设计理念把握,并能赋予读者一种文字和形色之外的享受和满足,开本大小很合适,充满活力的字体不仅根据书籍的体裁、风格、特点而定.字体的排列,而且还让读者感受受第一瞬间刺激,而更可以长时间地品味个中意韵。从秩序有臻的理性结构中引伸出更深层更广瀚的知识源,创游一番想像空间,排列也很准确,图像选择有规矩,构成格式、版面排列、准确的图像选择、有规矩的构成格式、到位的色彩配置、个性化的纸张运用,毫厘不差的制作工艺数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。数据仓库与数据挖掘技术系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。数据仓库与数据挖掘技术结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容数据仓库与数据挖掘技术坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化实例实现的过程建立在2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。数据仓库与数据挖掘技术可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。近似在演出一部静态的戏剧。插图也十分好,书画让我觉得十分细腻具有收藏价值,书的图形.包括插图和图案.有写实的、有抽象的、还有写意的。具备了科学性、准确性和感人的说明力,使读者能够意会到其中的含义.得到精神感受。封面色设计虽然只是书刊装帧中的一部分但这个书设计彩鲜艳夺目、协调统一,设计出来的画面,显得比较丰富不会给人看一眼就产生没有看头的感觉,只留下不可缺少的书名。说明文(意图、丛书的目录、作者简介)责任编辑、装帧设计者名、书号定价等.有机地融入画面结构中.参与各种排列组合和分割.产生趣味新颖的形式.让人感到言有尽而意无穷。设计以及纸张很干净都是自己的美术设计,体旋律,铺垫节奏起伏,用知性去设置表达全书内涵的各类要素有人说,读者层次与素质不同.阳春白雪,和者盖寡,影响发行量。那么请看,甘肃的读者发行至今,从未设计过这类低俗封面,何以1991年发行150万,1994年上升至390万,雄居全国16开杂志之首余秋雨的文化苦旅、杨东平的城市季风都不是依靠封面的广告诱惑而令洛阳纸贵的。尽管它们的装帧设计并不十分前卫和十分理想,但它们在流俗面前的洁身自好是值得倡导的。还有一本被尘封20多年的学术著作顾准文集,封而极其朴素
评分
☆☆☆☆☆
3、数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;