
最 低 价:¥29.25
| 数据挖掘是一个新兴的多学科交叉领域,它基于人工智能、机器学习、模式识别、统计学、数据库、可视化等技术,能够从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,目前已广泛应用于科学、工程、商业、医学等领域。 本书旨在向读者介绍数据挖掘方法和算法,使读者能够应用这些方法解决现实世界中的问题。本书精心选择了在数据挖掘领域中广泛使用的大部分方法,并辅以简单的例子,因而是学习数据挖掘的理想教材。 本书特色 ?涵盖数据挖掘中数据的预处理、分类、预测、聚类、关联、支持向量机、多维数据可视化等内容,以及用于这些数据挖掘问题的典型算法。 ?许多算法都通过例子解释,并辅以大量图示,有利于初学者理解。 ?介绍如何使用开源软件包Weka和ExcelMiner、GCLUTO工具进行数据挖掘。在学习理论的同时,配合使用这些数据挖掘软件进行实验有利于读者加深对数据挖掘理论和算法的理解。 ?介绍了一些源自UCI机器学习库的数据集,它们已经成为研究算法性能的基准数据集。 附带光盘包括 大量数据集。 使用Weka和ExcelMiner进行数据挖掘的演示。 |
| 出版者的话 译者序 前言 第1章 数据挖掘 1.1 引言 1.1.1 数据挖掘与知识发现 1.1.2 数据挖掘与数据分析 1.1.3 数据挖掘与统计学 1.1.4 数据挖掘与机器学习 1.2 数据挖掘——成功的例子 1.3 数据挖掘研究发展的主要原因 1.4 当前研究成果 1.5 图形模型和层次概率表示 1.6 新的应用 1.7 影响数据挖掘的趋势 1.8 研究挑战 1.9 实验平台和基础设施 参考文献 第2章 从商务角度看数据挖掘 2.1 引言 2.2 从数据挖掘工具到解决方案 2.3 数据挖掘系统的演变 2.4 知识发现过程 2.5 数据挖掘支撑技术概述 2.5.1 数据挖掘:验证与发现 2.5.2 决策支持系统 2.5.3 OLAP 2.5.4 桌面DSS 2.5.5 数据仓库 2.5.6 数据挖掘过程 2.6 数据挖掘技术 参考文献 第3章 数据挖掘算法的数据类型、输入和输出 3.1 引言 3.2 实例和特征 3.3 特征(数据)的不同类型 3.4 概念学习与概念描述 3.5 数据挖掘的输出——知识表示 3.5.1 分类学习算法的知识输出 3.5.2 聚类学习算法的输出 3.5.3 关联规则的输出 3.5.4 用于数值预测的树的输出 3.5.5 基于实例的学习和知识表示 参考文献 第4章 决策树——分类和回归树 4.1 引言 4.2 构造分类树 4.2.1 用于标称属性的ID3算法 4.2.2 信息论和信息熵 4.2.3 构造树 4.2.4 高分支属性 4.2.5 从ID3到C4.5 4.2.6 形象化地理解ID3和C4.5算法 4.3 CHAID 4.3.1 CHAID的数学工具 4.3.2 CHAID变量的类型 4.3.3 CHAID算法 4.3.4 CHAID算法描述 4.3.5 将CHAID用于气象数据 4.3.6 单调变量的预测子级别合并 4.4 CART(分类和回归树) …… 第5章 数据挖掘的预处理和后处理 第6章 数据集 第7章 关联规则挖掘 第8章 用开源和商业软件进行机器学习 第9章 分类和回归算法 第10章 支持向量机 第11章 聚类分析 第12章 多维数据可视化 参考文献 附录A SVM公式:安全可分的线性分类器 附录B 图划分的矩阵形式 |
商品评论(0条)