編輯推薦
《數據挖掘原理與算法》(第2版)共分8章,各章相對獨立成篇,以利於讀者選擇性學習。在每章後麵都設置專門一節來對本章內容和文獻引用情況進行歸納,它不僅可以幫助讀者對相關內容進行整理,而且也起到對本內容相關文獻的注釋性索引功能。第1章是緒論,係統地介紹瞭數據挖掘産生的商業和技術背景,從不同側麵剖析瞭數據挖掘的概念和應用價值;第2章給齣瞭知識發現的過程分析和應用體係結構設計;第3章對關聯規則挖掘的原理和算法進行全麵闡述;第4章給齣分類的主要理論和算法描述;第5章討論聚類的常用技術和算法;第6章對時問序列分析技術和序列挖掘算法進行論述;第7章係統地介紹瞭Web挖掘的主要研究領域和相關技術及算法;第8章是對空間數據挖掘技術和算法的分析和講述……
內容簡介
本書是一本全麵介紹數據挖掘和知識發現技術的專業書籍,它係統地闡述瞭數據挖掘和知識發現技術的産生、發展、應用以及相關概念、原理和算法,對數據挖掘中的主要技術分支,包括關聯規則、分類、聚類、序列、空間以及web挖掘等進行瞭理淪剖析和算法描述。本書的許多內容是作者們在攻讀博士學位期間的工作總結,一方麵,對於相關概念和技術的闡述盡量先從理論分析人手,在此基礎上進行技術歸納;另一方麵,為瞭保證技術的係統性,所有的挖掘模型和算法描述都在統一的技術歸納框架下進行。同時,為瞭避免抽象算法描述給讀者帶來的理解睏難,本書的所有典型算法都通過具體跟蹤執行實例來進一步說明。
本書共分8章,各章相對獨立成篇,以利於讀者選擇性學習。在每章後麵都設置專門一節來對本章內容和文獻引用情況進行歸納,它不僅可以幫助讀者對相關內容進行整理,而且也起到對本內容相關文獻的注釋性索引功能。第1章是緒論,係統地介紹瞭數據挖掘産生的商業和技術背景,從不同側麵剖析瞭數據挖掘的概念和應用價值;第2章給齣瞭知識發現的過程分析和應用體係結構設計;第3章對關聯規則挖掘的原理和算法進行全麵闡述;第4章給齣分類的主要理論和算法描述;第5章討論聚類的常用技術和算法;第6章對時間序列分析技術和序列挖掘算法進行論述;第7章係統地介紹瞭Web挖掘的主要研究領域和相關技術及算法;第8章是對空間數據挖掘技術和算法的分析和講述。
本書可作為計算機專業研究生或高年級本科生教材,也可以作為從事計算機研究和開發人員的參考資料。作為教材,教師可以根據課時安排進行選擇性教學。為瞭更好地讓教師進行選擇性教學,本書配有專門的教師用書,對內容的重點、難點和課時分配給齣瞭對應的建議,對重要的和難度較大的習題進行瞭分析和解答。對於研究人員,本書是一本高參考價值的專業書籍。對於軟件技術人員,可以把它當作提高用書或參考資料,一些算法可以通過改造用於實際的應用係統中。
目錄
第1章緒論
1.1數據挖掘技術的産生與發展
1.1.1數據挖掘技術的商業需求分析
1.1.2數據挖掘産生的技術背景分析
1.2數據挖掘研究的發展趨勢
1.3數據挖掘概念
1.3.1從商業角度看數據挖掘技術
1.3.2數據挖掘的技術含義
1.3.3數據挖掘研究的理論基礎
1.4數據挖掘技術的分類問題
1.5數據挖掘常用的知識錶示模式與方法
1.5.1廣義知識挖掘
1.5.2關聯知識挖掘
1.5.3類知識挖掘
1.5.4預測型知識挖掘
1.5.5特異型知識挖掘
1.6不同數據存儲形式下的數據挖掘問題
1.6.1事務數據庫中的數據挖掘
1.6.2關係型數據庫中的數據挖掘
1.6.3數據倉庫中的數據挖掘
1.6.4在關係模型基礎上發展的新型數據庫中的數據
挖掘
1.6.5麵嚮應用的新型數據源中的數據挖掘
1.6.6Web數據源中的數據挖掘
1.7粗糙集方法及其在數據挖掘中的應用
1.7.1粗糙集的一些重要概念
1.7.2粗糙集應用舉例
1.7.3粗糙集方法在KDD中的應用範圍
1.8數據挖掘的應用分析
1.8.1數據挖掘與CRM
1.8.2數據挖掘應用的成功案例分析
1.9本章小結和文獻注釋
習題1
第2章知識發現過程與應用結構
2.1知識發現的基本過程
2.1.1數據抽取與集成技術要點
2.1.2數據清洗與預處理技術要點
2.1.3數據的選擇與整理技術要點
2.1.4數據挖掘技術要點
2.1.5模式評估技術要點
2.2數據庫中的知識發現處理過程模型
2.2.1階梯處理過程模型
2.2.2螺鏇處理過程模型
2.2.3以用戶為中心的處理模型
2.2.4聯機KDD模型
2.2.5支持多數據源多知識模式的KDD處理模型
2.3知識發現軟件或工具的發展
2.3.1獨立的知識發現軟件
2.3.2橫嚮的知識發現工具集
2.3.3縱嚮的知識發現解決方案
2.3.4KDD係統介紹
2.4知識發現項目的過程化管理
2.5數據挖掘語言介紹
2.5.1數據挖掘語言的分類
2.5.2數據挖掘查詢語言
2.5.3數據挖掘建模語言
2.5.4通用數據挖掘語言
2.5.5DMQL挖掘查詢語言介紹
2.6本章小結和文獻注釋
習題2
第3章關聯規則挖掘理論和算法
3.1基本概念與解決方法
3.2經典的頻繁項目集生成算法分析
3.2.1項目集空間理論
3.2.2經典的發現頻繁項目集算法
3.2.3關聯規則生成算法
3.3Apriori算法的性能瓶頸問題
3.4Apriori的改進算法
3.4.1基於數據分割(Partition)的方法
3.4.2基於散列(Hash)的方法
3.4.3基於采樣(Sampling)的方法
3.5對項目集空間理論的發展
3.5.1Close算法
3.5.2FP�瞭ree算法
3.6項目集格空間和它的操作
3.7基於項目集操作的關聯規則挖掘算法
3.7.1關聯規則挖掘空間
3.7.2三個實用算子
3.7.3最大頻繁項目集格的生成算法
3.7.4ISS�睤M算法執行示例
3.8改善關聯規則挖掘質量問題
3.8.1用戶主觀層麵
3.8.2係統客觀層麵
3.9約束數據挖掘問題
3.9.1約束在數據挖掘中的作用
3.9.2約束的類型
3.10時態約束關聯規則挖掘
3.11關聯規則挖掘中的一些更深入的問題
3.11.1多層次關聯規則挖掘
3.11.2多維關聯規則挖掘
3.11.3數量關聯規則挖掘
3.12數量關聯規則挖掘方法
3.12.1數量關聯規則挖掘問題
3.12.2數量關聯規則的分類
3.12.3數量關聯規則挖掘的一般步驟
3.12.4數值屬性離散化問題及算法
3.13本章小結和文獻注釋
習題3
第4章分類方法
4.1分類的基本概念與步驟
4.2基於距離的分類算法
4.3決策樹分類方法
4.3.1決策樹基本算法概述
4.3.2ID3算法
4.3.3C4.5算法
4.4貝葉斯分類
4.4.1貝葉斯定理
4.4.2樸素貝葉斯分類
4.4.3EM算法
4.5規則歸納
4.5.1AQ算法
4.5.2CN2 算法
4.5.3FOIL算法
4.6與分類有關的其他問題
4.6.1分類數據預處理
4.6.2分類器性能的錶示與評估
4.7本章小結和文獻注釋
習題4
第5章聚類方法
5.1概述
5.1.1聚類分析在數據挖掘中的應用
5.1.2聚類分析算法的概念與基本分類
5.1.3距離與相似性的度量
5.2劃分聚類方法
5.2.1k�財驕�算法
5.2.2PAM
5.2.3其他方法
5.3層次聚類方法
5.3.1AGNES算法
5.3.2DIANA算法
5.3.3其他聚類方法
5.4密度聚類方法
5.5其他聚類方法
5.5.1STING算法
5.5.2SOM算法
5.5.3COBWEB算法
5.5.4模糊聚類算法FCM
5.6本章小結和文獻注釋
習題5
第6章時間序列和序列模式挖掘
6.1時間序列及其應用
6.2時間序列預測的常用方法
6.2.1確定性時間序列預測方法
6.2.2隨機時間序列預測方法
6.2.3其他方法
6.3基於ARMA模型的序列匹配方法
6.3.1基本概念
6.3.2利用基本概念建立模型
6.3.3構造判彆函數
6.4基於離散傅裏葉變換的時間序列相似性查找
6.4.1完全匹配
6.4.2子序列匹配
6.5基於規範變換的查找方法
6.5.1基本概念
6.5.2查找方法
6.6序列挖掘
6.6.1基本概念
6.6.2數據源的形式
6.6.3序列模式挖掘的一般步驟
6.7AprioriAll 算法
6.8AprioriSome 算法
6.9GSP算法
6.10本章小結和文獻注釋
習題6
第7章Web挖掘技術
7.1Web挖掘的意義
7.2Web挖掘的分類
7.3Web挖掘的含義
7.3.1Web挖掘與信息檢索
7.3.2Web挖掘與信息抽取
7.4Web挖掘的數據來源
7.4.1服務器日誌數據
7.4.2在綫市場數據
7.4.3Web頁麵
7.4.4Web頁麵超鏈接關係
7.4.5其他信息
7.5Web內容挖掘方法
7.5.1爬蟲與Web內容挖掘
7.5.2虛擬的Web視圖
7.5.3個性化與Web內容挖掘
7.5.4對Web頁麵內文本信息的挖掘
7.5.5對Web頁麵內多媒體信息挖掘
7.5.6Web頁麵內容的預處理
7.6Web訪問信息挖掘方法
7.6.1Web訪問信息挖掘的特點
7.6.2Web訪問信息挖掘的意義
7.6.3Web訪問信息挖掘的數據源
7.6.4Web訪問信息挖掘的預處理
7.6.5其他信息的預處理技術
7.6.6在Web訪問挖掘中的常用技術
7.6.7Web訪問信息挖掘的要素構成
7.6.8利用Web訪問信息挖掘實現用戶建模
7.6.9利用Web訪問信息挖掘發現導航模式
7.6.10利用Web訪問信息挖掘改進訪問效率
7.6.11利用Web訪問信息挖掘進行個性化服務
7.6.12利用Web訪問信息挖掘進行商業智能發現
7.6.13利用Web訪問信息挖掘進行用戶移動模式發現
7.6.14利用協作推薦的方法實現實時個性化推薦的例子
7.7Web結構挖掘方法
7.7.1頁麵重要性的評價方法
7.7.2頁麵等級
7.7.3權威頁麵和中心頁麵
7.7.4Web站點結構的預處理
7.8本章小結和文獻注釋
習題7
第8章空間挖掘
8.1引言
8.2空間數據概要
8.2.1空間數據的復雜性特徵
8.2.2空間查詢問題
8.2.3空間數據結構
8.2.4專題地圖
8.3空間數據挖掘基礎
8.4空間統計學
8.5泛化與特化
8.5.1逐步求精
8.5.2泛化
8.5.3最臨近方法
8.5.4統計信息網格方法STING
8.6空間規則
8.7空間分類算法
8.7.1ID3擴展
8.7.2空間決策樹
8.8空間聚類算法
8.8.1基於隨機搜索的聚類方法CLARANS擴展
8.8.2大型空間數據庫基於距離分布的聚類算法DBCLASD
8.8.3BANG
8.8.4小波聚類
8.8.5近似值
8.9空間挖掘的其他問題
8.10空間數據挖掘原型係統介紹
8.11空間數據挖掘的研究現狀
8.12空間數據挖掘的研究與發展方嚮
8.13空間數據挖掘與相關學科的關係
8.13.1空間數據挖掘與空間數據庫
8.13.2空間數據挖掘與空間數據倉庫
8.13.3空間數據挖掘與空間聯機分析處理
8.13.4空間數據挖掘與地理信息係統
8.14數字地球
8.15本章小結和文獻注釋
習題8
參考文獻
前言/序言
重點大學計算機專業係列教材:數據挖掘原理與算法(第2版) epub pdf mobi txt 電子書 下載 2024
重點大學計算機專業係列教材:數據挖掘原理與算法(第2版) 下載 epub mobi pdf txt 電子書
評分
☆☆☆☆☆
第三章開始算法,自己看會有點吃力,但是老師一講就好瞭,主要算法就是那個個,Apriori算法、Rule-generate、K-means、混淆矩陣、ID3、Minkowski、FP-tree等,然後就喜歡上瞭數據挖掘,數據多麼美妙啊,可以從數據中得齣那麼多的信息,一些算法也可以用在自己平時自我管理中,學到瞭東西,不錯!
評分
☆☆☆☆☆
希望你能越做越好,成長有你有我大傢一起來,很好的寶貝。
評分
☆☆☆☆☆
我們的授課老師是作者之一,感覺蠻不錯的
評分
☆☆☆☆☆
打開書本[SM],[ZZ]裝幀精美,紙張很乾淨,文字排版看起來非常舒服非常的驚喜,讓人看得欲罷不能,每每捧起這本書的時候 似乎能夠感覺到作者毫無保留的把作品呈現在我麵前。 [BJTJ]作業深入淺齣的寫作手法能讓本人猶如身臨其境一般,好似一杯美式咖啡,看似快餐,其實值得迴味 無論男女老少,第一印象最重要。”[NRJJ]從你留給彆人的第一印象中,就可以讓彆人看齣你是什麼樣的人。[SZ]所以多讀書可以讓人感覺你知書答禮,頗有風度。 多讀書,可以讓你多增加一些課外知識。培根先生說過:“知識就是力量。”不錯,多讀書,增長瞭課外知識,可以讓你感到渾身充滿瞭一股力量。這種力量可以激勵著你不斷地前進,不斷地成長。從書中,你往往可以發現自己身上的不足之處,使你不斷地改正錯誤,擺正自己前進的方嚮。所以,書也是我們的良師益友。 多讀書,可以讓你變聰明,變得有智慧去戰勝對手。書讓你變得更聰明,你就可以勇敢地麵對睏難。讓你用自己的方法來解決這個問題。這樣,你又嚮你自己的人生道路上邁齣瞭一步。 多讀書,也能使你的心情便得快樂。讀書也是一種休閑,一種娛樂的方式。讀書可以調節身體的血管流動,使你身心健康。[QY]所以在書的海洋裏遨遊也是一種無限快樂的事情。用讀書來為自己放鬆心情也是一種十分明智的。 讀書能陶冶人的情操,給人知識和智慧。所以,我們應該多讀書,為我們以後的人生道路打下好的、紮實的基礎!讀書養性,讀書可以陶冶自己的性情,使自己溫文爾雅,具有書捲氣;讀書破萬捲,下筆如有神,多讀書可以提高寫作能力,寫文章就纔思敏捷;舊書不厭百迴讀,熟讀深思子自知,讀書可以提高理解能力,隻要熟讀深思,你就可以知道其中的道理瞭;讀書可以使自己的知識得到積纍,君子學以聚之。總之,愛好讀書是好事。讓我們都來讀書吧。 其實讀書有很多好處,就等有心人去慢慢發現. 最大的好處是可以讓你有屬於自己的本領靠自己生存。 最後在好評一下京東客服服務態度好,送貨相當快,包裝仔細!這個也值得贊美下 希望京東這樣保持下去,越做越好
評分
☆☆☆☆☆
實用 , 正能量, 沒什麼大問題
評分
☆☆☆☆☆
不好,一拿到書以為是二手的
評分
☆☆☆☆☆
很好
評分
☆☆☆☆☆
實用 , 正能量, 沒什麼大問題
評分
☆☆☆☆☆
內容很好,值得買,值得學習