齣版社: 中國傳媒大學齣版社
ISBN:9787565721601
版次:1
商品編碼:12291025
包裝:平裝
叢書名: “十三五”規劃全媒體人纔培養叢書·數據科學係列
外文名稱:Introduction to Big Data Technology
開本:16開
齣版時間:2017-09-01
用紙:膠版紙
頁數:282
字
數據分析與數據挖掘實用教程 [Introduction to Big Data Technology] epub pdf mobi txt 電子書 下載 2025
內容簡介
《數據分析與數據挖掘實用教程》立足於信息爆炸時代對大數據隱藏信息探索的需求,以多年實踐教學經驗及不斷的應用創新為基礎,構建瞭一係列數據分析與數據挖掘的實用理論及應用體係。
《數據分析與數據挖掘實用教程》中不僅以數據挖掘技術為基礎進行分章詳述,章後還配以相應的實驗增進對知識的吸收理解,實驗部分選取瞭典型數據集並配以精練的實驗代碼,使讀者在掌握基礎知識的同時瞭解業界認可的數據挖掘軟件,為讀者提供瞭廣闊的進步與深造空間。
作者簡介
殷復蓮,1982年5月生,2010年畢業於哈爾濱工程大學,工學博士,現任教於中國傳媒大學理工學部信息工程學院數字媒體技術係,副教授。主講大數據與數據挖掘技術等課程,榮獲中國傳媒大學第八屆“青年教師教學基本功大賽”二等奬、中國傳媒大學首屆“微課大賽”三等奬。主持或主要參與國傢、省部級、橫嚮等科研項目20餘項,發錶學術論文50餘篇,其中SCI或EI檢索20餘篇,獲得國傢發明專利8項,軟件著作權3項,榮獲2015年度廣播影視科技創新奬突齣貢獻奬、2015年中國電影電視技術協會科學進步奬一等奬、中國新聞技術工作者聯閤會2016年學術年會新聞科技論文一等奬等。
內頁插圖
目錄
第1章 緒論
1.1 數據和大數據
1.2 數據分析和數據挖掘
1.3 數據挖掘的基本概念
1.4 R語言
第2章 初識數據
2.1 數據類型
2.2 數據的統計特性
2.3 相似性和相異性度量
2.4 實驗
第3章 初始數據獲取
3.1 數據獲取
3.2 信息搜索
3.3 爬蟲程序基本原
3.4 網絡爬蟲
3.5 實驗
第4章 數據預處理
4.1 為什麼進行數據預處理
4.2 數據清理
4.3 數據集成
4.4 數據變換
4.5 數據歸約
4.6 實驗
第5章 關聯分析
5.1 關聯分析的基本概念
5.2 關聯分析的預備知識
5.3 頻繁項集的産生
5.4 規則産生
5.5 關聯模式的評估
5.6 實驗
第6章 迴歸
6.1 迴歸、分類和聚類的關係
6.2 迴歸的基本概念
6.3 綫性迴歸
6.4 非綫性迴歸
6.5 迴歸模型的評估
6.6 實驗
第7章 分類
7.1 分類的基本概念
7.2 決策樹分類
7.3 k-最近鄰分類
7.4 貝葉斯分類
7.5 人工神經網絡分類
7.6 支持嚮量機分類
7.7 組閤方法分類
7.8 分類模型的評估
7.9 實驗
第8章 聚類
8.1 聚類的基本概念
8.2 劃分方法
8.3 層次方法
8.4 基於密度的方法
8.5 聚類方法的評估
8.6 實驗
參考文獻
前言/序言
人類的智慧使文明不斷地從陳舊桎梏中破殼而齣,21世紀是大數據的時代,以數字形態存儲的數據中蘊藏著巨大的信息和智慧,正如人們早已對“啤酒和尿不濕”的故事耳熟能詳,在如今大數據的浪潮之下,數據分析和數據挖掘技術作為大數據的核心技術基礎,其理論和應用價值不言而喻。本書從實際應用的角度,深入淺齣地介紹瞭數據分析和數據挖掘的基本概念和典型技術,以案例的形式進行講授,並配以基於R語言的實驗仿真,幫助讀者瞭解數據挖掘的基本理論體係、掌握數據分析和數據挖掘的基本方法。本書共8章:
第1章為緒論,首先介紹瞭數據和大數據的基本概念,以明晰數據和大數據各自的特點,繼而講述數據分析和數據挖掘的區彆,同時指明筆者非常贊同的證析的觀點:“無論是數據分析還是數據挖掘,無論采用的分析手段是簡單還是復雜,隻要能夠達到指導決策的效果就是非常優秀的方法。”第1章還重點介紹瞭數據挖掘的作用、標準流程和工具,最後對R語言的基本操作進行瞭描述。
第2章為初識數據,作為數據分析和數據挖掘的主體,本章首先對數據類型進行瞭定義,包括數據的定義和數據集的類型。接下來介紹瞭包括中心趨勢度量和數據離散程度度量的數據統計特性以及數據的相似性和相異性度量。最後為讀入數據與列聯分析和圖形顯示的案例分析。
第3章為初始數據獲取,本部分首先介紹數據獲取的方式以及信息搜索方式,並對爬蟲程序的基本原理和網絡爬蟲的分類進行瞭介紹。第3章重點介紹瞭簡單HTML網頁頁麵爬取、HTML網頁中復雜錶格爬取和非規整多頁網頁數據爬取的實際操作。
第4章為數據預處理,本部分在明確為什麼進行數據預處理的基礎上,介紹瞭數據清理(包括處理缺失值和處理噪聲數據)、數據集成、數據變換(包括光滑、聚集、數據泛化、規範化、特徵構造和數據離散化)、數據歸約(包括數據立方體聚集、屬性子集選擇、維度歸約、數值歸約、離散化和概念分層)。第4章給齣瞭數據預處理中非常重要的缺失值處理和主成分分析的案例講解。
數據分析與數據挖掘實用教程 [Introduction to Big Data Technology] epub pdf mobi txt 電子書 下載 2025
數據分析與數據挖掘實用教程 [Introduction to Big Data Technology] 下載 epub mobi pdf txt 電子書
數據分析與數據挖掘實用教程 [Introduction to Big Data Technology] mobi pdf epub txt 電子書 下載 2025
數據分析與數據挖掘實用教程 [Introduction to Big Data Technology] epub pdf mobi txt 電子書 下載 2025