大數據——高級大數據人纔培養叢書

大數據——高級大數據人纔培養叢書 pdf epub mobi txt 電子書 下載 2025

劉鵬 著
圖書標籤:
  • 大數據
  • 數據分析
  • 數據挖掘
  • Hadoop
  • Spark
  • 機器學習
  • Python
  • 數據倉庫
  • 雲計算
  • 數據可視化
想要找書就要到 靜思書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 電子工業齣版社
ISBN:9787121304309
版次:1
商品編碼:12111724
包裝:平裝
叢書名: 高級大數據人纔培養叢書
開本:16開
齣版時間:2017-01-01
用紙:膠版紙
頁數:344
字數:360000
正文語種:中文

具體描述

産品特色


內容簡介

  本書是國內絕大多數高校采用的知名教材《雲計算》(1-3版)的姊妹篇,是中國大數據專傢委員會劉鵬教授聯閤國內多位專傢曆時兩年的心血之作。大數據領域一直缺乏一本**教材,希望本書能夠填補空白。本書係統地介紹瞭大數據的理論知識和實戰應用,包括大數據采集與預處理、數據挖掘算法和工具和大數據可視化等,並深度剖析瞭大數據在互聯網、商業和典型行業的應用。劉鵬教授創辦的網站中國大數據(thebigdata.cn)、中國雲計算(chinacloud.cn)和微信公眾號劉鵬看未來(lpoutlook)將免費提供本書配套PPT和其他資料。本書配套的大數據實驗體係已經在鄭州大學等高校成功應用。

作者簡介

  劉鵬,清華大學博士,解放軍理工大學教授、學科帶頭人,中國雲計算專傢委員會委員。主要研究方嚮為信息網格和雲計算,完成科研課題18項,發錶論文70餘篇,獲部級科技進步奬6項。曾奪得國際計算機排序比賽冠軍,並二次奪得全國高校科技比賽*高奬,獲“全軍十大學習成纔標兵”、“南京十大傑齣青年”和“清華大學學術新秀”等稱號。2002年首倡的“網格計算池”和2003年研發的“反垃圾郵件網格”分彆為雲計算和雲安全的前身。創辦瞭知名的中國網格和中國雲計算網站。

目錄

第1章 大數據概念與應用
1.1 大數據之“大”
1.2 大數據的來源
1.3 大數據的技術支撐
1.4 大數據應用場景
1.5 如何開展大數據研發
習題
參考文獻
第2章 數據采集與預處理
2.1 大數據采集架構
2.2 數據預處理原理
2.3 數據倉庫與ETL工具
習題
參考文獻
第3章 數據挖掘算法
3.1 數據挖掘概述
3.2 分類
3.3 聚類
3.4 關聯規則
3.5 預測模型
3.6 數據挖掘算法綜閤應用
習題
參考文獻
第4章 大數據挖掘工具
4.1 Mahout
4.2 Spark MLlib
4.3 其他數據挖掘工具
習題
參考文獻
第5章 R語言
5.1 R語言簡介
5.2 R與數據挖掘
5.3 SparkR
習題
參考文獻
第6章 大數據可視化
6.1 數據可視化基礎
6.2 大數據可視化方法
6.3 大數據可視化軟件與工具
習題
參考文獻
第7章 互聯網大數據處理
7.1 互聯網信息抓取
7.2 文本分詞
7.3 倒排索引
7.4 網頁排序算法
7.5 曆史信息檢索
習題
參考文獻
第8章 大數據商業應用
8.1 用戶畫像與精準營銷
8.2 廣告推薦
8.3 互聯網金融
習題
參考文獻
第9章 行業大數據
9.1 地震大數據
9.2 交通大數據
9.3 環境大數據
9.4 警務大數據
習題
參考文獻
附錄:大數據實驗一體機

前言/序言

  在未來5~10年,我國大數據市場規模年均增速將超過30%。未來5年,國內大數據人纔缺口將突破150萬。在BAT發布的招聘職位中,目前大數據崗位占比已經超過60%。現在業界有一種觀點:即使把全國所有計算機專業都做成大數據專業,仍然無法滿足國內對大數據人纔的需求量。
  在快速膨脹的需求與國傢扶植政策的推動下,全國高校、高職、高專院校紛紛啓動大數據人纔培養計劃。然而,大數據專業建設卻麵臨重重睏難。首先,大數據是個新生事物,懂大數據的老師少之又少,院校缺“人”;其次,尚未形成完善的大數據人纔培養和課程體係,院校缺“機製”;再次,大數據實驗需要為每位學生提供集群計算機,院校缺“機器”;最後,院校不擁有海量數據,開展大數據教學科研工作缺“原材料”。
  其實,在2000年網格計算興起時和2008年雲計算興起時,我國科技工作者都曾遇到過類似的挑戰問題,我有幸參與瞭這些問題的解決過程:
  為瞭解決網格計算挑戰問題,我在清華大學讀博期間,於2001年創辦瞭中國網格信息中轉站(chinagrid.net)網站,每天花好幾個小時收集和分享有價值的資料給學術界。於2002年與人閤作齣版瞭《網格計算》教材。並多次籌辦和主持全國性的網格計算學術會議。
  為瞭解決雲計算挑戰問題,我於2008年創辦瞭中國雲計算(chinacloud.cn)網站,於2010年齣版瞭《雲計算(第一版)》、2011年齣版瞭《雲計算(第二版)》、2015年齣版瞭《雲計算(第三版)》,每一版都花費大量成本製作並免費分享對應的幾十個教學PPT。這些PPT的下載總量達到瞭幾百萬次之多。早在2010年,我就在南京組織瞭全國高校雲計算師資培訓班,培養瞭國內第一批雲計算老師。並通過與華為、中興、360等知名企業閤作,輸齣雲計算技術,培養雲計算研發人纔。為社區做貢獻,收獲是沉甸甸的:我獲得瞭大傢的好評與認可,擔任瞭一些全國性專傢委員會的專傢,《雲計算》教材成瞭國內高校的首選教材,中國雲計算網站成瞭國內排名第一的雲計算網站。
  近幾年,我用類似的辦法來解決我們所麵臨的大數據挑戰問題。為瞭解決大數據技術資料缺乏和存在交流障礙的問題,我於2013年創辦瞭中國大數據(thebigdata.cn)網站,投入大量的人力每天維護,該網站已經在各大搜索引擎排名“大數據”關鍵詞第一名;為瞭解決大數據師資匱乏的問題,我麵嚮全國院校,陸續舉辦多期大數據教師培訓班。最近在南京舉辦的全國高校/高職/中職大數據免費培訓班,報名的老師已有400多位;為瞭解決缺乏權威大數據教材的問題,我所負責的南京大數據研究院,聯閤金陵科技學院、河南大學、南陽理工學院、南陽理工學院、雲創大數據、許昌學院、安徽師範大學、纔雲科技、中國地震局、南京公安研究院等多傢單位,曆時兩年,編著瞭《大數據》教材和《大數據庫》教材。並計劃為高職和中職院校專門編寫大數據專業係列教材。我們將在中國大數據(thebigdata.cn)、中國雲計算(chinacloud.cn)和劉鵬看未來(lpoutlook)微信公眾號等陸續免費提供配套PPT和其他資料;為瞭解決大數據實驗難以開展的問題,我帶領雲創大數據(www.cstor.cn)的科研人員,研發成功BDRack大數據實驗一體機,它打破虛擬化技術的性能瓶頸,可以為每一位參加實驗的人員虛擬齣Hadoop集群、Spark集群、 MongoDB集群、Storm集群等,自帶實驗所需數據,並準備瞭詳細的實驗手冊、PPT和視頻,可以開展大數據管理、大數據挖掘等各類實驗,並可進行精確營銷、信用分析等多種實戰演練。目前該平颱已經在鄭州大學等高校成功應用。我們還開放瞭免費的物聯網大數據托管平颱——萬物雲(wanwuyun.com)和環境大數據免費分享平颱——環境雲(envicloud.cn)
  在此,特彆感謝我的碩士導師謝希仁教授和博士導師李三立院士。謝希仁教授齣版的《計算機網絡》已經更新到第6版,與時俱進且日臻完美,時時提醒學生要以這樣的標準來寫書。李三立院士是留蘇博士,為我國計算機事業做齣瞭傑齣貢獻,曾任國傢攀登計劃項目首席科學傢。他的嚴謹治學帶齣瞭一大批傑齣的學生。
  本書是集體智慧的結晶,在此謹嚮付齣辛勤勞動的各位作者緻敬!書中難免會有不當之處,務必讀者不吝賜教。我的郵箱:gloud@126.com,微信公眾號:劉鵬看未來(lpoutlook)。
  劉鵬 教授
  於南京大數據研究院
  2016年12月24日


大數據——高級大數據人纔培養叢書 大數據時代的駕馭者,洞察數據洪流,驅動未來變革 我們正身處一個史無前例的數據時代。每一次點擊、每一次交易、每一次交互,都在産生海量的數據。這些數據不再是冰冷孤立的數字,而是蘊藏著無窮價值的寶藏,是驅動商業決策、科學研究、社會進步的強大引擎。然而,如何從這汪洋大海般的數據中提取精華,將其轉化為可執行的洞察,並最終轉化為實際的價值,已成為當前亟需解決的關鍵問題。 《大數據——高級大數據人纔培養叢書》應運而生,它並非一本簡單的技術手冊,而是一套係統性的、麵嚮未來大數據領域專業人纔的培養方案。本叢書旨在為那些渴望在這個飛速發展領域脫穎而齣,成為數據科學的引領者、大數據應用的創新者、以及數據驅動戰略的製定者的人們,提供堅實的基礎、前沿的視野和實操的指導。 為何需要高級大數據人纔? 大數據技術的發展已經進入深水區。最初的數據采集、存儲、清洗階段已逐漸成熟,但真正的挑戰在於如何進行更深層次的分析、更精準的模型構建、更智能的應用落地。這需要掌握復雜算法、精通機器學習、熟悉深度學習、理解分布式係統、具備強大的數據建模能力、以及深刻的業務洞察力。更重要的是,高級大數據人纔需要具備將技術能力與業務場景相結閤的橋梁作用,能夠理解業務痛點,設計齣能夠解決實際問題的技術方案,並能清晰地嚮非技術人員闡述其價值。 叢書內容概覽(非完整章節列錶,而是核心能力與主題的展現): 本叢書將深度剖析大數據領域的關鍵技術和核心能力,但絕不僅僅局限於理論。每一部分都將圍繞“培養能夠解決實際問題的高級人纔”這一目標展開,注重理論與實踐的結閤,以期幫助讀者構建紮實的知識體係,並鍛造齣色的實戰能力。 一、 深化數據思維與統計基石: 在進入復雜算法和模型之前,紮實的統計學和概率論基礎是必經之路。本叢書將迴顧並深化那些對於理解數據分布、檢驗假設、評估模型性能至關重要的統計概念。您將學習到如何從數據的錶象下挖掘其內在的統計規律,理解數據的偏差與方差,以及如何進行科學的假設檢驗。這將幫助您建立起嚴謹的數據分析思維,避免被錶麵現象所誤導,為後續更高級的建模打下堅實基礎。 二、 掌握核心數據處理與挖掘技術: 海量數據的處理能力是大數據時代的基礎。本叢書將深入講解如何在分布式環境下高效地處理和轉換數據。您將不僅僅學習到SQL的進階應用,更會接觸到Spark、Hadoop等主流大數據處理框架的原理與實踐。內容將涵蓋數據清洗、特徵工程、數據集成等關鍵環節,指導您如何從原始數據中提取齣有價值的特徵,為建模做好準備。同時,我們將深入講解各種數據挖掘算法,包括但不限於聚類、分類、關聯規則挖掘等,並分析它們在不同場景下的應用。 三、 深入探索機器學習與深度學習模型: 機器學習是大數據分析的核心驅動力。本叢書將從基礎的綫性模型、邏輯迴歸開始,逐步深入到決策樹、隨機森林、支持嚮量機等經典算法。更重要的是,我們將花費大量篇幅講解深度學習的原理和應用。您將學習到神經網絡的基本構建,捲積神經網絡(CNN)在圖像識彆領域的突破,循環神經網絡(RNN)和長短期記憶網絡(LSTM)在序列數據處理中的優勢,以及Transformer模型在自然語言處理領域的革命性影響。我們將探討不同模型的適用場景、優缺點,以及如何進行模型選擇、調優和評估。 四、 構建高性能的預測與推薦係統: 如何利用曆史數據預測未來趨勢,如何為用戶提供個性化的推薦,是大數據技術在商業領域最直接的應用體現。本叢書將詳細闡述構建預測模型的完整流程,包括時間序列分析、迴歸分析的進階應用,以及如何利用機器學習模型進行準確的預測。在推薦係統方麵,我們將深入講解協同過濾、基於內容的推薦、混閤推薦等主流算法,並探討如何處理冷啓動問題、冷門商品問題,以及如何平衡探索與利用,設計齣能夠提升用戶體驗和商業價值的推薦策略。 五、 實踐先進的自然語言處理(NLP)與計算機視覺(CV)技術: 文本和圖像是人類信息傳遞和感知世界的主要方式,也是大數據的重要組成部分。本叢書將帶領您走進自然語言處理的殿堂,從詞嚮量、文本錶示技術齣發,學習如何進行情感分析、主題建模、機器翻譯、問答係統等。在計算機視覺領域,您將學習到圖像處理的基礎技術,深入理解捲積神經網絡的強大能力,並掌握圖像識彆、目標檢測、圖像分割等核心技術。這些技術的掌握將使您能夠從非結構化數據中提取有價值的信息,賦能更多創新應用。 六、 掌握分布式係統與雲原生大數據平颱: 隨著數據量的爆炸式增長,單機處理能力已無法滿足需求。本叢書將深入講解分布式係統的原理,特彆是Hadoop生態係統(HDFS, MapReduce, Hive, HBase等)和Spark等框架的工作機製。同時,我們將關注當前主流的雲原生大數據平颱,如AWS、Azure、GCP等提供的各項大數據服務,以及Kubernetes在容器化部署和管理大數據應用中的作用。您將學習到如何設計、部署和管理可擴展、高可用的分布式大數據解決方案。 七、 培養數據治理、安全與倫理意識: 大數據在帶來巨大價值的同時,也伴隨著數據治理、安全和倫理等方麵的挑戰。本叢書將重點強調這些關鍵議題。您將學習到數據質量管理、元數據管理、數據標準化的重要性,以及如何建立完善的數據治理體係。在數據安全方麵,我們將探討數據加密、訪問控製、隱私保護等技術和策略。更重要的是,本叢書將引導您思考大數據應用中的倫理問題,如算法的公平性、偏見以及對社會可能産生的影響,培養負責任的大數據應用者的職業操守。 八、 商業智能(BI)與數據可視化: 再復雜的分析,最終也需要以清晰易懂的方式呈現給決策者。本叢書將講解如何運用商業智能工具,構建數據儀錶闆(Dashboard),將復雜的分析結果轉化為直觀的圖錶和報告。您將學習到優秀的數據可視化原則,掌握Tableau、Power BI等工具的使用技巧,以及如何通過有效的可視化溝通,驅動業務決策和變革。 叢書特色: 循序漸進,層層深入: 從基礎概念到前沿技術,結構清晰,邏輯嚴謹,適閤不同基礎的讀者。 理論與實踐並重: 每一部分都將結閤實際案例和代碼示例,幫助讀者將理論知識轉化為實踐能力。 前沿技術與未來趨勢: 緊跟大數據領域的最新發展,涵蓋機器學習、深度學習、NLP、CV以及雲原生技術等。 培養解決實際問題的能力: 強調數據分析的思維方式和解決問題的能力,而非僅僅羅列技術細節。 注重綜閤素養: 除瞭技術能力,還關注數據治理、安全、倫理等軟實力。 目標讀者: 希望係統學習大數據技術,進入該領域工作的在校學生或轉行者。 已在大數據領域工作,尋求技術突破和能力提升的工程師、分析師。 渴望掌握數據驅動決策的業務領導者和産品經理。 對數據科學充滿熱情,希望成為行業內頂尖人纔的探索者。 《大數據——高級大數據人纔培養叢書》不僅僅是知識的集閤,更是您在大數據時代乘風破浪的利器,是您成為數據時代駕馭者、洞察數據洪流、驅動未來變革的有力夥伴。它將幫助您構建起堅不可摧的技術壁壘,培養齣敏銳的數據洞察力,並最終在蓬勃發展的大數據浪潮中,找到屬於自己的廣闊天地。

用戶評價

評分

最近有幸拜讀瞭《大數據——高級大數據人纔培養叢書》,這本書給我帶來的震撼和啓迪是難以言喻的。從封麵設計上,就透露齣一種專業、嚴謹的氣質,讓人對接下來的內容充滿期待。翻開目錄,我被書中涵蓋的廣度所驚艷,從基礎概念的梳理,到核心技術的深入剖析,再到實際應用場景的案例分析,幾乎囊括瞭大數據領域所有重要的知識點。作者在組織篇章時,邏輯性非常強,循序漸進,讓初學者能夠快速入門,也能讓有一定基礎的讀者鞏固和深化理解。書中對 Hadoop、Spark 等主流框架的講解尤為細緻,不僅介紹瞭其原理,還提供瞭大量的代碼示例和操作指導,這對於想要動手實踐的讀者來說,無疑是寶貴的資源。我特彆喜歡其中關於數據治理和數據安全部分的論述,這往往是很多技術書籍容易忽略的方麵,但在這裏卻得到瞭充分的重視。整體而言,這本書為我打開瞭一扇通往大數據世界的大門,讓我對其有瞭更全麵、更深入的認識,為我未來的學習和工作指明瞭方嚮。

評分

我之前一直對大數據技術感到有些茫然,感覺知識點零散,不成體係。直到我看到瞭《大數據——高級大數據人纔培養叢書》,纔真正感受到瞭一種“撥雲見日”的清晰感。這本書的結構設計非常精妙,從最基礎的數據采集、存儲,到中間的數據處理、分析,再到最後的數據可視化和應用,環環相扣,邏輯嚴謹。作者在講述每個技術點時,都力求全麵,既有理論的高度,也有實踐的深度。讓我特彆驚喜的是,書中對雲計算平颱在大數據應用中的角色進行瞭詳細的闡述,比如 AWS、Azure、GCP 等,這對於我們這些需要在雲端部署和運維大數據係統的工程師來說,非常有指導意義。而且,書中還探討瞭大數據倫理和隱私保護等重要議題,這反映瞭作者對行業發展的深刻洞察和責任感。這本書讓我對大數據有瞭更宏觀的認識,也為我係統性地學習和掌握大數據技術提供瞭堅實的基礎。

評分

這本書的價值,我認為更多體現在其“高級”二字上。它並非泛泛而談,而是聚焦於培養真正的大數據人纔。書中對於算法和模型構建的部分,分析得非常透徹,很多地方都引用瞭最新的研究成果和業界最佳實踐。我尤其贊賞其中關於機器學習和深度學習在實際大數據應用中的案例分析,這些案例都非常貼閤實際業務需求,能夠幫助讀者理解如何將理論知識轉化為解決實際問題的能力。例如,書中對於推薦係統、欺騙檢測等場景的講解,不僅提供瞭技術方案,還詳細闡述瞭背後的業務邏輯和數據驅動的決策過程。對於我們這些在大數據領域摸爬滾打多年的從業者來說,這樣的深度解析非常有價值,能夠幫助我們跳齣技術的局限,從更高的維度去思考問題。作者在書中的語言風格也比較樸實,但字裏行間又透露齣深厚的功底,很少有空洞的理論,更多的是紮實的乾貨。這本書絕對是大數據從業者提升專業技能、拓展技術視野的必備參考書。

評分

這本書的齣版,對於正在大數據領域尋求職業發展的人來說,無疑是一份寶貴的禮物。它不僅僅是一本技術手冊,更是一份培養思維的指南。作者在書中反復強調瞭“數據思維”的重要性,並結閤多個真實的行業案例,闡述瞭如何通過數據來驅動業務決策和創新。我個人尤其欣賞書中對大數據分析方法論的係統介紹,從數據清洗、特徵工程,到模型選擇、評估,每一步都進行瞭細緻的講解和分析。這讓我在進行數據分析項目時,能夠更加有條理,避免走彎路。而且,書中還對大數據人纔在不同崗位上的能力要求進行瞭深入分析,為我規劃職業發展路徑提供瞭重要的參考。這本書的語言風格非常接地氣,沒有過多的華麗辭藻,卻充滿瞭真誠和實用性,讀起來讓人倍感親切。我強烈推薦這本書給所有對大數據感興趣,或者希望在大數據領域有所建樹的朋友們。

評分

《大數據——高級大數據人纔培養叢書》簡直就是一本為大數據工程師量身打造的“武功秘籍”。它不像某些教材那樣枯燥乏味,而是充滿瞭實戰的智慧。我印象最深刻的是書中關於分布式計算和數據存儲技術的講解,作者用非常生動的比喻和圖示,將復雜的概念變得通俗易懂。比如,對於 MapReduce 的解釋,我以前總覺得難以理解,但看瞭這本書的講解後,豁然開朗。而且,書中提供的不僅僅是理論,還有大量的實操練習和挑戰,讓我有機會親手去構建和優化大數據係統。這對於提升動手能力至關重要。此外,書中還提到瞭很多關於大數據生態係統中各個組件的協同工作原理,比如 Zookeeper、Kafka、Flume 等,這些都是在實際工作中必不可少的基礎設施。閱讀這本書的過程,就像是在跟一位經驗豐富的老前輩學習,他不僅教你“是什麼”,更教你“怎麼做”,以及“為什麼這麼做”。

評分

好書,雲計算學習必備!

評分

正版 買完就漲瞭十幾塊?

評分

當然,各方麵都好,唯獨把書給我弄髒瞭這一點,讓人有些生氣!

評分

正版書籍,質量值得信賴。

評分

初學者必備,簡單實用,大量事例說明。

評分

感謝,速度很快,書的質量也很好

評分

速度快,當天訂購收到

評分

寫的全麵,入門很有用。本來就沒標準,各傢看什麼不同很好

評分

一直想買一本來看看

相關圖書

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有