社交網站的數據挖掘與分析

社交網站的數據挖掘與分析 pdf epub mobi txt 電子書 下載 2025

Matthew A. Russell
圖書標籤:
想要找書就要到 靜思書屋
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
前言1
第1章緒論:Twitter 數據的處理9
Python 開發工具的安裝9
Twitter 數據的收集和處理11
小結24
第2章微格式:語義標記和常識碰撞26
XFN 和朋友27
使用XFN 來探討社交關係29
地理坐標:興趣愛好的共同主綫37
(以健康的名義)對菜譜進行交叉分析41
對餐廳評論的搜集43
小結45
第3章郵箱:雖然老套卻很好用47
mbox:Unix 的入門級郵箱48
mbox+CouchDB= 隨意的Email 分析54
將對話綫程化到一起70
使用SIMILE Timeline 將郵件“事件”可視化79
分析你自己的郵件數據82
小結84
第4章Twitter :朋友、關注者和Setwise 操作85
REST 風格的和OAuth-Cladded API86
乾練而中肯的數據采集器90
友誼圖的構建108
小結116
第5章Twitter:tweet ,所有的tweet ,隻有tweet 118
筆PK 劍:和tweet PK 機槍(?!?)118
對tweet 的分析(每次一個實體)121
並置潛在的社交網站(或#JustinBieber VS #TeaParty)144
對大量tweet 的可視化155
小結163
第6章LinkedIn :為瞭樂趣(和利潤?)將職業網絡聚類164
聚類的動機165
按職位將聯係人聚類167
獲取補充個人信息183
從地理上聚類網絡188
小結192
第7章Google Buzz:TF-IDF 、餘弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 處理數據198
文本挖掘的基本原則201
查找相似文檔208
在二元語法中發Buzz 215
利用Gmail 221
在中斷之前試著創建一個搜索引擎……225
小結226
第8章博客及其他:自然語言處理(等)228
NLP :帕纍托式介紹228
使用NLTK 的典型NLP 管綫231
使用NLTK 檢測博客中的句子234
對文件的總結237
以實體為中心的分析:對數據的深層瞭解245
小結256
第9章Facebook :一體化的奇跡257
利用社交網絡數據258
對Facebook 數據的可視化274
小結294
第10 章語義網:簡短的討論296
發展中的變革296
人不可能隻靠事實生活297
期望301
· · · · · · (收起)

具體描述

Facebook、Twitter和LinkedIn産生瞭大量寶貴的社交數據,但是你怎樣纔能找齣誰通過社交媒介正在進行聯係?他們在討論些什麼?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何迴答這些問題甚至更多的問題。你將學到如何組閤社交網絡數據、分析技術,如何通過可視化幫助你找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用信息。

每個獨立的章節介紹瞭在社交網絡的不同領域挖掘數據的技術,這些領域包括博客和電子郵件。你所需要具備的就是一定的編程經驗和學習基本的Python工具的意願。

•獲得對社交網絡世界的直觀認識

•使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網絡API中的數據

•學習如何應用便捷的Python工具來交叉分析你所收集的數據

•通過XHTML朋友圈探討基於微格式的社交聯係

•應用諸如TF-IDF、餘弦相似性、搭配分析、文檔摘要、派係檢測之類的先進挖掘技術

•通過基於HTML5和JavaScript工具包的網絡技術建立交互式可視化

用戶評價

評分

##瀏覽過,細看瞭部分章節,偏於數據的簡單分析。書齣的不算晚,所以那個時候看還是有點兒收獲。對於如今的研究和應用來說,似乎有點兒過時瞭。當然零基礎的人看看應該還不錯。

評分

##掃一下就好。

評分

##主要是一些API,一般

評分

##我的畢設主題

評分

##技術知識閱讀增加。

評分

##地鐵紙質書刷完。。。。

評分

##技術知識閱讀增加。

評分

##內容不難,直接看英文版吧

評分

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有