数据科学方面的书籍玲琅满目,大多数都在介绍如何使用各种全新的工具和技术,鲜有讨论数据科学中细致入微的解决问题的过程。本书作者结合自己的亲身经历,讲述了数据科学中从项目准备、解决方案构建到项目交付的全部过程,并以案例的形势深入浅出地讲解在开展数据科学项目的过程中可能遇到的各种问题,可以帮助你按图索骥地学会数据科学。本书不会过多地纠结于细节的技术,而是更注重思维方式的梳理,以及对数据科学的深刻洞察,帮助你明晰要解决的问题,并找到实际解决方案。
如果你想了解数据科学,走进数据科学,甚至成为该领域的王者,那么本书将是你的完美参考。
作者布瑞恩·戈德西结合自己的亲身经历,讲述了数据科学从项目准备、解决方案构建到项目交付的全部过程,并以案例的形式深入浅出地讲解了在开展数据科学项目的过程中可能遇到的各种问题,循序渐进地教你解决现实世界中以数据为中心的问题。在阅读本书时,你会发现或掌握有价值的统计技术,并探索强大的数据科学软件。更重要的是,你将使用结构化的数据过程来集成这些知识。完成了这个过程,你便为终身学习和实践数据科学奠定了坚实的基础。
全书分为三部分,分别代表数据科学过程的三个主要阶段。第一部分讨论准备工作,强调在项目开始时投入时间和精力去收集信息以避免后期的头疼问题。第二部分讨论把计划付诸于行动,利用从第一部分了解到的知识,以及统计学和软件可以提供的所有工具,为客户构建产品。第三部分讨论项目的完成,包括交付、反馈、修改、支持及干净收尾。
作者简介
布瑞恩·戈德西(Brian Godsey) 在加入以数据为中心的初创企业之前,布瑞恩·戈德西博士在学术界和政府机构有近十年的工作经验,曾经把数学和统计学应用到诸如生物信息、金融和国防等领域。他还在巴尔的摩领导过当地的一家数据创业公司,并伴随着企业从种子基金成长到A轮融资,亲眼目睹产品从原型发展到生产版本,此前他曾在Unoceros和Panopticon实验室两家初创公司任职,帮助它们推出了以数据为中心的产品。
译者简介
陈斌(Chuck Chen) 现任易宝CTO。1989年获得吉林大学硕士学位;1992年任新加坡航空公司高级系统分析师;1999年投身于硅谷互联网技术发展浪潮,曾任日立美国系统集成总监,Abacus首席架构师和Nokia美国首席工程师;2008年任eBay资深架构师,负责移动应用的架构设计。丰富的海外经历,多年的架构经验,深谙移动互联网对传统行业的影响;2014年再次投身易宝,提出大、平、移、商的战略方针,全力推动移动互联网技术,引导行业变革。
目 录
本书赞誉
中文版序一
中文版序二
译者序
前言
致谢
关于本书
关于原书封面插图
第一部分 准备和收集数据与知识
第1章 数据科学的逻辑 …… 2
1.1 数据科学与本书 …… 4
1.2 意识的可贵 …… 7
1.3 研发人员与数据科学家 …… 9
1.4 需要成为软件研发者吗 …… 12
1.5 需要明白统计学吗 …… 13
1.6 优先级:知识、技术、观点 …… 14
1.7 最佳实践 …… 17
1.8 阅读本书:我怎么讨论概念 …… 23
小结 …… 24
第2章 通过好的提问设置目标 …… 26
2.1聆听客户 …… 27
2.2提出关于数据的好问题 …… 37
2.3用数据回答问题 …… 42
2.4设定目标 …… 48
2.5计划要有弹性 …… 50
练习 …… 51
小结 …… 51
第3章 周围的数据:虚拟的荒野 …… 52
3.1数据作为研究对象 …… 52
3.2数据可能存在的地方,以及如何与之交互 …… 62
3.3数据侦察 …… 80
3.4案例:microRNA与基因表达 …… 89
练习 …… 94
小结 …… 95
第4章 数据整理:从捕捉到驯化 …… 96
4.1案例研究:最佳田径表演 …… 97
4.2准备整理数据 …… 101
4.3技巧与工具 …… 109
4.4常见的陷阱 …… 112
练习 …… 119
小结 …… 119
第5章 数据评估:动手检查 …… 120
5.1案例:安然的电子邮件数据 …… 121
5.2描述性统计 …… 123
5.3检查数据的假设 …… 130
5.4寻找特定的实体 …… 134
5.5大概的统计分析 …… 140
练习 …… 147
小结 …… 147
第二部分 构建软件和统计产品
第6章 制订计划 …… 150
6.1学到了什么 …… 152
6.2重新考虑期望和目标 …… 158
6.3规划 …… 164
6.4沟通新目标 …… 175
练习 …… 176
小结 …… 177
第7章 统计建模:概念与基础 …… 178
7.1如何看待统计 …… 179
7.2统计学:与数据科学相关的领域 …… 180
7.3数学 …… 184
7.4统计模型与推理 …… 194
7.5其他的统计方法 …… 218
练习 …… 227
小结 …… 227
第8章 软件:统计学在行动 …… 229
8.1电子表格和用户图形界面应用 …… 230
8.2编程 …… 239
8.3选择统计软件工具 …… 264
8.4把统计转换成软件 …… 271
练习 …… 277
小结 …… 278
第9章 辅助软件:更大、更快、更高效 …… 279
9.1数据库 …… 280
9.2高性能计算 …… 287
9.3云服务 …… 290
9.4大数据技术 …… 293
9.5XX即服务 …… 297
练习 …… 298
小结 …… 298
第10章 执行计划:汇总 …… 299
10.1执行计划的诀窍 …… 300
10.2修改计划 …… 308
10.3结果:知道什么时候足够好 …… 310
10.4案例研究:基因活性测定协议 …… 315
练习 …… 328
小结 …… 329
第三部分 整理产品结束项目
第11章 交付产品 …… 332
11.1了解客户 …… 333
11.2交付形式 …… 335
11.3内容 …… 345
11.4案例:分析电子游戏 …… 351
练习 …… 353
小结 …… 353
第12章 交付后:问题与修改 …… 354
12.1产品及其使用问题 …… 354
12.2反馈 …… 364
12.3产品修改 …… 370
练习 …… 377
小结 …… 378
第13章 结束:项目善后 …… 379
13.1项目善后 …… 380
13.2从项目中学习 …… 392
13.3展望未来 …… 396
练习 …… 398
小结 …… 399
练习:案例与答案 …… 400
这本书我真是太喜欢了!拿到手的时候就被它的封面设计吸引了,那种沉稳又不失力量感的设计,让人一眼就觉得这是一本有深度、有分量的书。翻开第一页,我就被作者的文笔深深吸引了。语言流畅、生动,而且非常善于用一些贴切的比喻来解释那些听起来可能有些抽象的概念。比如,在讲到数据采集和清洗的时候,作者竟然能把枯燥的流程描述得像一场精密的科学实验,让我这个对技术不太懂的人也能津津有味地读下去。而且,作者在书中引用的案例都非常经典,很多都是我耳熟能详的,但是通过这本书的解读,我才恍然大悟,原来这些成功的背后,大数据发挥了如此关键的作用。它让我看到了一个全新的视角,去重新审视我所熟悉的世界。更重要的是,这本书的结构安排也十分合理,从基础概念的铺垫,到实际应用的展示,再到未来趋势的展望,层层递进,逻辑清晰,读起来完全不会感到迷茫。尤其是关于数据分析方法的介绍,虽然我还没能完全掌握,但已经为我打开了一扇新的大门,让我对接下来的学习充满了期待。总而言之,这是一本能够引发思考,并且兼具知识性和趣味性的好书,强烈推荐给所有对数据和未来感兴趣的朋友!
评分说实话,这本书的吸引力是循序渐进的,一开始我可能觉得内容有些宏大,不容易一下子抓住重点。但随着阅读的深入,我越来越被书中精辟的见解和深刻的逻辑所折服。作者并没有生硬地灌输概念,而是通过层层递进的论述,引导读者一步步地理解大数据的核心价值。他将抽象的理论与生动的实践案例巧妙地结合,使得那些原本可能令人望而却步的技术概念,变得触手可及。我尤其喜欢他对于“数据驱动决策”的阐述,这种理念在我日常工作中一直有所耳闻,但在这本书中,我才真正理解了它的精髓和落地方法。作者用很多具体的例子,展示了如何通过数据分析来优化流程、提升效率、发现新的商机。而且,书中对于“数据可视化”的强调,也让我茅塞顿开。原来,将复杂的数据以直观易懂的方式呈现出来,是如此重要。这不仅有助于决策者快速理解信息,更能激发团队的共鸣和协作。这本书给了我很多启发,让我开始审视自己的工作方式,思考如何更好地利用数据来推动个人和团队的成长。它就像一位经验丰富的导师,用最清晰的语言,指引我走向数据赋能的未来。
评分这本书带给我的冲击力是巨大的,完全颠覆了我之前对“数据”这个词的认知。我一直以为大数据只是技术宅们的玩物,是冷冰冰的数字和算法。但这本书让我看到了数据的生命力,看到了它如何能够驱动创新,改变商业模式,甚至影响我们的日常生活。作者在书中探讨的“数据即未来”这个宏大的命题,被他拆解得丝丝入扣,让我这个普通读者也能理解其中的逻辑和意义。尤其让我印象深刻的是关于“数据思维”的培养。作者反复强调,掌握大数据技术固然重要,但更重要的是建立起一种以数据为导向的思考方式。这种思维模式,不仅仅适用于商业决策,更能应用到我们生活的方方面面,帮助我们做出更明智的选择。书中的一些理论阐述,虽然涉及一些前沿的技术概念,但作者都用非常通俗易懂的语言进行了解释,并配以大量的图表和案例,使得整个阅读过程充满启发性。读完这本书,我感觉自己仿佛置身于一个数据驱动的未来世界,看到了无限的可能性。它不仅是一本关于大数据的书,更是一本关于如何拥抱未来、如何在这个快速变化的时代保持竞争力的指南。
评分坦白说,刚拿到这本书的时候,我并没有抱太大的期望,毕竟市面上关于大数据的书太多了,很多都大同小异,充斥着各种术语和晦涩的理论。但是,《数据即未来:大数据王者之道》这本书,真的给了我一个惊喜。它最大的亮点在于,作者并没有仅仅停留在理论层面,而是将大数据与实际应用场景进行了深度的结合。无论是金融、医疗,还是零售、制造,书中都列举了大量详实生动的案例,展示了大数据是如何被应用于解决实际问题,创造商业价值的。这种“学以致用”的思路,让我觉得这本书非常实用,不仅仅是知识的灌输,更能激发我的思考和实践。而且,作者在分析这些案例时,并没有回避挑战和困难,而是坦诚地探讨了在大数据应用过程中可能遇到的各种问题,以及应对策略。这种严谨的态度,让这本书更具可信度。另外,书中对于“数据人才”的培养和发展方向的探讨,也让我受益匪浅。它让我意识到,在大数据时代,不仅仅需要技术专家,更需要懂业务、懂分析、懂沟通的复合型人才。这本书就像一本“武林秘籍”,为我们揭示了在大数据时代成为“王者”的路径。
评分我必须说,这本书是近几年来我读过的最令人振奋的一本书之一。它没有让我觉得枯燥乏味,反而充满了活力和远见。作者对于“数据”的理解,已经超越了单纯的技术范畴,将其上升到了战略和哲学的高度。他所描绘的“大数据王者之道”,不仅仅是关于如何利用数据去赚钱,更是关于如何利用数据去洞察趋势,引领变革,甚至是塑造未来。我尤其欣赏书中关于“数据伦理”和“数据治理”的章节。在当今社会,数据泄露和滥用的问题越来越突出,而这本书不仅指出了这些潜在的风险,更提出了建设性的解决方案,强调了在追求数据价值的同时,必须坚守道德底线。这让我觉得作者的视野非常开阔,也很有社会责任感。阅读过程中,我常常被作者的洞察力所折服,他能够从纷繁复杂的数据现象中提炼出深刻的规律,并将其清晰地呈现出来。这本书让我重新思考了“信息爆炸”时代的意义,以及我们应该如何在这个时代中找到自己的位置。它不仅仅是一本技术指南,更是一本思想启蒙的读物,让我对未来充满了希望,也充满了对未知的好奇。
评分可以的,书不错,打折时候买的,价格合算,希望以后活动多点
评分排行榜的好书,还没看
评分非常好,非常好,非常好,特别舒服,还会回购
评分速度很快的,接下来好好看看
评分冲阿里巴巴买的,图书节满100减50,有空再看
评分提前学一些架构上的事儿,为以后打基础,好好学习,内容很不错
评分开卷有益,多读书,读好书。
评分618屯书,400-280,包装很好。
评分由浅入深,越往后越偏向技术。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有