1700503753
1700503754
ISBN 978-7-121-31304-2
1700503755
1700503756
Ⅰ.①数… Ⅱ.①高… Ⅲ.①数据管理-手册 Ⅳ.①TP274-62
1700503757
1700503758
中国版本图书馆CIP数据核字(2017)第071293号
1700503759
1700503760
策划编辑:潘 昕
1700503761
1700503762
责任编辑:潘 昕
1700503763
1700503764
印 刷:三河市良远印务有限公司
1700503765
1700503766
装 订:三河市良远印务有限公司
1700503767
1700503768
出版发行:电子工业出版社
1700503769
1700503770
北京市海淀区万寿路173信箱 邮编100036
1700503771
1700503772
开 本:787×980 1/16 印张:23 彩插:2 字数:500千字
1700503773
1700503774
版 次:2017年5月第1版
1700503775
1700503776
印 次:2017年5月第1次印刷
1700503777
1700503778
定 价:79.00元
1700503779
1700503780
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888。
1700503781
1700503782
质量投诉请发邮件至zlts@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn。
1700503783
1700503784
本书咨询联系方式:(010)51260888-819,faq@phei.com.cn。
1700503785
1700503786
1700503787
1700503788
1700503790
数据科学家养成手册 序
1700503791
1700503792
十几二十年前,读书是学习新技术的不二法门。当时如果要学习一门技术,都需要买上几本“砖头书”,一边阅读,一边动手,一页一页“啃”下来。很多在今天叱咤风云的高手,当年都是用这种方式打下基础的。
1700503793
1700503794
最近几年,技术学习的方式发生了深刻的变化,大量的在线视频课程、交互式学习环境、开箱即用的工具箱,使技术学习的效率大幅度提升,特别是在动手能力方面,培训效率有了质的飞跃。最近一年,受人工智能领域突破性进展的鼓舞,机器学习和数据科学成为技术圈中的显学,而在线学习成为主流的学习方式。在这种情况下,大批学习者仅仅看过一些视频教程,按要求在Jupyter Notebook中做过一些练习,就基本具备动手解决问题的能力,可以上岗了。
1700503795
1700503796
这当然很好。但是,倘若你想在某一个领域取得真知,读书仍然是不可或缺的手段。中国信息安全领域的领军人物冯登国院士曾经说,以他的经验,想要真的搞懂某一个领域,非得深入“啃”至少一本书不可。读书的效率相对于听课、看视频要低得多,而多维的知识体系通过单维的文字表达出来,也给理解带来了挑战。然而,唯其有这种挑战,才需要读者进入深度思考状态,使读书成为一个推敲、琢磨、设问和破解的过程。不经过这个过程,我们所学到的知识一般来说只能是浮于表面的,很难达到“知其然知其所以然”的高度。正因如此,我们已经开始发现,仅通过在线视频和动手练习的学习者,对于相关领域的理论掌握经常是肤浅的。可以说,到目前为止,读书作为一种学习手段,依然是其他方式无法取代的。
1700503797
1700503798
机器学习和数据科学领域有几本非常重要的著作,每一个有野心的学习者都应该选择至少一本深入研究。Christopher Bishop于2006年出版的Pattern Recognition and Machine Learning,Kevin Murphy 2012年的巨著Machine Learning: A Probabilistic Perspective,斯坦福大学两位机器学习泰斗Trevor Hastie和Robert Tibshirani及其学生合著的An Introduction to Statistical Learning,当然还有Ian Goodfellow和Yoshua Bengio最近出版的Deep Learning——称这几本书为这个领域的“四书五经”,应该没有争议。
1700503799
1700503800
但是,这几本书有一个共同的问题——都是按照教材的体例编写的,所以都是尽全力系统化地介绍知识,对这个领域丰富多彩的应用、历史、人文和故事却很少展开论述。而要成为一名数据科学家,仅有知识和动手能力是不够的,还需要有相应的素养,这包括特有的思维方式、价值观,对相关历史背景和掌故的了解,以及对数据科学社区的认知和互动——这恰恰是本书的最大价值。
1700503801
1700503802
作者把数据科学放在一个更广阔的背景之中,从数学、统计学、方法论甚至认知论的层面出发,讨论数据科学的内涵和外延,内容丰富,旁征博引,语言生动,灵活有趣,帮助读者站在一个更丰富的势场中认识数据科学,理解数据科学的基本思想。尤为令人欣喜的是,作者将信息论、混沌理论纳入讨论之中,表明作者敏锐地注意到数据科学与系统科学和认识论的深层联系,这是难能可贵的。从这个角度来解说数据科学的书,应该说在中国是第一本,即使在全球范围内也是独具特色的。为此,我们愿意向读者推荐本书,并相信读者一定能从中获得非常有价值的启发。
[
上一页 ]
[ :1.700503753e+09 ]
[
下一页 ]