1700503790
数据科学家养成手册 序
1700503791
1700503792
十几二十年前,读书是学习新技术的不二法门。当时如果要学习一门技术,都需要买上几本“砖头书”,一边阅读,一边动手,一页一页“啃”下来。很多在今天叱咤风云的高手,当年都是用这种方式打下基础的。
1700503793
1700503794
最近几年,技术学习的方式发生了深刻的变化,大量的在线视频课程、交互式学习环境、开箱即用的工具箱,使技术学习的效率大幅度提升,特别是在动手能力方面,培训效率有了质的飞跃。最近一年,受人工智能领域突破性进展的鼓舞,机器学习和数据科学成为技术圈中的显学,而在线学习成为主流的学习方式。在这种情况下,大批学习者仅仅看过一些视频教程,按要求在Jupyter Notebook中做过一些练习,就基本具备动手解决问题的能力,可以上岗了。
1700503795
1700503796
这当然很好。但是,倘若你想在某一个领域取得真知,读书仍然是不可或缺的手段。中国信息安全领域的领军人物冯登国院士曾经说,以他的经验,想要真的搞懂某一个领域,非得深入“啃”至少一本书不可。读书的效率相对于听课、看视频要低得多,而多维的知识体系通过单维的文字表达出来,也给理解带来了挑战。然而,唯其有这种挑战,才需要读者进入深度思考状态,使读书成为一个推敲、琢磨、设问和破解的过程。不经过这个过程,我们所学到的知识一般来说只能是浮于表面的,很难达到“知其然知其所以然”的高度。正因如此,我们已经开始发现,仅通过在线视频和动手练习的学习者,对于相关领域的理论掌握经常是肤浅的。可以说,到目前为止,读书作为一种学习手段,依然是其他方式无法取代的。
1700503797
1700503798
机器学习和数据科学领域有几本非常重要的著作,每一个有野心的学习者都应该选择至少一本深入研究。Christopher Bishop于2006年出版的Pattern Recognition and Machine Learning,Kevin Murphy 2012年的巨著Machine Learning: A Probabilistic Perspective,斯坦福大学两位机器学习泰斗Trevor Hastie和Robert Tibshirani及其学生合著的An Introduction to Statistical Learning,当然还有Ian Goodfellow和Yoshua Bengio最近出版的Deep Learning——称这几本书为这个领域的“四书五经”,应该没有争议。
1700503799
1700503800
但是,这几本书有一个共同的问题——都是按照教材的体例编写的,所以都是尽全力系统化地介绍知识,对这个领域丰富多彩的应用、历史、人文和故事却很少展开论述。而要成为一名数据科学家,仅有知识和动手能力是不够的,还需要有相应的素养,这包括特有的思维方式、价值观,对相关历史背景和掌故的了解,以及对数据科学社区的认知和互动——这恰恰是本书的最大价值。
1700503801
1700503802
作者把数据科学放在一个更广阔的背景之中,从数学、统计学、方法论甚至认知论的层面出发,讨论数据科学的内涵和外延,内容丰富,旁征博引,语言生动,灵活有趣,帮助读者站在一个更丰富的势场中认识数据科学,理解数据科学的基本思想。尤为令人欣喜的是,作者将信息论、混沌理论纳入讨论之中,表明作者敏锐地注意到数据科学与系统科学和认识论的深层联系,这是难能可贵的。从这个角度来解说数据科学的书,应该说在中国是第一本,即使在全球范围内也是独具特色的。为此,我们愿意向读者推荐本书,并相信读者一定能从中获得非常有价值的启发。
1700503803
1700503804
CSDN、AI100创始人 蒋 涛
1700503805
1700503806
AI100合伙人 孟 岩
1700503807
1700503808
1700503809
1700503810
1700503812
数据科学家养成手册 前言
1700503813
1700503814
为什么要写这本书
1700503815
1700503816
随着计算机科学和数据科学的发展,越来越多的人开始把目光投向其中最为耀眼的互联网、物联网、大数据、人工智能等高新技术领域,并且有相当多的高级技术人才已经在这些领域获得了令人瞩目的成就。
1700503817
1700503818
在追逐信息技术发展浪潮的过程中,数据科学成为人们在信息技术海洋中遨游所沉淀下来的理论与科学基础。我们都渴望通过对数据科学的理解来对生产工作进行指导和改善,这种工作的意义与其他各种在信息技术产业一线工作所创造价值的意义一样非比寻常。它给我们更广的辩证思考的空间,更高的观察事物的眼界,更多的自新的维度与动力。它是那么神秘且有趣。
1700503819
1700503820
今天,数据科学已经渗透到我们每个人的工作和生活之中。在你早上起来赶公车或者地铁的时候,你其实正在享受由数据科学辅助进行的精确调度服务;在你阅读工作报表的时候,你其实正在享受由数据科学辅助进行的大数据统计服务;在你吃午餐的时候,你其实正在享受由数据科学辅助进行的外卖快餐数据分发或食堂菜品改良服务;当你晚上回到家,在网上尽情购物的时候,你其实正在享受由数据科学辅助进行的高效电子商务和智能推荐服务。驾车出行有智能导航,就医问药有分诊机器人……也许你的家人或者朋友现在就在自己的工作岗位上,作为一名普通的销售人员、产品经理、人力资源师、售后服务人员、商务代表等,通过数据决策系统、数据库甚至电子表格来观察数据,作出判断,开展工作。数据科学给我们带来的红利已经紧紧把我们包围。
1700503821
1700503822
这本书绝无说教的想法,而是希望以书为媒,用谈天说地的方式,以激发每个人的思考为主要手段,归纳总结数据科学的实质及成就一位数据科学家所需要的基本素养。
1700503823
1700503824
遗憾的是,越是基础性、本源性的学科,与变成现实利益的距离就越远,让人觉得似乎不够实惠,不够亲近。至少读完这本书没办法帮你直接在第二天变出米饭、房子和汽车。不过我认为,楼房再高再漂亮,也需要人们看不到的深厚地基来支持;花儿再芬芳再娇艳,也需要在土壤之下吮吸养分的丰富根系来供能。这些看不到的东西,往往起着我们无法想象的巨大作用,而这才是我希望与你一同讨论并思考的。
1700503825
1700503826
我们热爱生活,我们热爱所做的工作,我们希望在不断的攀登中看到更深更远的世界并去伪存真。那就让我们在点点滴滴的知识片段中一起开始慢慢思索、细细揣摩这一养成过程吧。
1700503827
1700503828
本书特色
1700503829
1700503830
本书从众多先贤及科学家的轶事开始讲起,以逐步归纳和递进的脉络总结出科学及数据科学应关注的要点,然后在生产的各个环节中对这些要点逐一进行讨论与落实,将这本书变成一本具有一定思维升华价值的参考书,从更高、更广的视角回看科学及数据科学在各个生产环节的缩影。
1700503831
1700503832
本书并不以高深的数学理论研究作为目的,也不以某一种计算机语言编程作为主线脉络,而是在一个个看似孤立的故事与工程中不断拾遗,并试着从中悟出一些道理。
1700503833
1700503834
简洁与深刻并重是本书的另一大特点。作为认知科学的延伸,数据科学一方面应该越来越引起广大大数据工作者的重视,另一方面也要撩开自己的神秘面纱,以最为亲民的姿态和每位大数据工作者成为亲密无间的战友,为用科学的思维方式进行工作做好理论准备。
1700503835
1700503836
读者对象
1700503837
1700503838
(1)大数据从业人员和对大数据相关知识感兴趣的人。
[
上一页 ]
[ :1.700503789e+09 ]
[
下一页 ]