打字猴:1.700508768e+09
1700508768 数据科学家养成手册 [:1700503601]
1700508769 数据科学家养成手册 11.10 本章小结
1700508770
1700508771 算法学作为一门使用计算机资源调度技术来处理和解决问题的学科,要求研究人员除了在数学层面要有足够高的知识水平,还要充分掌握和理解计算机的离散特性和资源协调特性。
1700508772
1700508773 在算法学里,从微观到宏观,贯穿着处理问题的哲学思想。变通处理,化无穷为有穷,化复杂为简单,化有中心为无中心,时空互化,统筹有限资源——对这些思想的贯彻,尤其是在更为宏观层面的理解与运用,往往会有事半功倍的效果。
1700508774
1700508775 在学习过程中,要注意算法本身就是一种思想或者策略,当它们应用于不同场景时会有很多变种出现。这些变种在思想层面继承了经典算法的衣钵,只是在大量处理细节上有很多偏重和技巧,从而形成了算法族或算法系列。面对纷繁变化的算法,不要过早陷入细枝末节,还是应该本着从干到枝、从枝到叶的逐步深入的原则来学习。算法在整个数据科学体系里也是最能体现“厚积薄发”的一个分支学科,在研究说过程中一定要注意积累、归纳和总结。
1700508776
1700508777 (1) 物理地址扩展(Physical Address Extention),是基于x86服务器的一种功能,能使运行该模式的计算机支持4GB以上的物理内存。
1700508778
1700508779 (2) 1Y=1024Z,1Z=1024E,1E=1024P,1P=1024T,1T=1024G,1G=1024M,1M=1024K,1K=1024。
1700508780
1700508781 (3) 参见Visual Studio .NET 2003数据类型说明部分。
1700508782
1700508783 (4) 在一个国际象棋棋盘上放置8个皇后,让它们彼此之间不能直接互相攻击。皇后在国际象棋规则中可以横、竖、斜走无限格。
1700508784
1700508785 (5) 1831年,法国著名数学家埃瓦里斯特·伽罗瓦(Évariste Galois,1811年10月~1832年5月)证明,一元五次以上的方程没有求根公式。
1700508786
1700508787 (6) “NP问题”的全称是“Non-Deterministic Polynomial Complete Problems”,即多项式复杂程度的非确定性问题。
1700508788
1700508789 (7) VGG的卷积神经网络模型除此之外还有VGG-19等。
1700508790
1700508791
1700508792
1700508793
1700508794 数据科学家养成手册 [:1700503602]
1700508795 数据科学家养成手册 实践篇
1700508796
1700508797 在一个完整的数据生命周期中,对工程实践应用进行归纳性的讨论,看看在数据收集、数据存储、数据统计、数据建模、数据可视化和数据决策中各种方法的优劣和取舍的原则。这个过程说起来非常有趣,有很多的方法可以尝试,同时又有一定的定势可循。
1700508798
1700508799
1700508800
1700508801
1700508802 数据科学家养成手册 [:1700503603]
1700508803 数据科学家养成手册 第12章 数据采集
1700508804
1700508805 数据科学家养成手册 [:1700503604]
1700508806 12.1 数据的源头
1700508807
1700508808 数据采集是整个大数据实践的第一步。在这里我特意用了“大数据”这个词,并不是因为这个词时髦,而是希望用这样一个概念笼统的词汇来指代一切沿着数据的生命周期进行生产实践的行为。
1700508809
1700508810 现在绝大多数的大数据应用场景都是在计算机上实现的。在个人PC上通常使用Windows操作系统,这种操作系统相信大家一定不会陌生。经过20多年的进化,Windows上已经有了非常多的伴生软件,例如处理数据的、处理图像的、处理文本的、处理视频的,非常丰富。
1700508811
1700508812 在个人PC上我们可以进行大数据实践吗?可以。例如,使用Excel就可以对少量(几万条规模的数据)的数据进行统计并生成图表,非常方便。数据的载体是Excel文件,或者是 .csv格式的方阵式文本文件。Excel虽然现在非常普及,但它并不是行业标准,更不是专业的数据处理软件。Excel功能的发展,以及其他软件对Excel文件格式的兼容,在我看来更多的是一种不得已,是一种由数据承载惯性带来的结果。
1700508813
1700508814 对拥有少量数据的用户,尤其是那些对实时性及数据量没有要求的用户来说,这是一种性价比极高的方式。当然,这不是企业应用的普遍场景,更多的企业在数据收集的过程中采用了自动或者半自动传输的方式。
1700508815
1700508816 数据的产生是无处不在的,对世界上任何一个事物在任何一瞬间的行为描述,只要你愿意,都可以量化成一个向量。所以,数据的产生从其最源头来说就像“永动机”一样一刻不停,持之以恒。不过,人类能够收集且有意愿收集的数据相比之下就非常少了,而且“本着解决实际问题的目的去收集数据”这一行为本身就会优先收集潜在价值较高的数据,即使是在对利益追逐不明显的学术研究领域也有同样的特性。
1700508817
[ 上一页 ]  [ :1.700508768e+09 ]  [ 下一页 ]