打字猴:1.70050756e+09

1700507560

1700507561

1700507562 图11-13　迷宫问题

1700507563

1700507564

1700507565

1700507566

1700507567 大约是3.5×10190。在这样的情况下，使用穷举法显然会消耗一段我们无法忍受的时长，而且使用分治法的思路也不明确，无法简化成“局部获解而全局获解”的问题。

1700507568

1700507569 但是，我们可以很容易地发现，迷宫中很多方格的4个方向其实并非全部有效：有的是“墙”，过不去；有的是走到某一步会发现，从这一步开始的所有解树叶节点都不用尝试了，这种情况下，会把“树”上的所有子枝全部剪掉，以节省大量的空间和时间成本，所以叫“剪枝法”也是非常形象的（如图11-14所示）。

1700507570

1700507571

1700507572

1700507573

1700507574 图11-14　三叉树深度优先遍历

1700507575

1700507576 剪枝法不仅可以应用在类似寻找迷宫出口的问题上，在地图导航等领域的应用及变种应用也很多，例如象棋和围棋的对弈软件就是使用类似的方式实现的。不过，近年来随着深度学习领域的理论发展和计算机计算能力的攀升，围棋对弈软件更多使用深度神经网络辅以强化学习的手段来开发。关于深度神经网络解决问题的核心思路，会在11.9节专门讨论。

1700507577

1700507578

1700507579

1700507580

1700507581 数据科学家养成手册 [:1700503583]

1700507582 数据科学家养成手册 11.6　贪心法——局部最优

1700507583

1700507584 “贪心法”这个名字听起来好像不怎么高尚，不过它却是一种常用且实用的思维方式。无独有偶，这种方式也是人类本身所拥有的。

1700507585

1700507586 不管是国家还是个人，在制定自己的发展规划时要做到“从一而终”通常非常困难。就拿一个人来说，有句话叫“计划赶不上变化”——在10岁的时候规划好的理想人生，可能刚过两三年就会因为很多内在和外在的因素发生了变化而不得不重新规划。可以毫不夸张地说，规划的时间跨度越长就越不实用，因为人生中无处不在的变数会潜移默化地对一个人的规划产生影响，这一系列的变化慢慢积累，到最后可能连规划者本人都看不出当前的情况和原来的规划还有什么联系。

1700507587

1700507588 对“帮助计算机解题”来做规划，也会有解决类似问题的困惑，要不怎么说“数据科学贯穿在很多领域之中”呢？而且，对计算机来说，时间和空间成本同样是比较有限的。在一个全局的复杂问题中，如果无法通过穷举、分治、回溯这些问题快速找到一个可行的解决方案，该怎么办？——用贪心法。

1700507589

1700507590 贪心法的思路也很明确，就是在每一步向前试探的时候都找到当前的“最优解”，其他的解（分支）一概不看——在有限的视野寻找最优解作为行动纲领。经典算法中的迪杰斯特拉算法（Dijkstra Algorithm）就是其中之一。

1700507591

1700507592 迪杰斯特拉算法用于求解有向图中的最短路径问题。在生产实践中，其应用场景通常是那些需要快速应答且穷举和回溯成本极高的场合。在学术方面，所有人都承认以迪杰斯特拉算法为代表的贪心法求出的通常是次优解，即每次找到的与当前访问位置连接成本最低的点，都只是在这一无法回溯的情况下对找到“最优解”的单方向试探，当然不排除一些被忽略的访问路径是最优解的情况（如图11-15所示）。每个有向边所标注的权重数字相当于在这个边上前进所发生的成本，当然是从节点A走到节点H时的成本越低越好，而用贪心法在这里求出的解显然不是全局的最优解。

1700507593

1700507594

1700507595

1700507596

1700507597 图11-15　贪心法求解路径问题

1700507598

1700507599 不过不用担心，在生产实践中这种次优解已经能够解决实际问题，在求解最优解的成本远远高于求解次优解的情况下就可以大胆使用它。这种“次优解即最优解”的思维方式几乎贯穿于所有工业应用领域，后面我们还会介绍很多这样的例子。

1700507600

1700507601

1700507602

1700507603

1700507604 数据科学家养成手册 [:1700503584]

1700507605 数据科学家养成手册 11.7　迭代法——步步逼近

1700507606

1700507607 所谓“迭代法”同样不是一个算法，而是一类算法的解题思路。这种方法用来处理那些无法通过解析解的表达得到精确解的情况。

1700507608

1700507609

[ 上一页 ] [ :1.70050756e+09 ] [ 下一页 ]