打字猴:1.702487027e+09

1702487027 要是两者之间真的存在相关性——大吃甜甜圈的人会更重——图表上会出现一团向上的点云，从左下方推移到右上方。倘若案例的结果足够清晰，你可以用一把尺子把点云连接起来，画出趋势线。这条线，就是线性回归。你可以用它来进行预测。如果你想知道，一个人一个月吃14个甜甜圈，体重最有可能是多少，你可以在x轴（代表甜甜圈的个数）从14的位置往上画一条线，直到它跟对角的趋势线相交。然后，你就可以从交点上读到y轴上体重的预测值。

1702487028

1702487029 从概念上说，统计软件创建线性回归时做的就是这件事。代码不是关键所在——要让直线与数据吻合，有着严格的数学程序，但其基本思路就跟我前文描述的差不多。

1702487030

1702487031 如果你把多个预测因素加入组合，情况就变得有趣了。如果你考虑到了受访者的性别，那么体重预测会更准确，因为男性往往比女性重。为此，你需要制作一幅三维散点图，这就很难用图纸来管理了，但用统计软件就没问题了。

1702487032

1702487033 所谓的多元回归，是分析大数据使用的主要技术。性别为x、邮政编码为z的地方的一名顾客，有更大概率购买a，点击b，给c投票。测量每一个具体因素有多大用处可进行预测，是这些模型的作用之一。掌握很多因素的时候，你往往会发现有些因素是多余的。包含了邮政编码的模型，就不需要再包括居住州了，因为邮政编码就给出了州，而且对居住地做了更准确的描述。软件可以识别它。

1702487034

1702487035 我们理解为什么邮政编码比所在州蕴含的信息更丰富。通常，各个因素之间的重叠并不太明确，也缺乏显而易见的理由。任何数量的不同因素都有可能告诉我们一些相同的事情，但每一个因素也有可能同时在传达一些独特的信息。此时，模型通过囊括多个因素来获得预测能力。

1702487036

1702487037 由于接受正规教育的年限和收入之间的联系早已为人熟知，而且我认为也得到了理解，所以把它加入预测收入的模型是很有用处的。我把它加入了自己的10道问题分数模型。在模型中加入教育水平之后，测验成绩与收入是相关的，也就是说，事实性知识作为收入预测因素，仍然具备统计意义。这也就是说，事实性知识不仅仅是教育水平的“替代品”。

1702487038

1702487039 另一个相关因素是年龄。中年人比青年人赚钱更多，平均而言，接触各种事实的年头也更久。这可能使知识水平和收入水平之间产生明显的相关性，但真实情况可能是爬到资深职位的人有更高的收入。

1702487040

1702487041 所以，我以年龄、受教育程度和测验成绩作为因子进行了回归分析。知识水平仍然是收入水平的重要预测因素。而知识渊博的人，哪怕在教育和年龄不变的条件下，赚的钱仍然更多。

1702487042

1702487043 知识多和知识少造成的收入差异令人印象深刻。为了说得更具体些，我假设有个35岁的人，上过4年制大学，我以他为基准。统计模型预测，这样一个人，要是答错了我问答测试里的每一道题，他的平均家庭年收入是4万美元。而与他年龄和教育水平相同的人，若能正确回答所有的10个问题，则拥有9.5万美元的年收入。一年差不多要多出来5.5万美元——换个说法，后者是前者的2.35倍（见图6-2）。

1702487044

1702487045

1702487046

1702487047

1702487048 图6-2　知识红利：在知识问答测试里得高分的人收入也高2倍

1702487049

1702487050 我应该解释一下，没有人真的得零分——我的问题相当简单，但只有少数人每道题都答对了。在所有全答对的人里，没有任何一个人恰好是35岁，且又上过4年大学。统计软件会考察所有数据点，检验收入怎样随着3个因素发生变化。它用类似直线的方式，针对任何给定因素，预测最有可能出现的收入情况。

1702487051

1702487052 那么，是知识水平，而不是教育水平或年龄，导致了很大的收入差异。实际差异还有可能更明显，因为这里考察的是家庭收入，而回答问题的人说不定并非家庭主要收入来源。这将稀释知识水平和收入水平之间的关系，但它仍然可受检测，关联性还很大。

1702487053

1702487054 收入与知识的因果关系

1702487055

1702487056 我们知道，常识性的事实知识和收入相关，但相关性并不等于因果关系，如我们从美国小姐与“高热物质”谋杀案一例中所知。

1702487057

1702487058 这里存在3种可能性：

1702487059

1702487060 A．对一定程度事实性知识的广泛了解导致了高收入。

1702487061

1702487062 B．反过来：高收入使人们获得了广泛的知识面。

1702487063

1702487064 C．知识水平和高收入有着相同的成因。

1702487065

1702487066 可能性A提出，教育的经济收益不仅限于拥有一份大学文凭。大学毕业生理应胸有点墨。他必须具有自己工作所需的知识，以及大量相关领域的知识。

1702487067

1702487068 杰克和珍妮去了同一所学校，以同等成绩拿到相同学位，并在同一年毕业。珍妮仍记得大学一年级时对美索不达米亚的讨论，而杰克早就忘了，他还忘了其他许多学过的东西。虽然美索不达米亚跟珍妮的工作没有实质性关联，但她的整体知识范围给同事们留下了深刻的印象。她身边大多是些受过类似教育的人，人们预计她领悟得了有关弗吉尼亚·伍尔夫或薛定谔的猫一类的笑话。在人们的感知里，珍妮很聪明，这有可能让她得到较高的起薪，并在成功的阶梯上快速攀登。

1702487069

1702487070 不仅如此，珍妮广博的知识面还能带来一些额外的、更实质性的优势。管理者需要对自身领域之外的事情有足够的了解，才能跟同事们沟通。营销人员需要理解大众文化。做一辈子工程师的人，跟有机会从工程师晋升到管理层的人，其区别或许就在于知识的广泛性。要是打着铮亮发油的老板不知道冥王星是颗矮行星，就得不到工程师们的尊重。

1702487071

1702487072 这只是知识水平有可能怎样导致高收入的草图之一。还存在一些并不互相排斥的其他可能性。有可能，那些脑袋里装着大量事实的人更精于创新。他们的知识储备，使他们看到了其他人忽视的类比，能够为问题拟定创造性的解决方案。

1702487073

1702487074 还有一种解释是，能学会并记住大量常识性知识的人，说不定同样也能学会并记住大量和金钱有关的知识。这或许能推动他们进行更好的预算、储蓄和投资，而随着时间的推移，后者又可能带来更高的资产净值和收入。此外，见多识广的人往往会和受过良好教育、经济上稳妥可靠的伴侣结合，从而带来更高的家庭收入。

1702487075

1702487076 这些情况是可能性A推导出来的例子。但也许我们还可以反过来解释。高收入可能导致更广博的知识面（可能性B）。富人兴许有着更多的闲暇时间跟进新闻、读书、听播客和上课充电。与此同时，那些艰难谋生度日的人，可用在非基本生活资料上的金钱和时间都更少。他们很可能要打第二份工，根本请不起保姆来带孩子，因此不太可能有时间接受继续教育。

[ 上一页 ] [ :1.702487027e+09 ] [ 下一页 ]