打字猴:1.70264314e+09
1702643140
1702643141 本章补充知识点
1702643142
1702643143 要计算两组数据的相关系数,我们需要按以下几个步骤进行。为了让大家能够更好地理解,这里每个步骤的讲解都是基于一张15个学生的身高与体重的数据表。
1702643144
1702643145 1.   将每个学生的身高转换为标准值:(身高-平均身高)/标准差。
1702643146
1702643147 2.   将每个学生的体重转换为标准值:(体重-平均身高)/标准差。
1702643148
1702643149 3.   将每个学生的体重标准值和身高标准值相乘,你会发现,当一个学生的身高和体重都偏离平均值较远时,乘积的绝对值也会较大。
1702643150
1702643151 4.将第三步求得的乘积相加,再除以统计对象的数量(在这个例子中为15),就可以得到相关系数。
1702643152
1702643153 这一组学生的身高与体重的相关系数为0.83,考虑到相关系数的范围是从-1到1,因此我们可以认为身高和体重之间存在着较强的正相关关系。
1702643154
1702643155
1702643156
1702643157
1702643158 在我们介绍相关系数的公式之前,有必要了解几个数学符号。求和符号∑是一个常用的统计学运算工具,表示跟在其后的数据的总和。假设有一组数据X1、X2、X3和X4,那么∑(X1)就意味着我们应该将4个数相加:X1+X2+X3+X4,即∑(X1)= X1+X2+X3+X4。那么,这组数据的平均值公式就为:平均值=∑(X1)/n。
1702643159
1702643160 如果用更符合数学规范的格式来表述,那么求和公式就应该写成:
1702643161
1702643162 表示X1+X2+X3……Xn,求和公式的第一项为X1 (当i=l时),最后一项为Xn (当i=n时)。对于n个数据来说,其平均值公式就可以表示为:
1702643163
1702643164
1702643165
1702643166
1702643167 再加上其他通用符号,变量X和y的相关系数1的运算公式可以表示为:
1702643168
1702643169
1702643170
1702643171
1702643172 其中,n代表数据个数,x代表变量x的平均值,y代表变量y的平均值,σx代表变量X的标准差,σy代表变量y的标准差。
1702643173
1702643174 所有统计软件都具备计算两个变量的相关系数的功能。例如,用微软Excel办公软件来解决之前15个学生的身高和体重的相关性问题,电脑运算得到的相关系数与手动计算的结果是一致的,都是0.83。
1702643175
1702643176
1702643177
1702643178
1702643179 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 [:1702642305]
1702643180 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第5章 概率与期望值
1702643181
1702643182 买福利彩票,去赌场豪赌、投资股票或期货,哪种方式让你跻身《福布斯》富豪排行榜的可能性更大?
1702643183
1702643184 1981年,美国约瑟夫·施利茨酿酒公司斥170万美元巨资为该公司旗下的旗舰品牌——施利茨啤酒开展了一场大胆而冒险的市场营销活动。当美国橄榄球超级杯大赛(即“超级碗”)的中场休息时间一到,施利茨公司就会当着全球亿万电视观众的面,现场直播一场别开生面的啤酒品鉴会,而挑选的对手不是别人,正是施利茨的死对头——米切罗啤酒,更让人大跌眼镜的是,参加品鉴会的不是别人,正是100名米切罗啤酒的忠实用户。这样的广告从始至终出现在季后赛的每一场比赛当中。类似的电视直播啤酒品鉴会总共有5场,每场都会邀请100名某品牌啤酒的“拥趸”,包括百威、米勒、米切罗等,让这些啤酒爱好者在自己最钟爱的啤酒和施利茨啤酒之间进行“盲品”。一边是如火如荼正在进行的职业橄榄球季后赛,一边是同样激烈的啤酒品鉴会,那时的广告标语甚至打出了“看季后赛,喝施利茨啤酒”的字样。
1702643185
1702643186 广告噱头很明确:即使是那些自认为喜欢另一种品牌的啤酒爱好者,在盲品时也会发现自己更偏爱施利茨啤酒。啤酒公司甚至还请了一位橄榄球职业联赛的前裁判来监督整个活动过程。考虑到在数量众多的电视观众面前举办这样一场充满风险的啤酒品鉴会,你肯定会觉得施利茨啤酒的口感一定特别好,否则哪会有勇气搞这样的宣传,是吗?
1702643187
1702643188 那可不一定。施利茨只需要生产出口感平平的啤酒,再掌握一些扎实的统计学知识,就能确保这项计谋肯定会成功——注意,我在写作时通常会非常谨慎地使用“计谋”这样的词,尤其是列举啤酒广告这样的例子。施利茨所生产的这种啤酒喝起来没什么特别的,跟绝大多数其他品牌的同类啤酒几乎没有太大差别;但讽刺的是,正是这一点成为施利茨啤酒广告营销的核心。可以假定的是,如果在街上随机找几个喜欢喝啤酒的人,他们基本上区分不出施利茨、百威、米切罗或米勒啤酒。因此,取其中任意两种品牌的啤酒进行盲品测试,猜对品牌的概率基本上和扔硬币差不多。大体来看,有1/2的人会选择施利茨,剩下1/2的人会选择“挑战”品牌的啤酒,单看这样的结果可能无法构成一个有说服力的广告营销(我们总不能说“既然口感都差不多,就选择施利茨吧”)。而且,施利茨啤酒公司绝对不会拿自己的忠实用户做试验,因为差不多有1/2的用户会“不小心”挑选其他品牌的啤酒。如果一群原本忠实于某品牌啤酒的消费者在盲品时竟然觉得竞争对手的啤酒好喝,这个品牌该有多悲哀啊,所以,施利茨就让这样的事情发生在其他品牌身上。
1702643189
[ 上一页 ]  [ :1.70264314e+09 ]  [ 下一页 ]