打字猴:1.700533689e+09
1700533689
1700533690
1700533691
1700533692
1700533693 (2.15)
1700533694
1700533695 即有如下关系
1700533696
1700533697
1700533698
1700533699
1700533700 (2.16)
1700533701
1700533702 显然在单位圆上,余弦距离和欧氏距离的范围都是[0,2]。我们已知欧氏距离是一个合法的距离,而余弦距离与欧氏距离有二次关系,自然不满足三角不等式。具体来说,可以假设A与B、B与C非常近,其欧氏距离为极小量u;此时A、B、C虽然在圆弧上,但近似在一条直线上,所以A与C的欧氏距离接近于2u。因此,A与B、B与C的余弦距离为u2/2;A与C的余弦距离接近于2u2,大于A与B、B与C的余弦距离之和。
1700533703
1700533704 面试者在碰到这类基础证明类的问题时,往往会遇到一些困难。比如对面试官考察的重点“距离”的定义就不一定清晰地记得。这个时候,就需要跟面试官多沟通,在距离的定义上达成一致(要知道,面试考察的不仅是知识的掌握程度,还有面试者沟通和分析问题的能力)。要想给出一个完美的解答,就需要清晰的逻辑、严谨的思维。比如在正定性和对称性的证明过程中,只是给出含糊的表述诸如“显然满足”是不好的,应该给出一些推导。最后,三角不等式的证明/证伪中,不应表述为“我觉得满足/不满足”,而是应该积极分析给定三个点时的三角关系,或者推导其和欧氏距离的关系,这样哪怕一时找不到反例而误认为其是合法距离,也比“觉得不满足”这样蒙对正确答案要好。
1700533705
1700533706 笔者首次注意到余弦距离不符合三角不等式是在研究电视剧的标签时,发现在通过影视语料库训练出的词向量中,comedy和funny、funny和happy的余弦距离都很近,小于0.3,然而comedy和happy的余弦距离却高达0.7。这一现象明显不符合距离的定义,引起了我们的注意和讨论,经过思考和推导,得出了上述结论。
1700533707
1700533708 在机器学习领域,被俗称为距离,却不满足三条距离公理的不仅仅有余弦距离,还有KL距离(Kullback-Leibler Divergence),也叫作相对熵,它常用于计算两个分布之间的差异,但不满足对称性和三角不等式。
1700533709
1700533710
1700533711
1700533712
1700533713 百面机器学习:算法工程师带你去面试 [:1700532179]
1700533714 百面机器学习:算法工程师带你去面试 04 A/B测试的陷阱
1700533715
1700533716
1700533717
1700533718 场景描述
1700533719
1700533720 在互联网公司中,A/B 测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。在机器学习领域中,A/B 测试是验证模型最终效果的主要手段。
1700533721
1700533722 知识点
1700533723
1700533724 A/B测试,实验组,对照组
1700533725
1700533726 问题1 在对模型进行过充分的离线评估之后,为什么还要进行在线A/B测试?
1700533727
1700533728 难度:★☆☆☆☆
1700533729
1700533730 分析与解答
1700533731
1700533732 需要进行在线A/B测试的原因如下。
1700533733
1700533734 (1)离线评估无法完全消除模型过拟合的影响,因此,得出的离线评估结果无法完全替代线上评估结果。
1700533735
1700533736 (2)离线评估无法完全还原线上的工程环境。一般来讲,离线评估往往不会考虑线上环境的延迟、数据丢失、标签数据缺失等情况。因此,离线评估的结果是理想工程环境下的结果。
1700533737
1700533738 (3)线上系统的某些商业指标在离线评估中无法计算。离线评估一般是针对模型本身进行评估,而与模型相关的其他指标,特别是商业指标,往往无法直接获得。比如,上线了新的推荐算法,离线评估往往关注的是ROC曲线、P-R曲线等的改进,而线上评估可以全面了解该推荐算法带来的用户点击率、留存时长、PV访问量等的变化。这些都要由A/B测试来进行全面的评估。
[ 上一页 ]  [ :1.700533689e+09 ]  [ 下一页 ]