打字猴:1.70053323e+09
1700533230
1700533231 (2)对图像中的像素添加噪声扰动,比如椒盐噪声、高斯白噪声等。
1700533232
1700533233 (3)颜色变换。例如,在图像的RGB颜色空间上进行主成分分析,得到3个主成分的特征向量p1,p2,p3及其对应的特征值 λ1,λ2,λ3,然后在每个像素的RGB值上添加增量[p1,p2,p3]•[α1λ1,α2λ2,α3λ3]T,其中 α1,α2,α3是均值为0、方差较小的高斯分布随机数。
1700533234
1700533235 (4)改变图像的亮度、清晰度、对比度、锐度等。
1700533236
1700533237 图1.4展示了一些图像扩充的具体样例。
1700533238
1700533239
1700533240
1700533241
1700533242 图1.4 图像数据扩充样例
1700533243
1700533244 除了直接在图像空间进行变换,还可以先对图像进行特征提取,然后在图像的特征空间内进行变换,利用一些通用的数据扩充或上采样技术,例如SMOTE(Synthetic Minority Over-sampling Technique)算法。抛开上述这些启发式的变换方法,使用生成模型也可以合成一些新样本,例如当今非常流行的生成式对抗网络模型。
1700533245
1700533246 此外,借助已有的其他模型或数据来进行迁移学习在深度学习中也十分常见。例如,对于大部分图像分类任务,并不需要从头开始训练模型,而是借用一个在大规模数据集上预训练好的通用模型,并在针对目标任务的小数据集上进行微调(fine-tune),这种微调操作就可以看成是一种简单的迁移学习。
1700533247
1700533248
1700533249
1700533250
1700533251 百面机器学习:算法工程师带你去面试 [:1700532175]
1700533252 百面机器学习:算法工程师带你去面试 第2章 模型评估
1700533253
1700533254 “没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。知道每种评估指标的精确定义、有针对性地选择合适的评估指标、根据评估指标的反馈进行模型调整,这些都是机器学习在模型评估阶段的关键问题,也是一名合格的算法工程师应当具备的基本功。
1700533255
1700533256
1700533257
1700533258
1700533259 百面机器学习:算法工程师带你去面试 [:1700532176]
1700533260 百面机器学习:算法工程师带你去面试 01 评估指标的局限性
1700533261
1700533262
1700533263
1700533264 场景描述
1700533265
1700533266 在模型评估过程中,分类问题、排序问题、回归问题往往需要使用不同的指标进行评估。在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。下面以Hulu的业务为背景,假想几个模型评估场景,看看大家能否触类旁通,发现模型评估指标的局限性。
1700533267
1700533268 知识点
1700533269
1700533270 准确率(Accuracy),精确率(Precision),召回率(Recall),均方根误差(Root Mean Square Error,RMSE)
1700533271
1700533272 问题1 准确率的局限性。
1700533273
1700533274 难度:★☆☆☆☆
1700533275
1700533276 Hulu的奢侈品广告主们希望把广告定向投放给奢侈品用户。Hulu通过第三方的数据管理平台(Data Management Platform,DMP)拿到了一部分奢侈品用户的数据,并以此为训练集和测试集,训练和测试奢侈品用户的分类模型。该模型的分类准确率超过了95%,但在实际广告投放过程中,该模型还是把大部分广告投给了非奢侈品用户,这可能是什么原因造成的?
1700533277
1700533278 分析与解答
1700533279
[ 上一页 ]  [ :1.70053323e+09 ]  [ 下一页 ]