打字猴:1.70053996e+09
1700539960  
1700539961
1700539962 机器学习竞赛平台Kaggle的前世今生
1700539963
1700539964 XGBoost的火热与Kaggle的机器学习竞赛是分不开的,正是在各类竞赛中突出的表现,让XGBoost成为非常流行的机器学习框架,借此机会我们也向大家介绍一下Kaggle的前世今生。
1700539965
1700539966 Kaggle是全球机器学习竞赛、开放数据集和数据科学合作的发源地,也是当今最著名最火热的机器学习竞赛平台。在被谷歌收购之后,Kaggle的知名度和用户数不断攀升,已经跨过了百万用户的大关,进一步巩固了它在数据科学界家喻户晓的地位。
1700539967
1700539968 “英雄起于阡陌,壮士拔于行伍”,Kaggle也不是平地惊雷般出现的,而是起于创始人一个非常朴素的想法。2010年,就职于澳大利亚财政部的Anthony Goldbloom对他当前的工作略感失望,他的主要工作是预测GDP、通货膨胀和失业,但传统的经济数据规模很小而且噪声很大,所以很难得出有趣的发现。为了获得更有趣的数据集和问题,Anthony利用业余时间构建了Kaggle,这个日后最火热的机器学习竞赛平台就这样诞生了。
1700539969
1700539970 和最初的愿景有所不同,Kaggle的发展有些出乎Anthony的意料。本来只想收集一些有趣的问题和数据供自己研究,但随着越来越多的大神加入,Anthony发现自己无论如何也做不了那么好。既然如此,Anthony索性致力于社区的发展,期望让 Kaggle成为一个充满活力的代码、数据和讨论的生态系统。也正是这样的改变,让Kaggle注入了开放的基因。
1700539971
1700539972 时至今日,Kaggle已经成了Google AI生态中不可或缺的一环,Anthony在回顾自己创业经历的时候,说了两点建议。一是,去解决那些你自己有切身体会,并且觉得其他人也正经历,而且还没有被解决的问题;二是,你要对这个问题充满热情。
1700539973
1700539974 不过笔者还是要说,“时势造英雄啊”,Kaggle正是在AI第三次热潮的风口“飞”起来的。祝各位创业者在有激情,能够解决痛点的同时,还有一个好的运气。
1700539975
1700539976
1700539977
1700539978
1700539979 百面机器学习:算法工程师带你去面试 [:1700532245]
1700539980 百面机器学习:算法工程师带你去面试 第13章 生成式对抗网络
1700539981
1700539982 2014年的一天,Ian Goodfellow与好友相约到酒吧。平日工作压力大,脑细胞已耗尽了创作激情,在酒吧的片刻放松使他想到一个绝妙的学术点子,那之后就有了生成式对抗网络的传说。生成式对抗网络,英文名叫Generative Adversarial Networks,简称GANs,是一个训练生成模型的新框架。GANs刚提出时没有晦涩的数学推演,描绘的是一幅动感十足的画面,恰好契合了东方哲学中的太极图——万物在相生相克中演化。把GANs想象成一幅太极图,“太极生两仪”,“两仪”好比生成器和判别器,生成器负责生,判别器负责灭,一生一灭间有了万物。生成器在初始混沌中孕育有形万物,判别器甄别过滤有形万物,扮演一种末日审判的角色。GANs自提出之日起,迅速风靡深度学习的各个角落,GANs的变种更是雨后春笋般进入人们的视野,诸如WGAN、InfoGAN、f-GANs、BiGAN、DCGAN、IRGAN等。GANs之火,就连初入深度学习的新手都能略说一二。
1700539983
1700539984
1700539985
1700539986
1700539987 百面机器学习:算法工程师带你去面试 [:1700532246]
1700539988 百面机器学习:算法工程师带你去面试 01 初识GANs的秘密
1700539989
1700539990
1700539991
1700539992 场景描述
1700539993
1700539994 2014年来自加拿大蒙特利尔大学的年轻博士生Ian Goodfellow和他的导师Yoshua Bengio提出一个叫GANs的模型[32]。Facebook AI实验室主任Yann LeCun称该模型是机器学习领域近十年最具创意的想法。把GANs想象成造假币者与警察间展开的一场猫捉老鼠游戏,造假币者试图造出以假乱真的假币,警察试图发现这些假币,对抗使二者的水平都得到提高。从造假币到合成模拟图片,道理是一样的。下面关于GANs,从基础理论到具体模型,再到实验设计,我们依次思考如下几个问题。
1700539995
1700539996 知识点
1700539997
1700539998 MiniMax游戏,值函数(Value Function),JS距离(Jensen- Shannon Divergence),概率生成模型,优化饱和
1700539999
1700540000 问题1 简述GANs的基本思想和训练过程。
1700540001
1700540002 难度:★☆☆☆☆
1700540003
1700540004 分析与解答
1700540005
1700540006 GANs的主要框架如图13.1所示,包括生成器(Generator)和判别器(Discriminator)两个部分。其中,生成器用于合成“假”样本,判别器用于判断输入的样本是真实的还是合成的。具体来说,生成器从先验分布中采得随机信号,经过神经网络的变换,得到模拟样本;判别器既接收来自生成器的模拟样本,也接收来自实际数据集的真实样本,但我们并不告诉判别器样本来源,需要它自己判断。生成器和判别器是一对“冤家”,置身于对抗环境中,生成器尽可能造出样本迷惑判别器,而判别器则尽可能识别出来自生成器的样本。然而,对抗不是目的,在对抗中让双方能力各有所长才是目的。理想情况下,生成器和判别器最终能达到一种平衡,双方都臻于完美,彼此都没有更进一步的空间。
1700540007
1700540008
1700540009
[ 上一页 ]  [ :1.70053996e+09 ]  [ 下一页 ]