手机浏览器扫描二维码访问
在此之前的1992年,在更为普遍的情形下,施密德胡伯也曾在循环神经网络上提出一种类似的训练方法,并在实验中证明这一训练方法能够有效提高有监督学习的执行速度。
自深度学习出现以来,它已成为很多领域,尤其是在计算机视觉和语音识别中,成为各种领先系统的一部分。在通用的用于检验的数据集,例如语音识别中的TIMIT和图像识别中的ImageNet,Cifar10上的实验证明,深度学习能够提高识别的精度。与此同时,神经网络也受到了其他更加简单归类模型的挑战,支持向量机等模型在20世纪90年代到21世纪初成为过流行的机器学习算法。
硬件的进步也是深度学习重新获得关注的重要因素。高性能图形处理器的出现极大地提高了数值和矩阵运算的速度,使得机器学习算法的运行时间得到了显着的缩短。
由于脑科学方面的大量研究已表明人脑网络不是一个级联的结构,深度学习网络在2001年后正逐渐被更有潜力的基于脑模型的网络所替代。
深度学习的基础是机器学习中的分散表示(distributedrepresentation)。分散表示假定观测值是由不同因子相互作用生成。在此基础上,深度学习进一步假定这一相互作用的过程可分为多个层次,代表对观测值的多层抽象。不同的层数和层的规模可用于不同程度的抽象。
深度学习运用了这分层次抽象的思想,更高层次的概念从低层次的概念学习得到。这一分层结构常常使用贪心算法逐层构建而成,并从中选取有助于机器学习的更有效的特征。
不少深度学习算法都以无监督学习的形式出现,因而这些算法能被应用于其他算法无法企及的无标签数据,这一类数据比有标签数据更丰富,也更容易获得。这一点也为深度学习赢得了重要的优势。
一部分最成功的深度学习方法涉及到对人工神经网络的运用。人工神经网络受到了1959年由诺贝尔奖得主大卫·休伯尔(DavidH.Hubel)和托斯坦·威泽尔(TorstenWiesel)提出的理论启发。休伯尔和威泽尔发现,在大脑的初级视觉皮层中存在两种细胞:简单细胞和复杂细胞,这两种细胞承担不同层次的视觉感知功能。受此启发,许多神经网络模型也被设计为不同节点之间的分层模型。
福岛邦彦提出的新认知机引入了使用无监督学习训练的卷积神经网络。扬·勒丘恩将有监督的反向传播算法应用于这一架构。
事实上,从反向传播算法自20世纪70年代提出以来,不少研究者都曾试图将其应用于训练有监督的深度神经网络,但最初的尝试大都失败。赛普·霍克赖特在其博士论文中将失败的原因归结为梯度消失,这一现象同时在深度前馈神经网络和循环神经网络中出现,后者的训练过程类似深度网络。在分层训练的过程中,本应用于修正模型参数的误差随着层数的增加指数递减,这导致了模型训练的效率低下。
为了解决这一问题,研究者们提出了一些不同的方法。于尔根·施密德胡伯于1992年提出多层级网络,利用无监督学习训练深度神经网络的每一层,再使用反向传播算法进行调优。在这一模型中,神经网络中的每一层都代表观测变量的一种压缩表示,这一表示也被传递到下一层网络。
另一种方法是赛普·霍克赖特和于尔根·施密德胡伯提出的长短期记忆神经网络(LSTM)。
2009年,在ICDAR2009举办的连笔手写识别竞赛中,在没有任何先验知识的情况下,深度多维长短期记忆神经网络获取了其中三场比赛的胜利。
斯文·贝克提出了在训练时只依赖梯度符号的神经抽象金字塔模型,用以解决图像重建和人脸定位的问题。
其他方法同样采用了无监督预训练来构建神经网络,用以发现有效的特征,此后再采用有监督的反向传播以区分有标签数据。杰弗里·辛顿等人于2006年提出的深度模型提出了使用多层隐变量学习高层表示的方法。这一方法使用斯摩棱斯基于1986年提出的受限玻尔兹曼机对每一个包含高层特征的层进行建模。模型保证了数据的对数似然下界随着层数的提升而递增。当足够多的层数被学习完毕,这一深层结构成为一个生成模型,可以通过自上而下的采样重构整个数据集。辛顿声称这一模型在高维结构化数据上能够有效地提取特征。
吴恩达和杰夫·迪恩领导的谷歌大脑团队创建了一个仅通过YouTube视频学习高层概念(例如猫)的神经网络。
其他方法依赖了现代电子计算机的强大计算能力,尤其是GPU。2010年,在于尔根·施密德胡伯位于瑞士人工智能实验室IDSIA的研究组中,丹·奇雷尚(DanCiresan)和他的同事展示了利用GPU直接执行反向传播算法而忽视梯度消失问题的存在。这一方法在扬·勒丘恩等人给出的手写识别MNIST数据集上战胜了已有的其他方法。
截止2011年,前馈神经网络深度学习中最新的方法是交替使用卷积层(convolutionallayers)和最大值池化层(max-poolinglayers)并加入单纯的分类层作为顶端。训练过程也无需引入无监督的预训练。从2011年起,这一方法的GPU实现多次赢得了各类模式识别竞赛的胜利,包括IJCNN2011交通标志识别竞赛和其他比赛。
这些深度学习算法也是最先在某些识别任务上达到和人类表现具备同等竞争力的算法。
深度神经网络是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。深度神经网络通常都是前馈神经网络,但也有语言建模等方面的研究将其拓展到循环神经网络。卷积深度神经网络(ConvolutionalNeuralNetworks,CNN)在计算机视觉领域得到了成功的应用。此后,卷积神经网络也作为听觉模型被使用在自动语音识别领域,较以往的方法获得了更优的结果。
其他神经网络模型类似,如果仅仅是简单地训练,深度神经网络可能会存在很多问题。常见的两类问题是过拟合和过长的运算时间。
深度神经网络很容易产生过拟合现象,因为增加的抽象层使得模型能够对训练数据中较为罕见的依赖关系进行建模。对此,权重递减或者稀疏等方法可以利用在训练过程中以减小过拟合现象。
另一种较晚用于深度神经网络训练的正规化方法是丢弃法(“dropout“regularization),即在训练中随机丢弃一部分隐层单元来避免对较为罕见的依赖进行建模。
鬼谷八荒之开局就是三剑痴 我开局穿越三国战场造机甲 纪初安唐石谦重生文 始于心甘情愿纪初安 缠绵入骨,首席老公别过分 我老婆是天后巨星 我在古代当神医颜循韩嫣 撼龙风水师 纪初安唐石谦重生文 我将败掉万亿家产张臻秋淑芬 尊养小夫郎[种田] 我没想当绿茶,真的(快穿) 孤岛上的平行世界III 贤者之王 我是文娱之王陈轩王玲 枭霸娇妻 少帅夫人不准逃顾婠婠霍沉离 野蛮匪夫的小娇娇 战神入赘成首富齐昆仑谢芝真 我,捡破烂成世界首富
她是集万千宠爱于一身的郡主。不顾身份高低信守婚约嫁给他,却落得个家破人亡,死无全尸的下场。一朝醒来,浴火重生。前世你们一层一层撕我的皮,这一世我便一点一点剜你们的心。但首先得要找个由头来退婚。传言,镇国侯家的郡主竟然思慕摄政王多年。百姓真真是有胆大不怕死的,和摄政王定亲的都惨死了,还敢思慕阎王爷。摄政王难得郡主倾心,本王不敢辜负。楚玥我只是借摄政王威名一用。肃奕临郡主莫要害羞,安心待嫁。...
深爱缘于光年字数2149527我的前半生是金丝雀,后半生是商场。酒店里,他夹着烟,吞云吐雾,和我在一起,我来治疗你的…冷淡。她不屑地轻嗤。他们约定好了只婚不爱,各取所需,到底谁动了真感情?...
我是乡村大地主,这里的美女,都是我的!...
叶林一觉醒来穿越到了一个犯罪率极高的平行世界。突然被选中作为最高赏金的素人选手参与一档追捕逃亡类综艺节目。面对的对手不仅仅危险的其他选手,还有来自于全球各地的追捕专家。影后黑客刑警侦探!二十四小时城市大逃亡!豪华游轮惊险游戏!荒岛求生倒计时!别人都是想方设法地避人耳目,逃过层层追捕!叶林却硬生生将反派演绎地淋漓尽致!反追踪伪装术电子学离间计全球直播上,观众看着叶林的操作纷纷震惊。你管这叫人类?...
人人都羡慕叶晚一个哑巴能嫁给A城女人的梦中情人秦正霆。只有叶晚知道,那是无尽折磨。他与别的女人夜夜笙歌,她却被迫陪他的客户。她是别人眼里的荡妇,每晚为他独守空房。直到秦正霆的真爱回归。那个忍气吞声的哑巴叶晚忽然...
暗杀没有那么容易,女皇自有她的脾气。朕有九条命,一条你也别想拿走。...