作者 Jean-Louis Queguine
郭一璞 编译
量子位 出品 | 公众号 QbitAI
在对技术毫无了解的人看来,人工智能是什么?
【流浪地球】里的AI语音助手MOSS么?还是【终结者】里的天网?
如果对当今人工智能的主流技术—— 深度学习 没有了解,可能真的会有人觉得,当前的科学家们在创造无所不能、无所不知的电影AI形象。
那么,如何用最浅显的方式,给大众解释什么是深度学习呢?
法国博主Jean-Louis Queguiner撰写了这篇【给我8岁的女儿解释深度学习】,以用深度学习技术搭建识别手写数字的神经网络为例,用清晰的方式,解释了深度学习的原理。
这些数字每个人的写法都不一样,要如何让计算机判断出这些手写体数字是几呢?
1、和数数一样简单
首先,考虑到0~9这十个数字,本身也是存在各种笔画的,那我们就拆解开来,看每个手写体数字里,有多少横竖撇捺,曲折弯弯。
左边竖着的一列是是个数字,上方横着的红色字符则是拆解出来的笔画,用这个表格,来统计每个字符里有多少个相应的笔画。
现在,我们来写一些新的数字,然后数一数,这些新写的数字里,有多少个红色的笔画,和上方的表格对比一下,就能判断出这些新写的数字是几了。
比如,第一个数字里,有一个「 / 」,一个「丨」,我们发现有这种特征的,是「1」这个数字,而且完全符合,那第一个数字就是「1」。
第二个数字,上下左右半圆各有2个,另外还有一个「 / 」,一个「丨」,总共10个笔画。比较之下,会发现上表中的数字「8」有8个笔画符合,数字「9」有6个笔画符合,那么这第二个数字就是「8」。
看懂这一步,那恭喜你已经搭建了世界上最简单的识别手写数字神经网络。
2、图像即矩阵
矩阵这个概念,大部分8岁的小学生肯定是没学过的,可以简单的理解为一串横竖的格子里,每个放一个数。
.css-19xugg7{position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);} < style data-emotion-css="12cv0pi"> .css-12cv0pi{box-sizing:border-box;margin:0;min-width:0;height:100px;-webkit-box-pack:center;-webkit-justify-content:center;-ms-flex-pack:center;justify-content:center;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);} style>