作者 Jean-Louis Queguine
郭一璞 編譯
量子位 出品 | 公眾號 QbitAI
在對技術毫無了解的人看來,人工智能是什麽?
【流浪地球】裏的AI語音助手MOSS麽?還是【終結者】裏的天網?
如果對當今人工智能的主流技術—— 深度學習 沒有了解,可能真的會有人覺得,當前的科學家們在創造無所不能、無所不知的電影AI形象。
那麽,如何用最淺顯的方式,給大眾解釋什麽是深度學習呢?
法國博主Jean-Louis Queguiner撰寫了這篇【給我8歲的女兒解釋深度學習】,以用深度學習技術搭建辨識手寫數碼的神經網絡為例,用清晰的方式,解釋了深度學習的原理。
這些數碼每個人的寫法都不一樣,要如何讓電腦判斷出這些手寫體數碼是幾呢?
1、和數數一樣簡單
首先,考慮到0~9這十個數碼,本身也是存在各種筆畫的,那我們就拆解開來,看每個手寫體數碼裏,有多少橫豎撇捺,曲折彎彎。
左邊豎著的一列是是個數碼,上方橫著的紅色字元則是拆解出來的筆畫,用這個表格,來統計每個字元裏有多少個相應的筆畫。
現在,我們來寫一些新的數碼,然後數一數,這些新寫的數碼裏,有多少個紅色的筆畫,和上方的表格對比一下,就能判斷出這些新寫的數碼是幾了。
比如,第一個數碼裏,有一個「 / 」,一個「丨」,我們發現有這種特征的,是「1」這個數碼,而且完全符合,那第一個數碼就是「1」。
第二個數碼,上下左右半圓各有2個,另外還有一個「 / 」,一個「丨」,總共10個筆畫。比較之下,會發現上表中的數碼「8」有8個筆畫符合,數碼「9」有6個筆畫符合,那麽這第二個數碼就是「8」。
看懂這一步,那恭喜你已經搭建了世界上最簡單的辨識手寫數碼神經網絡。
2、影像即矩陣
矩陣這個概念,大部份8歲的小學生肯定是沒學過的,可以簡單的理解為一串橫豎的格子裏,每個放一個數。
.css-19xugg7{position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);} < style data-emotion-css="12cv0pi"> .css-12cv0pi{box-sizing:border-box;margin:0;min-width:0;height:100px;-webkit-box-pack:center;-webkit-justify-content:center;-ms-flex-pack:center;justify-content:center;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;position:absolute;width:100%;bottom:0;background-image:linear-gradient(to bottom,transparent,#ffffff 50px);} style>