從入門深度學習到能發頂會，你用了多久?

2022-02-10知識

用多久本身沒有意義你的思路從根上就錯了

我記得超級電腦界大佬David Keyes跟我說過 研究有兩類一類是把本來無法解決的問題解決了另一類是把已經解決的問題解得更快更好 只有第一類是真正地significant

「不知道怎麽改網路結構」「想不到一些能夠提升網路效能的idea」說明你沒有做第一類研究就算你把accuracy或者別的效能提升1-5% 也只是把本來就能辨識影像的模型變得更能辨識影像

做研究之前 先假設你就算真的做出來了又有什麽意義 這樣才能明白什麽是核心問題

舉個例子 normalization layer出來之前人們無法訓練很深的網路 train loss都降不下去更別提test loss了這個工作解決了一個重要的問題我們有了真•深度學習

再舉個例子在何凱明大神的ResNet出現之前盡管深層網路能學的動了但是degradation問題出現了：深層的網路可能會比淺層的generalization更差這個工作讓我們疊加層數可以提升效能可以得到有效的深度學習

具體來說你先得了解深度學習這個 系統：網路結構（forward）導數傳播（backward）最佳化器最佳化問題特征工程等等

每一個模組都有很多關鍵問題比如adversarial robustness屬於最佳化問題用minimax問題去學（就是adversarial training）就能學到穩健的網路不用就非常脆弱；再比如differential privacy屬於最佳化器和backward問題用privateSGD就能保護私密不用就不能

你能不能找出一個問題現有的方法不行而你的方法能解決？只要找到一個問題不一定需要改網路結構也不用追求很好的效能因為已有的方法效能是0% 你只要解決了效能再差也比0%強（比如私密領域至今CIFAR10準確率沒過70% 不妨礙開坑文爆紅）

Novelty is all you need