11.19 人工智能從業者：大牛，工程師和調參狗科技頭條網

2019-11-19 11:18:00 碼農三哥

你眼中的他和他眼中的他是不是同一個人。

今天準備來點兒乾貨。

你要問這兩天什麼火，每個產品經理都會告訴你人工智能和區塊鏈。很多人都還沒搞明白這些東西是什麼，能解決啥問題，就已經懷著一身熱情撲了進去，生怕錯過下一個微信。你果哥也是個沒事兒就喜歡焦慮的人，想了三天三夜，決定去做個人工智能的落地產品，就把人工智能領域裡的專家教授扒了扒，看看他們都是在做什麼。

這裡面的第一類人，是學術界的大牛。人工智能其實是一門比較老的學科，上世紀4、50年代就出現了，但進展一直比較緩慢。這幾年有點噴薄的趨勢，一方面算力跟上來了，另一方面學術研究起了很大的作用。大家看很多入門書，講迴歸分析、聚類，反向傳播，支持向量機，一大堆公式定理，涉及矩陣、概率、求導，都是學術界的工作。

隨著理論的發展，很多神經網絡模型被提出來然後完善。最基礎的圖像任務，識別定位檢測，有幾十個經典的CNN模型可以選。自然語言處理，從RNN到LSTM，記憶力越來越強。往往學術界一篇文章，可以帶來一個領域的繁榮，比如這幾年很火的對抗網絡，現在已經能幫你把片兒裡的女演員換成你老婆gaki了。

這裡面第二類人，是工業界的工程師。理論的落地，離不開工程的實踐。工程上大致有兩部分，一類是各種深度學習框架的開發，一類是AI產品的研發。

其實一開始的時候，並沒有什麼框架，大家徒手搭神經網絡，卷積運算，梯度更新全都自己解決。後來有大牛站出來，說乾脆我給你們寫一個框架，把這些基礎的、都用的著的、需要極致的運算速度的東西做了，你們資詞不資詞啊？

於是一下子出來很多框架。G家的tensorflow，基於Python和C++，很流行，但是實際上用起來並不咋地，對新手不友好，調bug不容易。tensorflow算是比較低級的框架，還是要寫很多無用的代碼，keras框架更上一層，基於tensorflow，幾行代碼就能搭起一個神經網絡。大牛賈清揚的caffe，元老級的框架，封裝的非常好，速度很快，社區也很活躍，但是，我咧個神哩，安裝起來那叫一個費勁。現在在做caffe2，據說對移動端支持比較好。FB的Torch，學術界用的比較多，主要是它基於Lua，把我們這些培訓班學python出來的鄙視慘了。

都說未來是AI的時代，這裡面有個很重要的前提是要有殺手級的產品落地。現在落地比較好的，一個是一些推薦系統，已經從傳統的過濾算法，邁向了深度學習的路子。除此之外，如果C端不夠成熟，從B端切入也是個不錯的思路。

最後再說說，人工智能領域，還有一群從業者躲在牆角瑟瑟發抖，那就是大家說的調參狗。一個神經網絡從理論到落地，有這麼幾個階段，一個是模型構建，就是把別人論文裡的網絡搭建起來。然後是模型訓練，把自己需要的數據準備好，然後部署到顯卡上去跑，這個過程有很多參數要調，很玄，屬於老中醫看病，全靠經驗，妙，不可言。一名調參狗的日常是這樣的：

調參狗接到需求，第一件事就是去github和各種框架的model zoo上當搬運工。調參狗沒有設計網絡的能力，如果github上沒有，就只能看論文動手擼了，不僅費時費力，出了bug還得到處求人。