11.19 人工智能從業者:大牛,工程師和調參狗

人工智能從業者:大牛,工程師和調參狗

你眼中的他和他眼中的他是不是同一個人。

今天準備來點兒乾貨。

你要問這兩天什麼火,每個產品經理都會告訴你人工智能和區塊鏈。很多人都還沒搞明白這些東西是什麼,能解決啥問題,就已經懷著一身熱情撲了進去,生怕錯過下一個微信。你果哥也是個沒事兒就喜歡焦慮的人,想了三天三夜,決定去做個人工智能的落地產品,就把人工智能領域裡的專家教授扒了扒,看看他們都是在做什麼。

這裡面的第一類人,是學術界的大牛。人工智能其實是一門比較老的學科,上世紀4、50年代就出現了,但進展一直比較緩慢。這幾年有點噴薄的趨勢,一方面算力跟上來了,另一方面學術研究起了很大的作用。大家看很多入門書,講迴歸分析、聚類,反向傳播,支持向量機,一大堆公式定理,涉及矩陣、概率、求導,都是學術界的工作。

人工智能從業者:大牛,工程師和調參狗

隨著理論的發展,很多神經網絡模型被提出來然後完善。最基礎的圖像任務,識別定位檢測,有幾十個經典的CNN模型可以選。自然語言處理,從RNN到LSTM,記憶力越來越強。往往學術界一篇文章,可以帶來一個領域的繁榮,比如這幾年很火的對抗網絡,現在已經能幫你把片兒裡的女演員換成你老婆gaki了。

這裡面第二類人,是工業界的工程師。理論的落地,離不開工程的實踐。工程上大致有兩部分,一類是各種深度學習框架的開發,一類是AI產品的研發。

其實一開始的時候,並沒有什麼框架,大家徒手搭神經網絡,卷積運算,梯度更新全都自己解決。後來有大牛站出來,說乾脆我給你們寫一個框架,把這些基礎的、都用的著的、需要極致的運算速度的東西做了,你們資詞不資詞啊?

於是一下子出來很多框架。G家的tensorflow,基於Python和C++,很流行,但是實際上用起來並不咋地,對新手不友好,調bug不容易。tensorflow算是比較低級的框架,還是要寫很多無用的代碼,keras框架更上一層,基於tensorflow,幾行代碼就能搭起一個神經網絡。大牛賈清揚的caffe,元老級的框架,封裝的非常好,速度很快,社區也很活躍,但是,我咧個神哩,安裝起來那叫一個費勁。現在在做caffe2,據說對移動端支持比較好。FB的Torch,學術界用的比較多,主要是它基於Lua,把我們這些培訓班學python出來的鄙視慘了。


人工智能從業者:大牛,工程師和調參狗

都說未來是AI的時代,這裡面有個很重要的前提是要有殺手級的產品落地。現在落地比較好的,一個是一些推薦系統,已經從傳統的過濾算法,邁向了深度學習的路子。除此之外,如果C端不夠成熟,從B端切入也是個不錯的思路。

最後再說說,人工智能領域,還有一群從業者躲在牆角瑟瑟發抖,那就是大家說的調參狗。一個神經網絡從理論到落地,有這麼幾個階段,一個是模型構建,就是把別人論文裡的網絡搭建起來。然後是模型訓練,把自己需要的數據準備好,然後部署到顯卡上去跑,這個過程有很多參數要調,很玄,屬於老中醫看病,全靠經驗,妙,不可言。一名調參狗的日常是這樣的:

調參狗接到需求,第一件事就是去github和各種框架的model zoo上當搬運工。調參狗沒有設計網絡的能力,如果github上沒有,就只能看論文動手擼了,不僅費時費力,出了bug還得到處求人。

人工智能從業者:大牛,工程師和調參狗

模型搭好了,調參狗開始徹夜整理數據。你果哥有句話常常掛在嘴上,就是有多少人工,就有多少智能。很多時候大家用的模型是一樣的,你牛逼就牛逼在有高質量的標註數據。實在沒有?威脅老闆買買買啊。

數據準備好了,調參狗就開始調參了。嗯,先用默認值來一遍,不行,試試小一點的LR呢?不行,換個initializer試試?艾瑪,一不小心過擬合了,快快快,加大正則,加大正則還有救。


分享到:


相關文章: