郭朝暉:工業大數據時代的建模技術與藝術

郭朝暉:工業大數據時代的建模技術與藝術

【加入工業互聯網研習社,與230+社友構建工業互聯網認知體系】

郭朝暉:工業大數據時代的建模技術與藝術


文 | 郭朝暉,蟈蟈創新隨筆


討論技術問題時,常常會問:“A增加1時,B會增大多少?”。這個問題背後,其實反映了人們習慣的一種“線性思維”。微積分中的“導數”就體現了這種思維。嚴格來講,這種思維是有侷限性的,存在“不可導”的現象。然而,大多數的現實問題在多數情況下是“可導”的。這種普遍性的存在,是“微積分”能成為重要的數學分支的原因。

運籌學中有個著名的方法叫做“線性規劃”。這個方法是美國人丹齊克(DantzingDantzing)提出的。當他介紹這個方法時,受到有位著名數學家的質疑:世界是非線性的,線性規劃有什麼用?對於這個問題,年輕的丹齊克被問懵掉了,站在臺上說不出話。這時,聽眾中有位長者舉手,代他回答這個問題:“如果你遇到的問題是線性的,你就用這個辦法;如果不是,你再想別的辦法。”而這位長者就是著名數學家馮.諾依曼。

線性與非線性的矛盾一直困擾著人們。但是,兩者卻也能有機地結合。我們知道:微積分適合大量的非線性函數。兩者的關係是:“可導”是局部的特點,“非線性”是大尺度或全局性的特點。事實上,數學和工程科學上遇到非線性問題,往往會被人們轉化成某種意義下的線性問題——線性特點實在是太好了,離開這個特點的研究幾乎寸步難行。

這個困惑同樣也擺在工程師面前。

工業上絕大多數問題都是非線性的:比如鋼材的成分、工藝參數與性能之間的關係就是非線性的。如果工程對象是線性的,數據建模就是非常方便的——只要線性迴歸就可以了。然而,現實中的模型往往既不是線性的、還不知道該如何描述非線性。

這就是數據建模的困惑和魅力所在。

我常說:理論是解決方向性的問題。其實,只有當我們遇到非線性問題時,“方向性”才是個問題

。然而,解決“方向性問題”的方法,往往不能解決“落地的問題”。因為落地的問題往往是細活——所謂細節決定成敗。具體到模型,往往是精度決定好壞。

某種意義上說,工業對象的建模是一門藝術:是“方向性問題”和“落地問題”的融合。

昨天(8月9日)在攀枝花,我把建模問題比作“打高爾夫球”。打球可能會分成幾個階段:首先用力打、把球打到一個差不多的地方。接著要瞄準方向、用好力氣,甚至可能要經過幾次調整,直到把球打進洞裡。

對於工業過程的建模,一般也要先找到一個差不多的初始工作點:這個工作點一般是通過經驗和宏觀的理論得到的——有經驗的專家腦子中中往往有一個說不清楚的非線性模型。有了這個“工作點”以後,大尺度的全局問題就變成了小尺度的局部問題,就可以近似“線性”了。人們再在這個工作點附近進行實驗、調整,就容易多了。而工程師的水平在於可通過比較少的實驗來解決問題。

控制論之父維納有個著名的思想:“反饋修正”。他認為模型總是有誤差的,關鍵是要進行修正。在修正的過程中,方向往往是理論給出的,而修訂的大小卻往往要用數據進行修正。

我的經驗是:數據建模切忌“急於求成”,希望有個好的模型一下子解決問題。一個好的模型一定是通過反覆修正得到的,關鍵的問題是如何反覆修正、如何儘量少的修正。換句話說,數據建模來不得“大躍進式”的急功近利。善於反覆修正,才體現工匠的水平和精神。

現實中,如果不依靠人的經驗,往往很難用理論和數據來摸索到這個比較好的“初始工作點”。進一步利用理論和數據建立模型,往往能做得比人更好。這就是數據建模的價值所在。

而大數據的作用,往往能把以往人的成功經驗用數據記錄下來,自動地找到一個比較好的“初始工作點”。我們不必關心經驗怎麼來的,這就是大數據“不糾結於因果”。由於大數據具有“樣本=全體”的特點,無論各種情況,好的初始工作點幾乎總能找到。而數據涉及到各種方面的信息、容易幫助人們找對,這就是大數據“混雜性”帶來的優勢。這就是大數據(數據的二次應用)對建模的作用。

郭朝暉:工業大數據時代的建模技術與藝術

12月16日,工業互聯網研習社沙龍第5期歡迎你哦~



【工業互聯網研習社&造奇智能新媒體】國內較早成立並開展運營的智能製造產業新媒體及內容服務、社群運營機構,聚焦新工業革命與智能時代的價值創造,以“深度影響智能製造進程,守望智能製造產業成長”

為使命,聚焦智能製造、工業互聯網、工業4.0、數字化轉型及人工智能、大數據技術在工業領域的應用。憑藉有洞見的思考觀點,在產業界獨樹一幟。

聯接產業企業、大學、研究機構、政府、資本等產業核心力量,通過創新和融合力量,打造深度觀察、行業洞見、豐富資訊於一體的原創型、產業新媒體平臺,憑藉有洞見的思考觀點,在產業界獨樹一幟。

2018年1月1日,[造奇智能]新媒體獨家推出、業界首份聚焦工業互聯網領域的高質量實名付費社群——工業互聯網研習社。致力於打通工業互聯網從資訊→信息→知識→認知→見識的鏈式通路,助力您的職業發展和機遇把握。

“研習社社友”遍佈上海、北京、深圳蘇州、杭州、武漢、蕪湖等工業重鎮,初步構建起覆蓋工業互聯網平臺、工業軟件、底層數據採集、工業數據分析、系統集成商、大學及產業資金、產業聯盟在內的全國價值網絡。


分享到:


相關文章: