美猴王的第七十三變:大數據分析

西天取經,孫悟空一路護法,歷經八十一難,終成正果。他能踏平坎坷成大道,靠的是什麼?一個字:識別。你看,不管是天上的神仙假扮成人間的怪物,還是菩薩的嘍囉變幻成佔山的大王,孫悟空的火眼金睛都能一一識別,鬥罷艱險又出發。


美猴王的第七十三變:大數據分析

西遊路線圖

隔行如隔山,但隔行不隔理。搞大數據,與西天取經是相通的:孫悟空西天取經,一路護法靠識別;其實,大數據的挖掘與應用,同樣有一個最基礎的工作——數據識別。

各位看官,且聽分解——

彌勒佛前司磬的童兒在小雷音寺變成黃眉大王,悟空的火眼金睛因為看到山上“禪光瑞靄之中有些凶氣”而一眼就識別出來。這其實就是大數據中最基礎的識別:數據清洗。

孫悟空與二郎神鬥法變成一座土地廟時尾巴無處安放只能変做廟後的旗杆,二郎神因為“不曾見一個旗竿豎在廟後面的”而一眼就識別出來了。這其實就是大數據識別的一個重要規則:唯一識別碼。

紅孩兒在火雲洞變成一個掛在樹上的小孩,孫悟空先是自己掂了掂發現“七歲小孩兒不足四斤重”,接著把土地老兒叫出來問得“本是牛魔王的兒子”,兩者相連,於是識別出此小孩不是凡人。這其實就是大數據識別的核心:數據連接。

獅駝嶺上的青獅、白象、大鵬攔住了唐僧師徒的去路,孫悟空從山中老人那問得對方的住址,又自己跑到那裡看清了他們的相貌,還飛到天上找如來問清了他們的身世,最終一一識別,化險為夷。這其實就是大數據識別的重要目標:全網識別,生成畫像。

美猴王的第七十三變:大數據分析

欲知詳情如何,且聽細細道來:

悟空識別黃眉大王,靠的是“數據清洗”

孫悟空大鬧天宮後,被二郎神抓回天庭。玉帝下旨,將孫悟空推入八卦爐中,煉成仙丹。悟空在八卦爐中無法招架三昧真火,“他即將身鑽在‘巽宮’位下”。巽在八卦中代表風,有風就沒有火。只是風吹出的煙,把眼睛燻紅了,這就得來了“火眼金睛”。

後來,悟空發現不管對方怎麼變幻,“火眼金睛”都能識別對方真身。

《西遊記》第六十五回,師徒四人忽見山前有座寺廟,唐僧下馬要拜。悟空道:“此處是倒是座寺廟,然而少吉多兇。”唐僧肉眼凡胎,不能識別,篤信“既是寺廟,必定有個佛祖在內”。於是,唐僧一步一拜,孫悟空不僅不拜,反而對廟裡那個看似佛祖的黃眉老和尚“雙手輪棒,上前便打”。唐僧罵道:“潑猢猻!害殺我也!”悟空道:“此佛乃妖王幻化!”

原來,孫悟空早就憑藉火眼金睛,瞧出寺廟的上方“禪光瑞靄之中,又有些凶氣”;到了那寶殿之上,“行者又仔細觀看,見得是假”。孫悟空的“火眼金睛”把採集到的這些零散數據一番清洗,料定此和尚必不是佛祖真身。果然,幾個回合交手下來,最後從彌勒佛那裡得知,廟裡的黃眉大王原是彌勒佛前司磬的黃眉童兒遛到了凡間。

二郎神識別孫悟空,靠的是“唯一識別碼”

不管對方幻化成什麼形象,孫悟空通過火眼金睛都能夠識別出來。但同時,如果對方十分強大,縱使孫悟空會七十二般變化,對方也同樣能把他識別出來。

《西遊記》第六回,二郎神領旨捉拿孫悟空。兩人打了三百多個回合,不分勝負。打鬥期間,孫悟空分別變作麻雀、鷀老、魚兒、水蛇隱藏自己;二郎神逐個識破,並化作老鷹、海鶴、魚鷹、灰鶴一一應對。孫悟空沒法,最後只好“變了一座土地廟兒”。但尾巴不好收拾,“豎在後面,變做一根旗竿”。隨後二郎神趕到,“卻見有一間小廟,急睜鳳眼,仔細看之,見旗竿立在後面”,就知“是這猢猻了!他今又在那裡哄我”。

原來,二郎神“也曾見廟宇,卻不曾見一個旗竿豎在後面的”,於是通過寺廟的旗杆應該豎在廟前而不是廟後這個識別規則,判別出此廟並不是真正的寺廟。果然,二郎神上前恐嚇一二,悟空便化了原形,“撲的一個虎跳,又冒在空中不見”。

悟空識別紅孩兒,靠的是“數據連接”

識別是一個過程,沒有終點。有時僅靠第一方數據無法識別,就需要通過動態連接各種外部數據。在西遊記中,有時對方變化多端,孫悟空只能知道對方不是真身,至於真身是什麼,實在是認不出來。所以,他有時去天上問神仙,有時到地下找土地。你看,在第四十回,就遇到了這麼一種情況——

師徒四人行至火雲洞,聽見有人喊“救命”,見有個小孩被捆著倒掛在樹上。唐僧要孫悟空救下小孩馱著前行,孫悟空只得照做。但他心生疑慮,掂了掂小孩重量,發現“只有三斤十來兩重”,於是問道:“今年幾歲?”小孩說“七歲。”悟空笑道:“一歲長一斤,也該七斤。”便抓過小孩往石頭上用力一扔:“分明是個精靈,變化得這等。”小孩見事情敗露,一陣陰風,捲走了唐僧。

悟空雖然識別了對方,但不知那小孩來歷。他召出土地老爺一打聽,得知對方“本是牛魔王的兒子,乳名叫做紅孩兒”。悟空聽到這話滿心歡喜,因為他還想起另一個信息:牛魔王與他在花果山是結拜兄弟,這紅孩兒應叫他叔父。

孫悟空識別紅孩兒,靠的是數據連接:他自己用手掂量重量,獲得的信息叫第一方實名數據;他找土地老爺問到小孩兒身世,獲得的信息叫第三方實名數據。兩者一連接,就把紅孩兒完全識別出來。

悟空跨越獅駝嶺,靠的是“全網識別”

有的時候,即使有了內部第一方數據,也有了外部第三方數據,讓然還不能完全識別對方。怎麼辦?

《西遊記》第七十四回,獅駝嶺上的青獅、白象、大鵬攔住了唐僧師徒的去路。孫悟空用了更復雜的辦法識別對方。

孫悟空先是從山中老人那得到對方的住址。“此山叫做獅駝山,中間有座獅駝洞,洞裡有三個老妖,專在那裡吃人。”唐僧大驚失色,命悟空去打探虛實。

悟空於是又自己跑到獅駝洞中看清了他們的相貌。“一為青獅怪,生得鑿牙鋸齒;一為白象怪,生得鳳目金睛;一為大鵬金翅雕,生得金翅鯤頭”。

而且,悟空還飛到天上找如來問清了他們的身世:青獅怪的主子是文殊菩薩,白象怪的主子是普賢菩薩,大鵬怪更有來頭,如來說是自己的舅舅:“五臺山文殊、峨眉山普賢,這是老魔、二怪之主。自那混沌分時,鳳凰育生孔雀、大鵬。孔雀出世之時能吃人。我在雪山頂上,早被他把我吸下肚去。是我剖開他脊背,跨上靈山,故此,封他做佛母孔雀大明王菩薩。大鵬與他是一母所生。”

悟空自己獲得的是第一方數據,在山中老人那裡獲得的是第三方數據,這兩類是線下數據;悟空還飛到如來那裡獲得了線上數據。第一方、第三方、線下、線上,將這些數據一一連接,這個過程就叫全網識別,最終生成了360度畫像,化險為夷。


分享到:


相關文章: