北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

編者按:本文作者在高校大數據教育教學領域擁有相對成熟的教學經驗、獨到的教育觀點及創新的教學方法。作為

全國高校人工智能與大數據創新聯盟常務理事,積極推進大數據教育教學工作,本文內容根據作者在"賦能大數據教育專題"分享的內容整理而成,旨在為2020年高校數據科學與大數據技術專業、大數據管理與應用專業、大數據技術與應用專業賦能。

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

北京郵電大學副教授 傅湘玲

關於大數據在企業管理中的應用我們要回答的主有四個問題:第一,這些數據說明了什麼問題;第二,這些數據從哪裡來;第三,我們得出了什麼分析結果;第四,在結果中得到了什麼啟示。要實現大數據在企業管理決策中的應用,一方面是要有好的數據支撐,另一方面則需要經典的管理理論的應用。只有數據與經典理論結合起來,才可能會形成新的管理決策的應用和模型,這是對大數據與企業管理決策的理解。

分享五個案例:第一是基於海量的互聯網數據的新產品開發決策;第二是基於海量互聯網數據的競爭產品分析;第三是基於企業社交網絡的員工潛力測量研究;第四是利用公眾博客文本進行公眾幸福感測量;第五是基於微博數據的新聞線索發現。

一、基於海量的互聯網數據的新產品開發決策

即如何在線評論中幫助企業的產品設計師更好地設計產品。傳統的新產品設計一般是通過問卷的方式進行,用戶買了產品之後,會留下很多評論,這種評論實際上代表了用戶的需求,我們能否將這些用戶需求轉變為產品設計師的維度用戶需求,從而改進產品設計。我們能否將經典的卡洛模型用在在線評論分析之中,從而實現智能及時地實現新產品的改進。如針對手機產品的評論所做的二次開發過程中,手機新產品開發過程中如何利用在線評論提取其需求,從而幫助設計師更好地改進產品設計。

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖1-技術路線圖

在上述的技術路線圖中,首先是做一個數據調研,從京東、淘寶、新浪微博中提取我們需要做的手機評論數據,本研究中我們選取了十款需要分析的手機型號,從京東等網站上進行數據的爬取。獲取到數據之後,在技術路線圖中可以看到進行了數據的預處理,其中包括評論的去重,當然還有一項很重要的工作,即樣本的有用性人工標記,其實對產品設計師而言,有些評論對產品設計師沒用,但對消費者有用。做完樣本的有用性標記之後,進行有用性模型訓練,同時在大量的評論中構建了一個需要提取的特徵、情感、機型,因此在技術路線中,構建了特徵詞庫、情感詞庫、機型詞庫,在此基礎上構建手機的主題模型,主題模型是指構建一個詞對,比如手機的待機時間較長,接著進行情感的分析。做完這項工作後,再結合管理中的卡洛模型進行客戶需求分析。卡洛模型中提到客戶的滿意包括基本需求,期望需求和驚喜需求,我們根據用戶效用值的大小進行排序,得到用戶的1)基本需求:版本、功能、外觀、物流及售後、其他;2)期望需求:處理器及配件、屏幕、信號及發熱、相機;3)驚喜需求:電池、價格、手感、系統。對此我們也提出相應的管理建議:對於基本需求,管理建議:保證符合服務標準,努力降低產品故障率和服務失誤率;對於期望需求,管理建議:不單是考慮符合服務標準,而是如何提高服務標準。同樣對於驚喜需求,管理建議:首先保證另外兩類需求,開發新服務,增加新內容。

二、基於海量互聯網數據的競爭產品分析

在產品評論中存在不同產品間的各種不同屬性特徵的比較,在此基礎上我們提出了另外一個概念——產品在線聲譽。產品的在線聲譽分為產品美譽度和知名度。美譽度又從屬性美譽度和屬性權重兩個角度進行考慮。就屬性的美譽度而言,前面的過程中提取了手機的每個屬性特徵,如電池、屏幕、內存等,對每個屬性都有一個評價的矩陣值,即一條評論中對某個屬性的效用值,據此計算出屬性的美譽度,接著對屬性的權重進行計算,便可得出第i條評論對某個產品屬性j的評價,從而測量出不同產品的在線聲譽。在此案例中,我們針對四款手機進行了研究,分別為:華為、IPhone、三星、聯想。

得出的結果大家在這個圖中可以看到:

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖2-手機產品美譽度對比

① 三星 N7108的各個屬性的美譽度均在最外圍(價格除外),即美譽度高; ② 聯想A820T的各個屬性的美譽度均在最內層,即美譽度最低; ③ iphone 4S的大部分屬性的美譽低於三星 N7108 (價格除外),卻高於華為 G520 (相機 、外觀和屏幕除外),因此,從屬性美譽度層面來看,三星 N7108表現較好,最好能再適當下調點價格,聯想A820T整體上都需要提升。

三、基於企業社交網絡的員工潛力員工潛力測量研究

人力資源管理中企業員工的潛力研究一般基於問卷進行,在這裡我們希望通過企業內部社交網絡的數據來進行員工潛力的測量研究。我們選取了某企業社交網絡中員工的社交數據,在此基礎上將員工的潛力分為了協調潛力和知識潛力兩個維度。在此基礎上進一步細化構建了每個細化的指標測量方法。通過對文本數據的分析與挖掘,量化測量出每個指標的值,從而進行員工潛力指數的測量研究。

四、利用公眾博客文本進行了公眾幸福感測量

能不能利用文本進行量化的幸福感的測量呢?傳統的做法是Watson教授提出來的PANAS量表,通過問卷的方式測量某個人的幸福感。但這種量表的方式無法實現大規模、可重複、無干擾的測量,也就是說,很多人在測試時未反映出真實的感情。因此,要實現無干擾環境下大規模、可重複的測量,則需要一個更好地可以利用海量客觀數據的自動化方法測量公眾的幸福,我們做了一個測量幸福感的模型,主要是從某一篇博文中出現的情感詞數量及頻率在整篇文章中所佔的比例。其中有一個很大的問題,即中文的情感詞庫需要量化,傳統的詞庫很多隻有正面和負面,對每一個情感詞並沒有得分的比較,這是工作過程中很大的一個難題,英文中有公開的詞庫,經過多方努力,我們找到了Ren詞庫。

可以看出,我們模型的結果與實際情況是比較符合的,我們對歷史已經發生的事件和現在模型的結果對比是可以對應的,這是我們對公眾幸福感利用博客文本做的結果和重大事件的對比。同樣,我們也做了周、年的比較,將六年中每年的數據進行對比後發現,每年的二月份是情感較高的,由於二月份有春節,春節後幸福感開始下降,同時十一也是如此。在周的對比中,週一較低,週二較高,由於工作比較疲憊,週三比較低,由於看到週末了,週四之後又開始上升。這是關於重大事件的對比、每年高峰低峰的對比以及一週的對比。

因此,在這個研究中,我們將經典心理學的主觀幸福感測量(PANAS量表),利用互聯網中大量非結構化數據設計了一個新的幸福感量化模型,實現了對社會公眾幸福感的實時動態監測。

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖3-2008-2013中國公眾幸福感變化與重大社會事件對照圖

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖4-2008-2013中國公眾幸福感變化對比圖

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖5-中國公眾幸福感一週變化趨勢

五、基於微博在線數據的新聞線索挖掘

北京郵電大學副教授傅湘玲:基於大數據管理決策的五個案例比較

圖6-技術路線圖

目前來看,記者也是通過博客、社交網絡大量的發現新聞線索,如通過微信群、QQ群、微博等發現有哪些熱點發生,根據自己的知識判斷,這有可能是一個值得深究的會成為一條新聞的消息,在此過程中可能瀏覽過一萬條微博才發現一條值得調研和採訪形成新聞的內容,我們稱之為新聞線索。首先,我們構建了一個新聞線索的新聞價值模型,其中提高了線索的重要性、異常性和權變性。在構建了新聞線索後,我們聽取了新華社、人民網的記者,以及一些新聞專家、公眾的看法,進行了模型的改進,在技術路線圖中可以看到,一方面是構建新聞價值線索模型,另一方面是從數據中找到新聞線索,在數據準備階段,主要利用了微博,對微博事件進行了事件觸發抽取、命名實體識別、時間表達抽取、事件後果抽取,由於在新聞價值模型中發現,這四個要素對新聞價值的評價是有用的,對這四個特徵進行抽取後,構建了微博事件信息庫和訓練集、測試集,從而進行新聞價值模型的計算,這個計算過程中也進行了模型的計算和調整。以交通事故為例,通過這個過程可將某一天與所有交通有關的微博信息、新聞提取出來,並對其價值進行評分,在評分過程中,新聞事件的排名越前價值越高。對新聞記者而言,現在只需要看一千條微博便可以篩選出新聞報道的線索,減輕其工作量,從而更好地評價微博數據中可能存在的新聞線索。

以上便是五個方面的案例,其實數據是一個方面,經典管理模型的應用是第二個方面,將模型和數據結合起來,可以判斷需要哪些數據、數據說明了哪些問題,以及這些數據分析如何應用到管理決策之中。

傅湘玲:畢業於北京大學,獲得管理學博士學位,現任北京郵電大學軟件學院副教授,北京郵電大學社會化網絡信息管理與服務中心副主任; 全國信息技術標準化技術委員會SOA標準工作組專家成員。主要研究方向:社交網絡分析。


分享到:


相關文章: