07.18 用大數據講故事—未來媒體必備技能

用大數據講故事—未來媒體必備技能

世界上每秒鐘有290萬封電子郵件被髮出、每分鐘有20小時的視頻上傳至Youtube、每天有5千則推文發送、人們每個月花7千億個小時在臉書上。我們身處於行動互聯網時代,花費相當多的時間在互聯網上活動,也因此產生出大量的個人數據。這些數據被拿來做各種用途,根據國際研究機構Gartner預估到2015年時,海量數據需求將在全球創造440萬份工作機會,其中能找出數據價值的數據科學家(Data Scientist) 和能將各種數據轉化成好看又易懂的圖像設計師將會是最搶手的人才。

《紐約時報》有專門的數據科學家和圖像設計師,新聞學教授也出書教你什麼是數據圖像化?又該如何應用? 這些都在說明未來媒體必須順應此趨勢,用數據來說故事做新聞。

能夠挖掘大數據裡金礦的數據科學家,能將非結構化的訊息收集並過濾產生有用的數據,並進一縱將這些數據進行分析解讀成有意義結構化訊息。數據科學家需要具備三種技能:首先必須要有深厚的統計學和數學背景;第二,必須要有開發程式軟體的能力;最後,必須擁有某一個產業、領域的專業知識。這三種技能分開來看已相當有份量,若結合在一起就可以創造更大的價值。

《紐約時報》就有一個數據科學家的好案例:傑爾.索普(Jer Thorp)是一位在數學、媒體和藝術交叉路口工作的數據科學家,他任職於《紐約時報》研發實驗室,有一個很酷的職稱叫「數據藝術家」 (Data artist in residence) 。索普同時也是紐約大學互動電子媒體學程的副教授和創意研究院的聯合創辦人。他本來是位藝術家,後來開始寫程式。在實驗室裡索普不斷地尋找與數據互動的新方式,並且思考怎麼樣能把這些數據和《紐約時報》做有意義的聯結。索普和他的團隊在2011年開發了一個名為Project Cascade的視覺化數據分析工具,這個工具可以分析《紐約時報》每一則新聞是如何在Twitter上被傳遞。

Cascade的概念是這樣:《紐約時報》每個月約有6500則新聞發佈,他們發現讀者不論是出於喜歡還是覺得這個訊息有用,多半習慣將自己在紐時看到的文章轉發到自己的Twitter上,大多數人還會附上140字以內的評論。要怎麼知道讀者是基於什麼原因將文章轉發出去、以及這些推文在社群上造成影響?藉由Cascade就可以進行深入分析。Cascade會針對一則新聞找出它在Twitter上被轉發的多個節點,進而瞭解這則新聞在Twitter上被傳遞是基於內容還是因為分享者的影響力。好比說,他們曾發現一則在講美國經濟的新聞被多次轉發,原來是因為轉發者是網路大師Tim O'Reilly。他們也曾發現一則不起眼的健康文章在談論休假的重要性被猶太牧師們大為轉發,猶太牧師在轉發文章同時還發文說:「請好好善待你的牧師,因為我們無法在週末休假!」。透過數據分析《紐約時報》希望能找出更多讀者與每篇文章的關係以及廣告可以精準投放的地方。

數據分析很重要,但要怎麼樣呈現數據則是一門大學問。視覺傳達是人們共同的第二語言,「一張圖勝過千言萬語」,這麼多數據資料若能用視覺化圖像來傳達將會使讀者更容易吸收數據背後的意義。資訊圖表(Infographic) 就是由資訊(Information)和圖像(Graphic)所組合而成,意即將數據資料運用圖像做為媒介來陳述一個故事。坊間有許多現成的數據圖像化的工具,從基礎簡單的Excel到需要寫程式專業級的Gephi,目的只有一個就是讓數據能夠清楚地被呈現出來。

許多人會認為數據圖像化只是美術和設計,漂亮的圖像就是好的資訊圖表。其實美感只是其中一個要素,好的數據圖像需要包含正確、有價值和具教育性的內容,最好還要帶一點趣味性來吸引觀眾。邁阿密大學新聞學系教授亞伯特.開羅 (Alberto Cairo)在2012年就出了本名為The Functional Art: an introduction to information graphics and visualization 一書來教你什麼是數據圖像化,書中再三強調數據圖像化是技術而不是藝術。

開羅教授認為數據圖像化是幫助人類解讀各種數據並達到目的工具,是由許多方面來組成並不是一門單一學科。比方說地圖設計原則屬於製圖法、圖表上呈現數據的守則屬於統計學、圖表的類型、佈局和顏色的守則屬於視覺設計、寫作技巧原則屬於新聞學、軟體製作屬於程設設計……。

開羅教授在書裡舉了《國家地理雜誌》為例說明媒體運用數據圖像化來說故事。2011年底地球人口達到70億,所有的媒體都在想要怎麼報導這件事《國家地理雜誌》也不例外,他們想盡辦法要跟其他媒體做區隔,不想只是做一般性人口統計的報導。他們思考到底什麼能代表70億人口? 雜誌最後利用數據的統計分析出最能代表70億人口原來是一個28歲的漢族男子。他們分析全球人口的年紀、性別、種族和國家,發現這個世界上最多的一個族群就是28歲的漢族男子,但這個男子沒有畫面供人想像,因此《國家地理雜誌》的圖像專家連絡北京中科院,收集了19萬張28歲男子的大頭照,最後拼成了一張代表70億人口的臉,這篇報導吸引了更多讀者閱讀,並區隔《國家地理雜誌》與其他媒體的報導。

不管是數據分析還是數據圖像化,都說明大數據環境下挖出更多有價值的內容、並善呈現的重要性。也許有人會問:這些將數據圖像化做得好的媒體都是大型媒體,小型新聞媒體該怎麼做? 其實就像前面提到的數據圖像化只是一個工具,最重要的還是那些數據背後內容的報導和新聞性,用數據說故事的人必須要充滿好奇心和對新聞有感的媒體人,而視覺圖像化要放在情境脈絡裡才有意義。


分享到:


相關文章: