數據的基本形態與作用

你好,感謝你打開產品Desginer;

今天是2020年2月2日星期日,農曆正月初九;

今天我要與你分享的是,數據的形態和基礎應用。

數據的基本形態與作用

數據長什麼樣?

數據大致可分為:表格數據、圖片數據、音頻數據、文本數據這麼常見的四種。


1、表格數據

數據的基本形態與作用

表格就是由若干行與列所構成的一種有序的數據組織形式。

表格的列一般表示參數、特性、屬性,具體可以是不同的數據類型(如數字、文本、日期等);

表格的行:同樣數據形式的不同記錄;

每一行與每一列交匯成為一個單元格。


2、圖片數據

數據的基本形態與作用

圖片的每一個像素點都可以被轉換成一個或幾個數字(如果是黑白照片就一個數字用來表示灰度,如果是彩色照片則可以轉換成3-4個數字,RGB模式為3個數字,CMYK模式為4個數字)


3、音頻數據

數據的基本形態與作用

聲音數據可以被轉換成數字化的聲波數據,橫座標表示時長,縱座標表示每個時間點聲音強度的大小


4、文本數據

最普通的文本數據就是文章,可以轉換成數據結構為:標題、作者、內容、多媒體(插入的圖片、音頻、視頻等),用以做下一步的數據分析。


數據的作用

數據的作用是存證,存在過必有痕跡,有了這些痕跡,我們就可以通過科學的查找方法,將所有我們需要的痕跡統計起來,進行數據分析,從而清楚問題、找到問題、驗證問題、解決問題。


數據分析的實例

之前網上曾流傳過這樣的說法,“很多在北京生活的人認為,今天有沒有霾,與今天風夠不夠大有關,大風一來,霧霾就散。”

“大風一來,霧霾就散。”這句話到底有沒有科學依據,下面我們用數據分析來分析一下。

數據的基本形態與作用

首先,我們需要拆解一下這句話,有三個問題就要解決:

1、多大的風,叫大風?

2、什麼叫霧霾?

3、霧霾減少多少,叫霧霾散了?


其次,我們明確一下概念,回答下上面的三個問題:

1、大風:通過查詢數據,得知2014-2016年這三年來,風力超過4級的有102天,約佔10%,我們把風力大於4級,定義為大風。

2、霧霾:PM2.5值,作為定義霧霾的具體指標。


根據上面兩個詞的定義,我們可以問出這個一個問題,北京2014-2016的那3年中,風力大於4級的那些天中,PM2.5值是否比其他時間有所下降?


根據統計分析得知,風力大於4級的那些天裡,PM2.5值是有顯著降低的,具體為2014-2016年,北京平均日PM2.5值為102,而在風力大於4級的時間裡,PM2.5值為40,降低了62。


所以“大風一來,霧霾就散。”這句話是正確的。


分享到:


相關文章: