R語言實戰(第2版):第二章 創建數據集(01)

注:如在B站看到的文件格式不好看,可以在簡書中搜索“康華同學”即可查看。


R語言實戰(第2版):第二章 創建數據集(01)

2.1 數據集的概念

數據集通常是有數據構成的一個矩陣數組,行表示觀測,列表示變量。表2-1提供了一個假想的病例數據集。


R語言實戰(第2版):第二章 創建數據集(01)

不同行業對數據集的行和列叫法不同。統計學家稱他們為觀測(observation)和變量(variable),數據庫分析師則稱其為記錄(record)和字段(field),數據挖掘是和機器學習學科的研究者則把他們叫做示例(example)和屬性(attribute)。在本書中通篇使用術語觀測和變量。

2、數據結構

R擁有許多用於存儲數據的對象類型,包括標量、向量、矩陣、數組、數據框和列表。它們在存儲數據的類型、創建方式、結構複雜度,以及用於定位和訪問其中個別元素的標記等方面均有所不同。圖2-1給出了這些數據結構的一個示意圖。

R語言實戰(第2版):第二章 創建數據集(01)


R語言實戰(第2版):第二章 創建數據集(01)

3、 向量

向量是用於存儲數值型、字符型或邏輯型數據的一維數組。執行組合功能的函數c()可用來創建向量。

R語言實戰(第2版):第二章 創建數據集(01)

a是數值型向量,b是字符型向量,而c是邏輯型向量.

通過在方括號中給定元素所處位置的數值,我們可以訪問向量中的元素。例如,a[c(2, 4)]用於訪問向量a中的第二個和第四個元素。

R語言實戰(第2版):第二章 創建數據集(01)

4、矩陣

矩陣是一個二維數組,只是每個元素都擁有相同的模式(數值型、字符型或邏輯型)。可通過函數matrix()創建矩陣。

R語言實戰(第2版):第二章 創建數據集(01)

其中vector包含了矩陣的元素,nrow和ncol用以指定行和列的維數,dimnames包含了可選的、以字符型向量表示的行名和列名。

4.1 創建矩陣

創建5x4的矩陣

R語言實戰(第2版):第二章 創建數據集(01)

按行填充2x2的矩陣

R語言實戰(第2版):第二章 創建數據集(01)

按列填充的2×2矩陣

R語言實戰(第2版):第二章 創建數據集(01)

我們可以使用下標和方括號來選擇矩陣中的行、列或元素。X[i,]指矩陣X中的第i行,X[,j]指第j列,X[i, j]指第i行第j 個元素。選擇多行或多列時,下標i和j可為數值型向量.

**代碼清單2-2 矩陣下標的使用 **

R語言實戰(第2版):第二章 創建數據集(01)

首先,我們創建了一個內容為數字1到10的2×5矩陣。默認情況下,矩陣按列填充。然後,我們分別選擇了第二行和第二列的元素。接著,又選擇了第一行第四列的元素。最後選擇了位於第一行第四、第五列的元素。


分享到:


相關文章: