2.1 數(shù)據(jù)集的概念
數(shù)據(jù)集:有數(shù)據(jù)構(gòu)成的一個(gè)矩形數(shù)組,行--觀測(cè)observation,列--變量variable。
2.2 數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)的對(duì)象類型:標(biāo)量、向量、矩陣、數(shù)組、數(shù)據(jù)框和列表。

- 標(biāo)量:只含一個(gè)元素的向量。
- 向量:一維數(shù)組,函數(shù)c()來創(chuàng)建,必須相同的數(shù)據(jù)類型(數(shù)值型、字符型或邏輯型);訪問向量中的元素用方括號(hào)[ ]。
- 矩陣:二維數(shù)組,函數(shù)matrix來創(chuàng)建,必須相同的數(shù)據(jù)類型。選項(xiàng)byrow=TRUE按行填充,默認(rèn)按列;使用下標(biāo)和方括號(hào)來選擇矩陣中的行、列和元素,如x[i,j]。
- 數(shù)組:與矩陣類似,但維度可大于2。函數(shù)array()來創(chuàng)建。
- 數(shù)據(jù)框:不同的列可以包含不同模式的數(shù)據(jù)。函數(shù)data.frame()來創(chuàng)建。函數(shù)attach(將數(shù)據(jù)框添加到路徑中)/detach(移除數(shù)據(jù)框)/with。$訪問特定變量。
- 因子:名義型變量和有序變量在R中稱為因子。函數(shù)factor()創(chuàng)建。
- 列表:一些對(duì)象的有序集合。函數(shù)list()創(chuàng)建。雙重方括號(hào)[[ ]]指明代表某個(gè)成分的數(shù)字或名稱來訪問列表中的元素。
2.3 數(shù)據(jù)的輸入
- 鍵盤輸入數(shù)據(jù)
- 從帶分隔符的文本文件導(dǎo)入數(shù)據(jù)(.csv)
- 導(dǎo)入Excel數(shù)據(jù) (read.xlsx)
- 導(dǎo)入XML數(shù)據(jù)
- 從網(wǎng)頁抓取數(shù)據(jù)
- 導(dǎo)入SPSS數(shù)據(jù)
- 導(dǎo)入SAS數(shù)據(jù)
- 導(dǎo)入stata數(shù)據(jù)
- 導(dǎo)入NetCDF數(shù)據(jù)
- 導(dǎo)入HDF5數(shù)據(jù)
- 通過Stat/Transfer導(dǎo)入數(shù)據(jù)
2.4 數(shù)據(jù)集的標(biāo)注
- 變量標(biāo)簽作為變量名
- 函數(shù)factor()作為類別型變量創(chuàng)建值標(biāo)簽
2.5 處理數(shù)據(jù)對(duì)象的實(shí)用函數(shù)
| 函數(shù) | 用途 |
|---|---|
| length (object) | 顯示對(duì)象中元素/成分的數(shù)量 |
| dim (object) | 顯示某個(gè)對(duì)象的維度 |
| str(object) | 顯示某個(gè)對(duì)象的結(jié)構(gòu) |
| class(object) | 顯示某個(gè)對(duì)象的類或類型 |
| mode(object) | 顯示某個(gè)對(duì)象的模式 |
| names(object) | 顯示某對(duì)象中各成分的名稱 |
| c(object, object,...) | 將對(duì)象合并入一個(gè)向量 |
| cbind(object, object,...) | 按列合并對(duì)象 |
| rbind(object, object,...) | 按行合并對(duì)象 |
| object | 輸出某個(gè)對(duì)象 |
| head(object) | 列出某個(gè)對(duì)象的開始部分 |
| tail(object) | 列出某個(gè)對(duì)象的最后部分 |
| ls() | 顯示當(dāng)前的對(duì)象列表 |
| rm(object, object,...) | 刪除一個(gè)或更多個(gè)對(duì)象 |
| newobject <- edit(object) | 編輯對(duì)象并另存為newobject |
| fix(object) | 直接編輯對(duì)象 |