R語言-獲取指定位置的數(shù)據(jù)
R中采用數(shù)據(jù)對象+[ , ]的方式獲取對應(yīng)位置的數(shù)據(jù),根據(jù)填入索引參數(shù)的不同類型可具體分為:
正整數(shù)、負整數(shù)、零、空格、邏輯值、名稱
1
2
3
4
5
6
|
> matrix [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 2 6 10 14 18 [3,] 3 7 11 15 19 [4,] 4 8 12 16 20 |
1.正整數(shù)索引
因為R中的起始位置為1,與一般的編程語言不同,所以這類索引最為常見。
需要注意的是,如果索引中存在重復(fù)值,R會繼續(xù)執(zhí)行進而重復(fù)提取部分值,如:
1
2
3
4
|
> matrix[c(1,1),1:5] [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 1 5 9 13 17 |
2.負整數(shù)索引
使用負整數(shù)索引與正整數(shù)正好相反,R會返回不包含在負整數(shù)對應(yīng)位置的元素,當需要選取的行或列很多時,用這個索引會更快捷。
需要注意,正整數(shù)索引與負整數(shù)索引可以同時出現(xiàn)在不同索引位置,但不能同時出現(xiàn)在同一位置,否則將報錯,具體如下:
1
2
3
4
|
> matrix[c(-1,-1),1] [1] 2 3 4 > matrix[c(-1,1),1] Error in matrix[c(-1, 1), 1] : only 0's may be mixed with negative subscripts |
3.零索引
零索引的存在說實話并沒有什么意義,很有可能是設(shè)計師為了防止很多程序員無法避開從0開始計數(shù)而經(jīng)常導(dǎo)致error的一種保護措施而已。使用情況如下:
1
2
3
4
|
> matrix[1,0] integer(0) > matrix[0,0] <0 x 0 matrix> |
4.空格索引
空格表示提取該索引位置所對應(yīng)的所有維度,但不寫空格效果也一樣,具體如下:
1
2
3
4
|
> matrix[1,] [1] 1 5 9 13 17 > matrix[1, ] [1] 1 5 9 13 17 |
5.邏輯值索引
當提供的索引位置是一個包含TRUE和FALSE邏輯值的向量,那么R會匹配出索引值為TRUE的列,并取出相應(yīng)元素。
使用這種方法,需要向量長度與索引位置的維度相同,否則就達不到需要的效果,具體如下:
1
2
|
> matrix[c(T,F,F,F),] [1] 1 5 9 13 17 |
這種方式看似笨重,但在特殊情況下作用十分明顯
6.名稱索引
當被索引的對象有名稱屬性,就可以采用名稱作為索引提取相關(guān)元素,這是提取列的常用方法,因為列總會有名稱,具體如下:
1
2
3
|
> colnames(matrix)<-c( "a" , "b" , "c" , "d" , "e" ) > matrix[, "b" ] [1] 5 6 7 8 |
補充:R語言獲取特定時間段的數(shù)據(jù)
獲取特定時間段的表格數(shù)據(jù)方法:
1. 方法一:正則表達式
1
2
3
4
5
6
7
8
|
data <- read .csv( 'F:/data.csv' ) date <- as.Date(data$Date) #獲取2018-3-1到2018-3-10之間的第3-5列數(shù)據(jù) subT <- date [( format ( date , format = "%Y" )== "2018" &as.numeric( format ( date , format = "%m" ))== "3" &as.numeric( format ( date , format = "%d" ))>=1&as.numeric( format ( date , format = "%d" ))<=10),3:5] #對2018-3-1到2018-3-10之間第3-5列的數(shù)據(jù)進行按列求平均值 mean <- apply(subT,2, mean) |
2. 方法二:
1
2
3
4
5
|
date1 <- as.POSIXct( paste ( "2018-3-1" , "08:00:00" )) date2 <- as.POSIXct( paste ( "2018-3-1" , "17:00:00" )) int <- interval(date1, date2) #獲取2018-3-1 08:00:00到2018-3-1 17:00:00之間的第3-5列數(shù)據(jù) subT <- data[ymd_hms(data$Date) %within% int,3:5] |
注意:
1. within判斷數(shù)據(jù)是否在該時間段之內(nèi),其中包括起始時間,不包括末尾時間。
2.paste0(num_year[y],'_',m,'_1') 實現(xiàn)字符串的合并,其中m,num_year[y]為變量。
paste拼接時有空格,paste0無空格
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持服務(wù)器之家。如有錯誤或未考慮完全的地方,望不吝賜教。
原文鏈接:https://blog.csdn.net/xiaohukun/article/details/76048042