前 5 種 R 數據類型 | 您應該了解的 R 數據類型

已發表: 2020-09-28

需要某些變量來存儲您在程序中使用的數據,以創建任何應用程序或以任何編程語言呈現任何編程。 人們還可能注意到(通常在典型或大多數編程語言中,例如 C 或 C++)這些變量被分配到特定類別。 這些類別就是我們所說的數據類型。

數據類型是幾乎所有編程語言中都可用的一個非常重要的概念。 顧名思義,數據類型表示可以使用您的計算機程序處理的特定類型的數據。 了解 Python 的各種數據類型。

與 C 等其他編程語言相比,變量不是簡單地聲明為某種R 數據類型,而是分配有 R 對象。 R 對象的數據類型成為變量的數據類型。 有幾種類型的 R 對象最常見的是:

  1. 矢量圖
  2. 矩陣
  3. 列表
  4. 數組
  5. 因素
  6. 數據框

向量是最基本的R 數據類型,包含不同類的元素。 這些原子向量有五種主要的數據類型。 其他 R-Objects 建立在原子向量之上。

學習世界頂尖大學的數據科學課程獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。

下面提到的是用於創建向量的一些R 數據類型

目錄

頂級 R 數據類型

1.數值數據類型

在 R 編程語言中,十進制值稱為數值。 它是分配給 R 中所有值的默認R 數據類型。讓我們藉助一個示例來理解它:

> y = 11.6 # 為 y 變量分配一個十進制值

> y # 打印 y 的值

[1] 11.6

> class(y) # 打印 y 的類名

[1] “數字”

這裡,十進制值 (11.6) 已分配給變量“y”,其數據類型默認為數字。

即使你給變量一個非十進制值,它的默認數據類型仍然是數字而不是整數。 這是一個例子:

> y = 1

> y # 打印 y 變量的值

[1] 1

> class(y) # 打印 y 的類名

[1] “數字”

閱讀: Python 中的變量和數據類型 [開發人員終極指南]

2.整數數據類型

沒有十進制值的數字在 R 編程語言中的數據類型整數下聲明。 要在 R 中創建整數變量,需要撤銷整數函數。 此外,可以應用 is.integer 函數來確保 y 確實是整數。 讓我們看幾個例子來理解整數數據類型:

> x = as.integer(5)

> x # 打印 x 的值

[1] 5

> 類(x)

[1] “整數”

> is.integer(x) # 判斷x是否為整數的函數

[1] 對

聲明整數的另一種方法是附加 L 後綴。

> x = 5L

> is.integer(x) # 判斷x是否為整數的函數

[1] 對

可以使用 as.integer 函數將具有數字數據類型的值強制轉換為整數數據類型。

> as.integer(7.16) # 強制一個數值

[1] 7

也可以使用 as.integer 函數解析具有十進制值的字符串。

> as.integer(“7.16”) # 強制轉換為十進製字符串

[1] 7

但是,將非十進製字符串解析為整數函數是錯誤的。

結帳: MATLAB 數據類型

3. 複雜數據類型

R 編程語言中的複數值是通過純虛數值 i 定義的。

> k = 1 + 2i # 創建一個複數

> k

[1] 1+2i

> 類(k)

[1] “複雜”

4. 邏輯數據類型

R 中的邏輯數據類型採用真值或假值。 該值是在比較兩個值後生成的。 下面提到的是一個例子:

> l = 4; 米 = 2

> n = l > m # l 比 y 大嗎?

> n # 打印 t 的邏輯值

[1] 對

> class(n) # 打印 z 的類名

[1] “邏輯”

5.字符數據類型

字符數據類型用於表示 R 編程語言中的字符串值。 使用 as.character () 函數將對象轉換為字符值。 下面提到的是一些示例,以建立對字符數據類型的清晰理解:

> y = as.character(7.16)

> y # 打印字符串

[1] “7.16”

> class(y) # 打印 y 的類名

[1] “性格”

要連接兩個字符值,可以使用粘貼函數。

> fname = “麗雅”; lname =“夏爾馬”

> 粘貼(fname,lname)

[1] “里亞夏爾馬”

現在,既然您已經了解了最常見的數據類型,讓我們看看如何創建向量對象並使用數據類型來聲明值。

向量是相同類型數據的一組數據元素。

下面給出的是一個包含三個數值 4、5 和 6 的向量。

> c(4, 5, 6)

[1] 4 5 6

這是一個邏輯值向量。

> c(假真假真)

[1] 假 真 假 真

向量也可以包含字符串。

> c(“AA”、“BB”、“CC”、“DD”、“EE”)

[1] “AA” “BB” “CC” “DD” “EE”

其他 R 對象

矩陣

創建一個二維數據集。 這是一個例子:

創建一個矩陣。

M = 矩陣(c('q','w','e','r','t','y'),nrow = 2,ncol = 3,byrow = TRUE)

打印(M)

輸出 -

[,1] [,2] [,3]

[1,] “q” “w” “e”

[2,] “r” “t” “y”

列表

列表是一種包含不同類型元素的對象:向量、函數,甚至是其他列表。

例子

#創建一個包含向量和數值的列表。

list1 <- list(c(2,5,3),7.9)

# 打印列表。

打印(列表1)

輸出 -

[[1]]

[1] 2 5 3

[[2]]

[1] 7.9

數組

與矩陣不同,數組可以有 n 維。 數組中使用的 dim 屬性創建所需的維數。 下面提到的是創建一個包含兩個元素和 2X2 矩陣的數組的示例。

創建一個數組。

a <- array(c('pink','blue'),dim = c(2,2,1))

打印(一)

當我們執行上面的代碼時,它會產生以下結果 -

, , 1

[,1] [,2]

[1,] “粉色” “藍色”

[2,] “藍色” “粉色”

因素

因子是使用向量創建的 r 對象。 因子將向量中具有不同元素值的向量存儲為標籤。 無論輸入向量中的數據類型如何,標籤始終具有字符數據類型。 因子在進行統計建模時非常有用。

可以使用 factor() 函數創建因子。

# 創建一個向量。

顏色 <- c('黃色','藍色','粉色')

# 創建一個因子對象。

因子顏色 <- 因子(顏色)

# 打印因子。

打印(因子顏色)

[1] 黃色 藍色 粉色

數據框

數據框是表格數據對象。 數據框中的每一列都可以包含不同模式的數據。 所有三列都可以有不同的數據類型,可以是整數、數字或字符。

數據框是使用 data.frame() 函數創建的。

# 創建數據框。

數據 <- data.frame(

性別 = c(“男”, “女”),

高度 = c(153, 160),

重量 = c(80, 78),

年齡 = c(40 29)

)

打印(BMI)

輸出

性別 身高 體重 年齡

1 男 153.0 80 40

2 女 160.0 78 29

另請閱讀:印度的 R 開發人員薪水:適合新人和有經驗的人

接下來是什麼?

如果您想了解 R(數據科學),請查看我們的 PG 數據科學文憑,該文憑專為在職專業人士而設,提供 10 多個案例研究和項目、實用的實踐研討會、行業專家指導、一對一1 與行業導師,400 多個小時的學習和頂級公司的工作協助。

使用 R 編程語言有什麼缺點?

在許多方面,R 是不安全的。 此功能在大多數編程語言中都可用,包括 Python。 因此,R 有許多缺點,其中之一是它無法在 Web 應用程序中使用。 R 是一門具有挑戰性的學習語言。 學習曲線有點複雜。 因此,對於以前從未編碼過的人來說,學習 R 可能會很困難。 R 連接到更古老的 S 編程語言。 這意味著基本包不支持動態或 3D 圖形。

什麼是 R 變量?

R 變量通常是向量(數據列表),可以是數字或文本。 R 變量通常是小寫的,我們使用 - 運算符為它們賦值。 使用 c 函數創建一個向量,然後列出值。