前 5 种 R 数据类型 | 您应该了解的 R 数据类型

已发表: 2020-09-28

需要某些变量来存储您在程序中使用的数据,以创建任何应用程序或以任何编程语言呈现任何编程。 人们还可能注意到(通常在典型或大多数编程语言中,例如 C 或 C++)这些变量被分配到特定类别。 这些类别就是我们所说的数据类型。

数据类型是几乎所有编程语言中都可用的一个非常重要的概念。 顾名思义,数据类型表示可以使用您的计算机程序处理的特定类型的数据。 了解 Python 的各种数据类型。

与 C 等其他编程语言相比,变量不是简单地声明为某种R 数据类型,而是分配有 R 对象。 R 对象的数据类型成为变量的数据类型。 有几种类型的 R 对象最常见的是:

  1. 矢量图
  2. 矩阵
  3. 列表
  4. 数组
  5. 因素
  6. 数据框

向量是最基本的R 数据类型,包含不同类的元素。 这些原子向量有五种主要的数据类型。 其他 R-Objects 建立在原子向量之上。

学习世界顶尖大学的数据科学课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

下面提到的是用于创建向量的一些R 数据类型

目录

顶级 R 数据类型

1.数值数据类型

在 R 编程语言中,十进制值称为数值。 它是分配给 R 中所有值的默认R 数据类型。让我们借助一个示例来理解它:

> y = 11.6 # 为 y 变量分配一个十进制值

> y # 打印 y 的值

[1] 11.6

> class(y) # 打印 y 的类名

[1] “数字”

这里,十进制值 (11.6) 已分配给变量“y”,其数据类型默认为数字。

即使你给变量一个非十进制值,它的默认数据类型仍然是数字而不是整数。 这是一个例子:

> y = 1

> y # 打印 y 变量的值

[1] 1

> class(y) # 打印 y 的类名

[1] “数字”

阅读: Python 中的变量和数据类型 [开发人员终极指南]

2.整数数据类型

没有十进制值的数字在 R 编程语言中的数据类型整数下声明。 要在 R 中创建整数变量,需要撤销整数函数。 此外,可以应用 is.integer 函数来确保 y 确实是整数。 让我们看几个例子来理解整数数据类型:

> x = as.integer(5)

> x # 打印 x 的值

[1] 5

> 类(x)

[1] “整数”

> is.integer(x) # 判断x是否为整数的函数

[1] 对

声明整数的另一种方法是附加 L 后缀。

> x = 5L

> is.integer(x) # 判断x是否为整数的函数

[1] 对

可以使用 as.integer 函数将具有数字数据类型的值强制转换为整数数据类型。

> as.integer(7.16) # 强制一个数值

[1] 7

也可以使用 as.integer 函数解析具有十进制值的字符串。

> as.integer(“7.16”) # 强制转换为十进制字符串

[1] 7

但是,将非十进制字符串解析为整数函数是错误的。

结帐: MATLAB 数据类型

3. 复杂数据类型

R 编程语言中的复数值是通过纯虚数值 i 定义的。

> k = 1 + 2i # 创建一个复数

> k

[1] 1+2i

> 类(k)

[1] “复杂”

4. 逻辑数据类型

R 中的逻辑数据类型采用真值或假值。 该值是在比较两个值后生成的。 下面提到的是一个例子:

> l = 4; 米 = 2

> n = l > m # l 比 y 大吗?

> n # 打印 t 的逻辑值

[1] 对

> class(n) # 打印 z 的类名

[1] “逻辑”

5.字符数据类型

字符数据类型用于表示 R 编程语言中的字符串值。 使用 as.character () 函数将对象转换为字符值。 下面提到的是一些示例,以建立对字符数据类型的清晰理解:

> y = as.character(7.16)

> y # 打印字符串

[1] “7.16”

> class(y) # 打印 y 的类名

[1] “性格”

要连接两个字符值,可以使用粘贴函数。

> fname = “丽雅”; lname =“夏尔马”

> 粘贴(fname,lname)

[1] “里亚夏尔马”

现在,既然您已经了解了最常见的数据类型,让我们看看如何创建向量对象并使用数据类型来声明值。

向量是相同类型数据的一组数据元素。

下面给出的是一个包含三个数值 4、5 和 6 的向量。

> c(4, 5, 6)

[1] 4 5 6

这是一个逻辑值向量。

> c(假真假真)

[1] 假 真 假 真

向量也可以包含字符串。

> c(“AA”、“BB”、“CC”、“DD”、“EE”)

[1] “AA” “BB” “CC” “DD” “EE”

其他 R 对象

矩阵

创建一个二维数据集。 这是一个例子:

创建一个矩阵。

M = 矩阵(c('q','w','e','r','t','y'),nrow = 2,ncol = 3,byrow = TRUE)

打印(M)

输出 -

[,1] [,2] [,3]

[1,] “q” “w” “e”

[2,] “r” “t” “y”

列表

列表是一种包含不同类型元素的对象:向量、函数,甚至是其他列表。

例子

#创建一个包含向量和数值的列表。

list1 <- list(c(2,5,3),7.9)

# 打印列表。

打印(列表1)

输出 -

[[1]]

[1] 2 5 3

[[2]]

[1] 7.9

数组

与矩阵不同,数组可以有 n 维。 数组中使用的 dim 属性创建所需的维数。 下面提到的是创建一个包含两个元素和 2X2 矩阵的数组的示例。

创建一个数组。

a <- array(c('pink','blue'),dim = c(2,2,1))

打印(一)

当我们执行上面的代码时,它会产生以下结果 -

, , 1

[,1] [,2]

[1,] “粉色” “蓝色”

[2,] “蓝色” “粉色”

因素

因子是使用向量创建的 r 对象。 因子将向量中具有不同元素值的向量存储为标签。 无论输入向量中的数据类型如何,标签始终具有字符数据类型。 因子在进行统计建模时非常有用。

可以使用 factor() 函数创建因子。

# 创建一个向量。

颜色 <- c('黄色','蓝色','粉色')

# 创建一个因子对象。

因子颜色 <- 因子(颜色)

# 打印因子。

打印(因子颜色)

[1] 黄色 蓝色 粉色

数据框

数据框是表格数据对象。 数据框中的每一列都可以包含不同模式的数据。 所有三列都可以有不同的数据类型,可以是整数、数字或字符。

数据框是使用 data.frame() 函数创建的。

# 创建数据框。

数据 <- data.frame(

性别 = c(“男”, “女”),

高度 = c(153, 160),

重量 = c(80, 78),

年龄 = c(40 29)

)

打印(BMI)

输出

性别 身高 体重 年龄

1 男 153.0 80 40

2 女 160.0 78 29

另请阅读:印度的 R 开发人员薪水:适合新人和有经验的人

接下来是什么?

如果您想了解 R(数据科学),请查看我们的数据科学 PG 文凭,该文凭专为在职专业人士而设,提供 10 多个案例研究和项目、实用的实践研讨会、行业专家指导、一对一1 与行业导师,400 多个小时的学习和顶级公司的工作协助。

使用 R 编程语言有什么缺点?

在许多方面,R 是不安全的。 此功能在大多数编程语言中都可用,包括 Python。 因此,R 有许多缺点,其中之一是它无法在 Web 应用程序中使用。 R 是一门具有挑战性的学习语言。 学习曲线有点复杂。 因此,对于以前从未编码过的人来说,学习 R 可能会很困难。 R 连接到更古老的 S 编程语言。 这意味着基本包不支持动态或 3D 图形。

什么是 R 变量?

R 变量通常是向量(数据列表),可以是数字或文本。 R 变量通常是小写的,我们使用 - 运算符为它们赋值。 使用 c 函数创建一个向量,然后列出值。