前 5 种 R 数据类型 | 您应该了解的 R 数据类型
已发表: 2020-09-28需要某些变量来存储您在程序中使用的数据,以创建任何应用程序或以任何编程语言呈现任何编程。 人们还可能注意到(通常在典型或大多数编程语言中,例如 C 或 C++)这些变量被分配到特定类别。 这些类别就是我们所说的数据类型。
数据类型是几乎所有编程语言中都可用的一个非常重要的概念。 顾名思义,数据类型表示可以使用您的计算机程序处理的特定类型的数据。 了解 Python 的各种数据类型。
与 C 等其他编程语言相比,变量不是简单地声明为某种R 数据类型,而是分配有 R 对象。 R 对象的数据类型成为变量的数据类型。 有几种类型的 R 对象最常见的是:
- 矢量图
- 矩阵
- 列表
- 数组
- 因素
- 数据框
向量是最基本的R 数据类型,包含不同类的元素。 这些原子向量有五种主要的数据类型。 其他 R-Objects 建立在原子向量之上。
学习世界顶尖大学的数据科学课程。 获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。
下面提到的是用于创建向量的一些R 数据类型:
目录
顶级 R 数据类型
1.数值数据类型
在 R 编程语言中,十进制值称为数值。 它是分配给 R 中所有值的默认R 数据类型。让我们借助一个示例来理解它:
> y = 11.6 # 为 y 变量分配一个十进制值
> y # 打印 y 的值
[1] 11.6
> class(y) # 打印 y 的类名
[1] “数字”
这里,十进制值 (11.6) 已分配给变量“y”,其数据类型默认为数字。
即使你给变量一个非十进制值,它的默认数据类型仍然是数字而不是整数。 这是一个例子:
> y = 1
> y # 打印 y 变量的值
[1] 1
> class(y) # 打印 y 的类名
[1] “数字”
阅读: Python 中的变量和数据类型 [开发人员终极指南]
2.整数数据类型
没有十进制值的数字在 R 编程语言中的数据类型整数下声明。 要在 R 中创建整数变量,需要撤销整数函数。 此外,可以应用 is.integer 函数来确保 y 确实是整数。 让我们看几个例子来理解整数数据类型:
> x = as.integer(5)
> x # 打印 x 的值
[1] 5
> 类(x)
[1] “整数”
> is.integer(x) # 判断x是否为整数的函数
[1] 对
声明整数的另一种方法是附加 L 后缀。
> x = 5L
> is.integer(x) # 判断x是否为整数的函数
[1] 对
可以使用 as.integer 函数将具有数字数据类型的值强制转换为整数数据类型。
> as.integer(7.16) # 强制一个数值
[1] 7
也可以使用 as.integer 函数解析具有十进制值的字符串。
> as.integer(“7.16”) # 强制转换为十进制字符串
[1] 7
但是,将非十进制字符串解析为整数函数是错误的。
结帐: MATLAB 数据类型
3. 复杂数据类型
R 编程语言中的复数值是通过纯虚数值 i 定义的。
> k = 1 + 2i # 创建一个复数
> k
[1] 1+2i
> 类(k)
[1] “复杂”
4. 逻辑数据类型
R 中的逻辑数据类型采用真值或假值。 该值是在比较两个值后生成的。 下面提到的是一个例子:
> l = 4; 米 = 2
> n = l > m # l 比 y 大吗?
> n # 打印 t 的逻辑值
[1] 对
> class(n) # 打印 z 的类名

[1] “逻辑”
5.字符数据类型
字符数据类型用于表示 R 编程语言中的字符串值。 使用 as.character () 函数将对象转换为字符值。 下面提到的是一些示例,以建立对字符数据类型的清晰理解:
> y = as.character(7.16)
> y # 打印字符串
[1] “7.16”
> class(y) # 打印 y 的类名
[1] “性格”
要连接两个字符值,可以使用粘贴函数。
> fname = “丽雅”; lname =“夏尔马”
> 粘贴(fname,lname)
[1] “里亚夏尔马”
现在,既然您已经了解了最常见的数据类型,让我们看看如何创建向量对象并使用数据类型来声明值。
向量是相同类型数据的一组数据元素。
下面给出的是一个包含三个数值 4、5 和 6 的向量。
> c(4, 5, 6)
[1] 4 5 6
这是一个逻辑值向量。
> c(假真假真)
[1] 假 真 假 真
向量也可以包含字符串。
> c(“AA”、“BB”、“CC”、“DD”、“EE”)
[1] “AA” “BB” “CC” “DD” “EE”
其他 R 对象
矩阵
创建一个二维数据集。 这是一个例子:
创建一个矩阵。
M = 矩阵(c('q','w','e','r','t','y'),nrow = 2,ncol = 3,byrow = TRUE)
打印(M)
输出 -
[,1] [,2] [,3]
[1,] “q” “w” “e”
[2,] “r” “t” “y”
列表
列表是一种包含不同类型元素的对象:向量、函数,甚至是其他列表。
例子
#创建一个包含向量和数值的列表。
list1 <- list(c(2,5,3),7.9)
# 打印列表。
打印(列表1)
输出 -
[[1]]
[1] 2 5 3
[[2]]
[1] 7.9
数组
与矩阵不同,数组可以有 n 维。 数组中使用的 dim 属性创建所需的维数。 下面提到的是创建一个包含两个元素和 2X2 矩阵的数组的示例。
创建一个数组。
a <- array(c('pink','blue'),dim = c(2,2,1))
打印(一)
当我们执行上面的代码时,它会产生以下结果 -
, , 1
[,1] [,2]
[1,] “粉色” “蓝色”
[2,] “蓝色” “粉色”
因素
因子是使用向量创建的 r 对象。 因子将向量中具有不同元素值的向量存储为标签。 无论输入向量中的数据类型如何,标签始终具有字符数据类型。 因子在进行统计建模时非常有用。
可以使用 factor() 函数创建因子。
# 创建一个向量。
颜色 <- c('黄色','蓝色','粉色')
# 创建一个因子对象。
因子颜色 <- 因子(颜色)
# 打印因子。
打印(因子颜色)
[1] 黄色 蓝色 粉色
数据框
数据框是表格数据对象。 数据框中的每一列都可以包含不同模式的数据。 所有三列都可以有不同的数据类型,可以是整数、数字或字符。
数据框是使用 data.frame() 函数创建的。
# 创建数据框。
数据 <- data.frame(
性别 = c(“男”, “女”),
高度 = c(153, 160),
重量 = c(80, 78),
年龄 = c(40 29)
)
打印(BMI)
输出
性别 身高 体重 年龄
1 男 153.0 80 40
2 女 160.0 78 29
另请阅读:印度的 R 开发人员薪水:适合新人和有经验的人
接下来是什么?
如果您想了解 R(数据科学),请查看我们的数据科学 PG 文凭,该文凭专为在职专业人士而设,提供 10 多个案例研究和项目、实用的实践研讨会、行业专家指导、一对一1 与行业导师,400 多个小时的学习和顶级公司的工作协助。
使用 R 编程语言有什么缺点?
在许多方面,R 是不安全的。 此功能在大多数编程语言中都可用,包括 Python。 因此,R 有许多缺点,其中之一是它无法在 Web 应用程序中使用。 R 是一门具有挑战性的学习语言。 学习曲线有点复杂。 因此,对于以前从未编码过的人来说,学习 R 可能会很困难。 R 连接到更古老的 S 编程语言。 这意味着基本包不支持动态或 3D 图形。
什么是 R 变量?
R 变量通常是向量(数据列表),可以是数字或文本。 R 变量通常是小写的,我们使用 - 运算符为它们赋值。 使用 c 函数创建一个向量,然后列出值。