R 备忘单:您应该随身携带的那张
已发表: 2020-05-29目录
介绍
R 编程语言的地位已经从单纯的用于统计分析的编程语言发展为更强大的全能工具。 R 的用户群在过去几年中也有所增长。 它现在被许多程序员、学者和从业者所采用。 为了充分利用任何编程语言,学习如何获得帮助是典型的,因为错误是必然会发生的。
因此,有了语法知识,了解如何访问 R 帮助文件并从其他来源查找帮助对于 R 程序员的成功至关重要。 现在,这里是R 备忘单可以派上用场的地方。 R 备忘单包含所有重要功能及其要求,供程序员轻松参考。
了解更多: R 初学者教程:成为 R 编程专家
获得编程语言 R 的帮助
即使是介绍人们并轻松进入 R 编程世界的最佳书籍,仅靠它们自己也是不够的。 有时需要学习和访问 R 帮助文件。 我们一直在讨论的这个帮助文件向用户提供了有关如何在 R 中使用各种依赖项的详细信息。如何使用特定函数,因为每个内置函数都包含在这些帮助文件中。 关于如何使用特定功能的代码示例也位于这些不同的帮助页面中。
如果您想访问 R 帮助文件,以获取有关如何使用特定功能的帮助,您必须使用下面列出的任何功能:
1. ?:使用单个问号显示与用户希望获得帮助的任何功能有关的帮助文件。 例如,“?data.frame”将查看 R 帮助文件的页面,其中包含有关如何使用函数 data.frame() 的文档。
2. ??:如果要在 R 帮助文件中搜索特定的子字符串,“??” 将为您完成工作。 因此,如果您想知道其中包含单词“list”的函数的名称,您所要做的就是运行“??list”,您的问题就会得到解决
3. RSiteSearch():这个函数 RSiteSearch() 本质上是按照它的名字命名的。 它本质上是对作为该函数的参数传递的查询进行在线搜索。 因此,RSiteSearch(“linear models”) 将在“RSiteSearch”网站上为字符串“linear models”编译搜索。
如果您正在努力获得 R 的帮助并且内置的文档不适合您,那么您可以安装许多附加软件包以获得 R 所需的所有帮助。像“sos”这样的软件包是可供下载,由 CRAN 提供。 这个 R 包包含一些清晰简洁的功能,可以通过网站“RSiteSearch”上提供的所有帮助文件搜索各种查询。
软件包的安装也相当简单。 您需要做的就是在 R 控制台中运行代码 install.packages(“sos”),然后剩下的就是加载包。 可以通过使用库(“sos”)来完成包加载。
通过安装“sos”包,您现在可以访问名为 findFn() 的函数。 这个 findFn() 函数将搜索参数作为参数,然后返回数百个网页的列表,其中包含已传递的参数。 因此,例如,如果您在 R 控制台中运行函数 findFn(“回归”),您将面临一个包含大量信息的网页。
该信息包括指向名称中包含回归一词的许多函数的链接,或者即使它们的帮助文本中包含词组回归,如果您使用函数 findFn(),您也会找到对它的引用。
阅读: 6 个适合初学者的有趣 R 项目创意
如何将数据导入 R
下表很方便,因为它包含一些函数,当您要将数据导入 R 时会非常方便:
| 功能 | 它能做什么 | 例子 |
| 读表() | 该函数负责读取其列未连接在一起的数据。 通常,当您要读取的数据的列以逗号或制表符分隔时,会使用此功能。 需要注意的一点是,您可以自己指定分隔符以及其他一些不同的参数,这些参数准确地描述了您希望 R 读取的数据。 | 读表(文件= “我的文件”,sep= “ t”, 标头=假) |
| 读取.csv() | 粗略地说,这个函数是 read.table() 方法的一个非常低调或淡化的版本。 此函数已被硬编码,可从任何 CSV 文件中读取数据,该文件作为参数传递给此函数。 CSV 文件通常是电子表格和 MS Excel 文档。 | 读取.csv(文件= “我的文件”) |
| 读取.csv2() | 这个函数本质上是一个带有细微调整的 read.csv() 函数。 Read.csv2() 函数有一个预设,其中数据的分隔符是分号,逗号用作浮点数或小数点。 | 读取.csv2(文件= “我的文件”, 标头=假) |
| 读取.delim() | 当主要目的是读取已分隔的文件时使用此功能。 此处使用的默认分隔符是制表符。 | read.delim(文件= “我的文件”, 标题=真) |
| 扫描() | 如果有问题的数据不是表格,则此功能使您可以更精细、更精确地控制要由 R 读取的数据。 | 扫描(“我的文件”,跳过= 1, nmax=10) |
| 读取线() | 当从文本文件一次读取一行是我们希望程序执行的所需工作时,使用此函数。 | 读行(“我的文件”) |
| 读取.fwf | 如果您拥有的数据具有固定宽度格式的日期,那么您应该使用此函数,因为它以固定宽度格式读取日期。 简而言之,如果您拥有的数据在每列中具有固定数量的字符,则应使用此函数。 | read.fwf(“我的文件”, 宽度=c(1,2,3) |
运行该行代码后您将获得访问权限的功能主机及其服务用途如下所列:

| 功能 | 它能做什么 | 例子 |
| 读取.spss | 该函数将 SPSS 文件的名称作为参数,并将其读入 R 程序。 | 读取.spss(“我的文件”) |
| 读取.dta | 该函数接受Stata二进制格式文件名的输入,并将其读入R程序。 | read.dta(“我的文件”) |
| 读取.xport | 此函数采用 SAS 导出文件的名称作为参数,并将该文件读入 R 程序。 | read.export(“我的文件”) |
资源
另请查看:为什么要学习 R? 学习 R 的 8 大理由
不同的数据类型和表的基本操作
1.在R中编程时,基本上有三种重要的数据类型。这三种类型分别是:数字、字符和因子。 您可以快速搜索这是哪种数据类型,也可以使用以下两个命令分别进行类型转换,is.factor() 和 as.factor()。
2. 如果您碰巧导入了一个表,其变量包含一个或多个条目,这些条目是字符,那么 R 会自动将该表转换为因子的数据类型。 但是,话虽如此,您仍然可以通过强制使用 R 将数据转换为数字,使用 command= as.numeric(as.character(dat1$VAR1))。
3. 命令名称 (dat1)=c(“ID”, “X”, “Y”, “Z”) 实际上重命名数据集中的变量。 您必须记住,向量长度应与您拥有的变量数量相匹配; 否则,您将遇到错误。
4. 命令 fix (dat2) 打开电子表格文档中的全部数据,您可以在其中通过简单的双击单元格来编辑单元格。
5.如果你的数据只包含表格中的数值,你可以对表格进行转置。 使用,dat2 = t(dat1),命名为 dat2 的表将包含 dat1 中包含的数据表的转置(将所有行变为列)。
有关如何创建随机数据以及如何进行随机抽样的提示
1. 函数 rnorm(10) 接受参数 10 并创建 10 个随机样本。 这些随机样本是从均值为零的正态分布生成的,数据集的标准差恰好为 1。
2. 函数 runif(10) 采用 10 个不同的随机样本来创建一个均匀分布,其值介于 0 和 1 之间。
3. 函数 round(rnorm(10)*3+15) 取 10 个样本,这些样本是从均值为 15 的正态分布中随机抽取的,其标准差为 3,其中的浮点数数据在舍入函数的帮助下被删除。
4. 函数round(runif(10)*5+15) 将随机整数返回给用户,其值介于15 和20 之间。这些值的分布将是均匀的。
5. 函数 sample(c(“A”, “B”, “C”), 10, replace=TRUE) 从作为参数传递给此函数的任何向量中采样并创建一个随机样本。
学习世界顶尖大学的数据科学课程。 获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。
有关如何转换数据表内的数据的提示
1. 像这样 dat2=transform(dat1, VAR1=VAR1*0.4) 完成的变换函数的函数调用,将存储在 VAR1 中的值与 0,4 相乘,然后再次将相乘后的值重新分配给 VAR1。
2.函数transform的调用也可以用来创建对现有变量具有特定依赖关系的变量。 如果您像这样调用函数 dat2=transform(dat1, VAR2=VAR1*2),它将创建一个名为 VAR2 的新变量,该变量将包含 VAR1 乘以因子 2 的值。
3. 您还可以调用转换函数来修改您需要的任何特定站点的值。 为了执行该任务,您必须调用类似 dat2=transform(dat1, VAR1=ifelse(VAR3== “Site 1”, VAR1*0.4, VAR1)) 的函数。 如前所述,转换函数的调用将存储在 VAR1 中的数据与数据条目相乘,这些条目称为站点 1。变量 VAR1 的值在其他任何地方都保持不变。
阅读: R 中的 8 个令人惊叹的初学者数据科学项目
结论
在过去的几年里,编程世界见证了语言的繁荣。 这些编程语言旨在消除并将注意力集中在计算的一个方面。 像 R 这样的语言具有强大的以统计和数据科学为中心的方法,主要是因为这种语言拥有的内置特性。
在使用任何编程语言工作时,触手可及的每个命令都不是一件容易的事。 现在,这就是R 备忘单的用武之地。 始终要记住的一件事是,最好的R 备忘单是您创建的备忘单。
R编程语言中C的含义是什么?
C 函数代表 R 编程语言中的“组合”。 该函数用于通过在函数中传递参数来获取输出。 您可以在 R 中使用 C 以三种不同的方式提取数据:使用 c(row) 命令提取行,使用 c(column) 命令提取列,以及使用 c(row, column) 命令提取两列和行。
在这里,您必须从您正在使用的数据集中提供函数中行和列的值。 该函数将返回一个向量以返回此命令。 除此之外,您可以使用 c() 函数来组合两个不同的向量。
什么是 R 函数?
函数是用于执行特定任务的自包含代码模块。 通常,函数接受特定的数据结构,如值、数据帧、向量或任何东西,并对其进行处理以返回结果。 参数在括号中的这些函数中传递,以指定要求。
R 中使用了两种类型的函数:基本函数和用户定义函数。 基本功能是已经在 R 编程语言中可用的功能。 您可以从 R 中可用的各种包或库中访问这些函数。每个函数用于不同的目的并完成特定的任务。 R中的一些基本函数有sqrt()、round()、getwd()等。由于借助基本函数不可能完成每一个动作,所以需要借助自定义函数通过编写自己的代码来执行某些自定义任务。 当您必须多次执行某些操作时会开发这些功能。 一个函数可以让你更轻松。
R 编程语言的一些关键特性是什么?
R 可以通过多种方式帮助数据分析师和数据科学家。 它的一些关键特性帮助它从众多统计语言中脱颖而出。 主要特点是强大的图形功能、执行复杂统计计算的能力、无需任何编译器即可运行代码、数据整理、数据处理和存储能力,以及以所需格式生成报告的能力。
