R 備忘單:您應該隨身攜帶的那張

已發表: 2020-05-29

目錄

介紹

R 編程語言的地位已經從單純的用於統計分析的編程語言發展為更強大的全能工具。 R 的用戶群在過去幾年中也有所增長。 它現在被許多程序員、學者和從業者所採用。 為了充分利用任何編程語言,學習如何獲得幫助是典型的,因為錯誤是必然會發生的。

因此,有了語法知識,了解如何訪問 R 幫助文件並從其他來源查找幫助對於 R 程序員的成功至關重要。 現在,這裡是R 備忘單可以派上用場的地方。 R 備忘單包含所有重要功能及其要求,供程序員輕鬆參考。

了解更多: R 初學者教程:成為 R 編程專家

獲得編程語言 R 的幫助

即使是介紹人們並輕鬆進入 R 編程世界的最佳書籍,僅靠它們自己也是不夠的。 有時需要學習和訪問 R 幫助文件。 我們一直在討論的這個幫助文件向用戶提供了有關如何在 R 中使用各種依賴項的詳細信息。如何使用特定函數,因為每個內置函數都包含在這些幫助文件中。 關於如何使用特定功能的代碼示例也位於這些不同的幫助頁面中。

如果您想訪問 R 幫助文件,以獲取有關如何使用特定功能的幫助,您必須使用下面列出的任何功能:

1. ?:使用單個問號顯示與用戶希望獲得幫助的任何功能有關的幫助文件。 例如,“?data.frame”將查看 R 幫助文件的頁面,其中包含有關如何使用函數 data.frame() 的文檔。

2. ??:如果要在 R 幫助文件中搜索特定的子字符串,“??” 將為您完成工作。 因此,如果您想知道其中包含單詞“list”的函數的名稱,您所要做的就是運行“??list”,您的問題就會得到解決

3. RSiteSearch():這個函數 RSiteSearch() 本質上是按照它的名字命名的。 它本質上是對作為該函數的參數傳遞的查詢進行在線搜索。 因此,RSiteSearch(“linear models”) 將在“RSiteSearch”網站上為字符串“linear models”編譯搜索。

如果您正在努力獲得 R 的幫助並且內置的文檔不適合您,那麼您可以安裝許多附加軟件包以獲得 R 所需的所有幫助。像“sos”這樣的軟件包是可供下載,由 CRAN 提供。 這個 R 包包含一些清晰簡潔的功能,可以通過網站“RSiteSearch”上提供的所有幫助文件搜索各種查詢。

軟件包的安裝也相當簡單。 您需要做的就是在 R 控制台中運行代碼 install.packages(“sos”),然後剩下的就是加載包。 可以通過使用庫(“sos”)來完成包加載。

通過安裝“sos”包,您現在可以訪問名為 findFn() 的函數。 這個 findFn() 函數將搜索參數作為參數,然後返回數百個網頁的列表,其中包含已傳遞的參數。 因此,例如,如果您在 R 控制台中運行函數 findFn(“回歸”),您將面臨一個包含大量信息的網頁。

該信息包括指向名稱中包含回歸一詞的許多函數的鏈接,或者即使它們的幫助文本中包含詞組回歸,如果您使用函數 findFn(),您也會找到對它的引用。

閱讀: 6 個適合初學者的有趣 R 項目創意

如何將數據導入 R

下表很方便,因為它包含一些函數,當您要將數據導入 R 時會非常方便:

功能它能做什麼例子
讀表() 該函數負責讀取其列未連接在一起的數據。 通常,當您要讀取的數據的列以逗號或製表符分隔時,會使用此功能。 需要注意的一點是,您可以自己指定分隔符以及其他一些不同的參數,這些參數準確地描述了您希望 R 讀取的數據。 讀表(文件= “我的文件”,sep= t”,
標頭=假)
讀取.csv() 粗略地說,這個函數是 read.table() 方法的一個非常低調或淡化的版本。 此函數已被硬編碼,可從任何 CSV 文件中讀取數據,該文件作為參數傳遞給此函數。 CSV 文件通常是電子表格和 MS Excel 文檔。 讀取.csv(文件= “我文件”)
讀取.csv2() 這個函數本質上是一個帶有細微調整的 read.csv() 函數。 Read.csv2() 函數有一個預設,其中數據的分隔符是分號,逗號用作浮點數或小數點。 讀取.csv2(文件= “我的文件”,
標頭=假)
讀取.delim() 當主要目的是讀取已分隔的文件時使用此功能。 此處使用的默認分隔符是製表符。 read.delim(文件= “我的文件”,
標題=真)
掃描() 如果有問題的數據不是表格,則此功能使您可以更精細、更精確地控制要由 R 讀取的數據。 掃描(“我的文件”,跳過= 1,
nmax=10)
讀取線() 當從文本文件一次讀取一行是我們希望程序執行的所需工作時,使用此函數。 讀行(“我的文件”)
讀取.fwf 如果您擁有的數據具有固定寬度格式的日期,那麼您應該使用此函數,因為它以固定寬度格式讀取日期。 簡而言之,如果您擁有的數據在每列中具有固定數量的字符,則應使用此函數。 read.fwf(“我的文件”,
寬度=c(1,2,3)

運行該行代碼後您將獲得訪問權限的功能主機及其服務用途如下所列:

功能它能做什麼例子
讀取.spss 該函數將 SPSS 文件的名稱作為參數,並將其讀入 R 程序。 讀取.spss(“我的文件”)
讀取.dta 該函數接受Stata二進制格式文件名的輸入,並將其讀入R程序。 read.dta(“我的文件”)
讀取.xport 此函數採用 SAS 導出文件的名稱作為參數,並將該文件讀入 R 程序。 read.export(“我的文件”)

資源

另請查看:為什麼要學習 R? 學習 R 的 8 大理由

不同的數據類型和表的基本操作

1.在R中編程時,基本上有三種重要的數據類型。這三種類型分別是:數字、字符和因子。 您可以快速搜索這是哪種數據類型,也可以使用以下兩個命令分別進行類型轉換,is.factor() 和 as.factor()。

2. 如果您碰巧導入了一個表,其變量包含一個或多個條目,這些條目是字符,那麼 R 會自動將該表轉換為因子的數據類型。 但是,話雖如此,您仍然可以通過強制使用 R 將數據轉換為數字,使用 command= as.numeric(as.character(dat1$VAR1))。

3. 命令名稱 (dat1)=c(“ID”, “X”, “Y”, “Z”) 實際上重命名數據集中的變量。 您必須記住,向量長度應與您擁有的變量數量相匹配; 否則,您將遇到錯誤。

4. 命令 fix (dat2) 打開電子表格文檔中的全部數據,您可以在其中通過簡單的雙擊單元格來編輯單元格。

5.如果你的數據只包含表格中的數值,你可以對錶格進行轉置。 使用,dat2 = t(dat1),命名為 dat2 的表將包含 dat1 中包含的數據表的轉置(將所有行變為列)。

有關如何創建隨機數據以及如何進行隨機抽樣的提示

1. 函數 rnorm(10) 接受參數 10 並創建 10 個隨機樣本。 這些隨機樣本是從均值為零的正態分佈生成的,數據集的標準差恰好為 1。

2. 函數 runif(10) 採用 10 個不同的隨機樣本來創建一個均勻分佈,其值介於 0 和 1 之間。

3. 函數 round(rnorm(10)*3+15) 取 10 個樣本,這些樣本是從均值為 15 的正態分佈中隨機抽取的,其標準差為 3,其中的浮點數數據在舍入函數的幫助下被刪除。

4. 函數round(runif(10)*5+15) 將隨機整數返回給用戶,其值介於15 和20 之間。這些值的分佈將是均勻的。

5. 函數 sample(c(“A”, “B”, “C”), 10, replace=TRUE) 從作為參數傳遞給此函數的任何向量中採樣並創建一個隨機樣本。

學習世界頂尖大學的數據科學課程獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。

有關如何轉換數據表內的數據的提示

1. 像這樣 dat2=transform(dat1, VAR1=VAR1*0.4) 完成的變換函數的函數調用,將存儲在 VAR1 中的值與 0,4 相乘,然後再次將相乘後的值重新分配給 VAR1。

2.函數transform的調用也可以用來創建對現有變量具有特定依賴關係的變量。 如果您像這樣調用函數 dat2=transform(dat1, VAR2=VAR1*2),它將創建一個名為 VAR2 的新變量,該變量將包含 VAR1 乘以因子 2 的值。

3. 您還可以調用轉換函數來修改您需要的任何特定站點的值。 為了執行該任務,您必須調用類似 dat2=transform(dat1, VAR1=ifelse(VAR3== “Site 1”, VAR1*0.4, VAR1)) 的函數。 如前所述,轉換函數的調用將存儲在 VAR1 中的數據與數據條目相乘,這些條目稱為站點 1。變量 VAR1 的值在其他任何地方都保持不變。

閱讀: R 中的 8 個令人驚嘆的初學者數據科學項目

結論

在過去的幾年裡,編程世界見證了語言的繁榮。 這些編程語言旨在消除並將注意力集中在計算的一個方面。 像 R 這樣的語言具有強大的以統計和數據科學為中心的方法,主要是因為這種語言擁有的內置特性。

在使用任何編程語言工作時,觸手可及的每個命令都不是一件容易的事。 現在,這就是R 備忘單的用武之地。 始終要記住的一件事是,最好的R 備忘單是您創建的備忘單。

R編程語言中C的含義是什麼?

C 函數代表 R 編程語言中的“組合”。 該函數用於通過在函數中傳遞參數來獲取輸出。 您可以在 R 中使用 C 以三種不同的方式提取數據:使用 c(row) 命令提取行,使用 c(column) 命令提取列,以及使用 c(row, column) 命令提取兩列和行。

在這裡,您必須從您正在使用的數據集中提供函數中行和列的值。 該函數將返回一個向量以返回此命令。 除此之外,您可以使用 c() 函數來組合兩個不同的向量。

什麼是 R 函數?

函數是用於執行特定任務的自包含代碼模塊。 通常,函數接受特定的數據結構,如值、數據幀、向量或任何東西,並對其進行處理以返回結果。 參數在括號中的這些函數中傳遞,以指定要求。

R 中使用了兩種類型的函數:基本函數和用戶定義函數。 基本功能是已經在 R 編程語言中可用的功能。 您可以從 R 中可用的各種包或庫中訪問這些函數。每個函數用於不同的目的並完成特定的任務。 R中的一些基本函數有sqrt()、round()、getwd()等。由於借助基本函數不可能完成每一個動作,所以需要藉助自定義函數通過編寫自己的代碼來執行某些自定義任務。 當您必須多次執行某些操作時會開發這些功能。 一個函數可以讓你更輕鬆。

R 編程語言的一些關鍵特性是什麼?

R 可以通過多種方式幫助數據分析師和數據科學家。 它的一些關鍵特性幫助它從眾多統計語言中脫穎而出。 主要特點是強大的圖形功能、執行複雜統計計算的能力、無需任何編譯器即可運行代碼、數據整理、數據處理和存儲能力,以及以所需格式生成報告的能力。