Rチートシート:手元に置いておくべきもの
公開: 2020-05-29目次
序章
Rプログラミング言語のステータスは、統計分析用に作成された単なるプログラミング言語から、より強力なオールラウンドツールに成長しました。 Rのユーザーベースも過去数年間で成長しています。 現在、多くのプログラマー、学者、実務家に採用されています。 プログラミング言語を最大限に活用するには、エラーが発生する可能性があるため、ヘルプの取得方法を学ぶことが典型的です。
したがって、構文の知識があれば、Rヘルプファイルにアクセスして他のソースからヘルプを見つける方法に関する知識は、Rプログラマーとして成功するために重要です。 さて、ここでRチートシートが役に立ちます。 Rチートシートには、プログラマーが簡単に参照できるようにするための呼び出しとともに、すべての重要な機能が含まれています。
詳細:初心者向けのRチュートリアル:Rプログラミングのエキスパートになる
プログラミング言語Rのヘルプを取得する
人々を紹介し、Rでのプログラミングの世界への道を容易にするための最高の本でさえ、それだけでは十分ではありません。 Rヘルプファイルを学習してアクセスする必要がある場合があります。 私たちが話し続けているこのヘルプファイルは、Rでさまざまな依存関係を使用する方法に関する詳細情報をユーザーに提供します。特定の関数を使用する方法は、すべての組み込み関数がこれらのヘルプファイルに組み込まれています。 特定の関数の使用方法に関するコード例は、これらのさまざまなヘルプページにもあります。
Rヘルプファイルにアクセスする場合、特定の機能の使用方法に関するヘルプを取得するには、以下にリストされている機能のいずれかを使用する必要があります。
1.?:単一の疑問符を使用すると、ユーザーがヘルプを取得したい機能に関連するヘルプファイルが表示されます。 たとえば、「?data.frame」は、関数data.frame()の使用方法に関するドキュメントを含むRヘルプファイルのページを表示します。
2. ??: Rヘルプファイルで特定のサブストリングを検索する場合は、「??」 あなたのために仕事をします。 したがって、「list」という単語が含まれている関数の名前を知りたい場合は、「?? list」を実行するだけで、問題は解決します。
3. RSiteSearch():この関数RSiteSearch()は、基本的に、名前にちなんで名付けられたものを実行します。 基本的に、この関数のパラメーターとして渡されるクエリについてオンライン検索を行います。 したがって、RSiteSearch(「線形モデル」)は、Webサイト「RSiteSearch」で文字列「線形モデル」の検索をコンパイルします。
Rのヘルプを取得するのに苦労していて、組み込まれたドキュメントがうまく機能しない場合は、Rで必要なすべてのヘルプを取得するためにインストールできるアドオンパッケージが多数あります。「sos」などのパッケージはCRANが提供するダウンロード可能。 このRパッケージには、Webサイト「RSiteSearch」で利用可能なすべてのヘルプファイルを介してあらゆる種類のクエリを検索できる、明確で簡潔な機能が含まれています。
パッケージのインストールもかなり簡単です。 Rコンソールでコードinstall.packages( "sos")を実行するだけで、パッケージをロードするだけです。 パッケージのロードは、ライブラリ(「sos」)を使用して実行できます。
「sos」パッケージをインストールすると、findFn()という関数にアクセスできるようになります。 このfindFn()関数は、引数としてsearchパラメーターを受け取り、渡された引数を含む数百のWebページのリストを返します。 したがって、たとえば、関数findFn(「回帰」)をRコンソールで実行すると、多くの情報を含むWebページが表示されます。
この情報には、名前に回帰という単語が含まれている多くの関数へのリンクが含まれています。ヘルプテキストに回帰というフレーズが含まれている場合でも、関数findFn()を使用するとその関数への参照が見つかります。
読む:初心者のための6つの興味深いRプロジェクトのアイデア
Rにデータをインポートする方法
次の表は、Rにデータをインポートするときに非常に便利ないくつかの関数が含まれているため便利です。
関数 | それが何をするか | 例 |
read.table() | この関数は、列が結合されていないデータを読み取る役割を果たします。 通常、この関数は、読み取りたいデータの列がコンマまたはタブで区切られている場合に使用されます。 注意すべき点の1つは、Rに読み取らせたいデータを正確に記述する他のいくつかの異なる引数と一緒に、セパレーターを自分で指定できることです。 | read.table(file = “ myfile”、sep = “ t”、 ヘッダー=FALSE) |
read.csv() | この関数は、大雑把に言えば、read.table()メソッドの非常にトーンダウンまたはウォーターダウンされたバージョンです。 この関数は、引数としてこの関数に渡されるCSVファイルからデータを読み取るようにハードコーディングされています。 CSVファイルは通常、スプレッドシートとMSExcelドキュメントです。 | read.csv(file = “ myfile”) |
read.csv2() | この関数は基本的に、微調整を加えたread.csv()関数です。 Read.csv2()関数には、データの区切り文字がセミコロンで、コンマが浮動小数点または小数点として機能するプリセットがあります。 | read.csv2(file = “ myfile”、 ヘッダー=FALSE) |
read.delim() | この関数は、区切られたファイルを読み取ることが主な目的である場合に使用されます。 ここで使用されているデフォルトの区切り文字はタブです。 | read.delim(file = “ myfile”、 header = TRUE) |
スキャン() | この関数を使用すると、問題のデータが表形式でない場合に、Rが読み取るデータをより細かく正確に制御できます。 | scan(“ myfile”、skip = 1、 nmax = 10) |
readLines() | この関数は、テキストファイルから一度に1行を読み取ることが、プログラムで実行する必要のあるジョブである場合に使用されます。 | readLines( "myfile") |
read.fwf | データに固定幅形式の日付がある場合は、固定幅形式の日付を読み取るため、この関数を使用する必要があります。 簡単に言うと、各列の文字数が固定されているデータの場合は、この関数を使用する必要があります。 | read.fwf( "myfile"、 widths = c(1,2,3) |
そのコード行を実行した後にアクセスできる関数のホストと、それらが提供する目的を以下に示します。

関数 | それが何をするか | 例 |
read.spss | この関数は、引数としてSPSSファイルの名前を取り、それをRプログラムに読み込みます。 | read.spss( "myfile") |
read.dta | この関数は、Stataバイナリ形式のファイル名の入力を受け取り、それをRプログラムに読み込みます。 | read.dta( "myfile") |
read.xport | この関数は、SASエクスポートファイルの名前の引数を取り、ファイルをRプログラムに読み込みます。 | read.export( "myfile") |
ソース
また、チェックしてください:なぜRを学ぶのですか? Rを学ぶためのトップ8の理由
さまざまなデータ型とテーブルの基本的な操作
1. Rでプログラミングするときに非常に重要なデータ型は、基本的に3つあります。これらの3つの型は、数値、文字、および係数です。 これがどの種類のデータ型であるかをすばやく検索することも、次の2つのコマンドis.factor()とas.factor()を使用して型キャストすることもできます。
2.変数に文字である1つまたは複数のエントリが含まれているテーブルをインポートすると、Rはそのテーブルを因子のデータ型として自動的にキャストします。 ただし、command = as.numeric(as.character(dat1 $ VAR1))を使用して、Rを強制することにより、データを数値にキャストすることはできます。
3.コマンド名(dat1)= c( "ID"、 "X"、 "Y"、 "Z")は、実際にはデータセット内の変数の名前を変更します。 覚えておく必要があり、ベクトルの長さは、持っている変数の数と一致する必要があります。 そうしないと、エラーが発生します。
4.コマンドfix(dat2)は、スプレッドシートドキュメントにあるデータ全体を開き、セルをダブルクリックするだけでセルを編集できます。
5.データにテーブル内の数値のみが含まれている場合は、テーブルの転置を行うことができます。 dat2 = t(dat1)を使用すると、dat2という名前のテーブルには、dat1に含まれるデータのテーブルの転置(すべての行を列にする)が含まれます。
ランダムデータを作成する方法とランダムサンプリングを行う方法に関するヒント
1.関数rnorm(10)は、10の引数を取り、10個のランダムサンプルを作成します。 これらのランダムサンプルは、平均がゼロの正規分布から生成され、データセットの標準偏差はたまたま1です。
2.関数runif(10)は、10個の異なるランダムサンプルを取得して、均一で値が0から1の間の分布を作成します。
3.関数round(rnorm(10)* 3 + 15)は、平均が15で、標準偏差が3で、浮動小数点が存在する正規分布からランダムに10個のサンプルを取得します。データは、丸め関数を使用して削除されます。
4.関数round(runif(10)* 5 + 15)は、15から20の値の間の値を持つランダムな整数をユーザーに返します。これらの値の分布は均一になります。
5.関数sample(c( "A"、 "B"、 "C")、10、replace = TRUE)は、この関数の引数として渡された任意のベクトルからランダムサンプルをサンプリングして作成します。
世界のトップ大学からデータサイエンスコースを学びましょう。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。
データテーブル内にあるデータを変換する方法に関するヒント
1.このdat2=transform(dat1、VAR1 = VAR1 * 0.4)のように行われる変換関数の関数呼び出しは、VAR1に格納されている値に0,4を乗算してから、乗算された値をVAR1に再度割り当てます。
2.関数変換の呼び出しを使用して、既存の変数に特定の依存関係を持つ変数を作成することもできます。 このdat2=transform(dat1、VAR2 = VAR1 * 2)のような関数を呼び出すと、VAR2という名前の新しい変数が作成されます。この変数には、VAR1の値に2を掛けた値が含まれます。
3.変換関数を呼び出して、必要な特定のサイトの値を変更することもできます。 そのタスクを実行するには、dat2 = transform(dat1、VAR1 = ifelse(VAR3 ==“ Site 1”、VAR1 * 0.4、VAR1))のような関数を呼び出す必要があります。 変換関数の前述のように、この呼び出しは、サイト1と呼ばれる場所であるデータエントリのVAR1に格納されているデータを乗算します。変数VAR1の値は、他の場所では同じままです。
読む:初心者のためのRの8つの驚くべきデータサイエンスプロジェクト
結論
プログラミングの世界では、過去数年間で言語がブームになっています。 これらのプログラミング言語は、コンピューティングの1つの側面を根絶し、その注意を集中させることを目的としています。 Rのような言語は、主にこの言語が持つ組み込み機能のために、ロバスト統計およびデータサイエンス中心のアプローチを採用しています。
あらゆるプログラミング言語で作業している間、すべてのコマンドを指先で操作するのは簡単な作業ではありません。 さて、これはRチートシートが救助に来るところです。 常に覚えておくべきことの1つは、最高のRチートシートは自分で作成したものであるということです。
Rプログラミング言語でのCの意味は何ですか?
C関数は、Rプログラミング言語で「Combine」の略です。 この関数は、関数内のパラメーターを渡すことによって出力を取得するために使用されます。 RでCを使用すると、3つの異なる方法でデータを抽出できます。行を抽出するためのc(row)コマンド、列を抽出するためのc(column)コマンド、および両方の列を抽出するためのc(row、column)コマンドを使用します。と行。
ここでは、使用しているデータセットの関数の行と列の値を指定する必要があります。 この関数は、このコマンドの代わりにベクトルを返します。 それ以外に、c()関数を使用して2つの異なるベクトルを組み合わせることができます。
R関数とは何ですか?
関数は、特定のタスクを実行するために使用されるコードの自己完結型モジュールです。 通常、関数は、値、データフレーム、ベクトルなどの特定のデータ構造を取り込んで、結果を返すためにそれを処理します。 要件を指定するために、これらの関数の括弧内に引数が渡されます。
Rで使用されている関数には、基本関数とユーザー定義関数の2種類があります。 基本的な機能は、Rプログラミング言語ですでに利用可能な機能です。 これらの関数には、Rで使用可能なさまざまなパッケージまたはライブラリからアクセスできます。すべての関数は、さまざまな目的で使用され、特定のタスクを完了します。 Rの基本関数には、sqrt()、round()、getwd()などがあります。基本関数を使用してすべてのアクションを完了することはできないため、ユーザー定義関数を使用する必要があります。特定のカスタマイズされたタスクを実行するための独自のコードを作成する。 これらの関数は、特定のアクションを複数回実行する必要がある場合に開発されます。 関数を使用すると、これが簡単になります。
Rプログラミング言語の主な機能は何ですか?
Rがデータアナリストやデータサイエンティストを支援する方法はたくさんあります。 その主要な機能のいくつかは、統計言語の一般的な群衆から目立つのに役立ちます。 主な機能は、強力なグラフィカル機能、複雑な統計計算を実行する機能、コンパイラを必要としないコードの実行、データラングリング、データ処理およびストレージ容量、および目的の形式でレポートを生成する機能です。