Aide-mémoire R : celui que vous devriez garder à portée de main

Publié: 2020-05-29

Table des matières

introduction

Le statut du langage de programmation R est passé d'un simple langage de programmation conçu pour l'analyse statistique à un outil polyvalent plus puissant. La base d'utilisateurs de R a également augmenté au cours des dernières années. Il est maintenant utilisé par une foule de programmeurs, d'universitaires et de praticiens. Afin de tirer le meilleur parti de tout langage de programmation, apprendre à obtenir de l'aide est essentiel car des erreurs sont inévitables.

Ainsi, avec la connaissance de la syntaxe, la connaissance de la façon d'accéder aux fichiers d'aide R et de trouver de l'aide auprès d'autres sources est essentielle pour réussir en tant que programmeur R. Maintenant, c'est là que la feuille de triche R sera utile. La feuille de triche R contient toutes les fonctions vitales ainsi que ses appels pour une référence facile des programmeurs.

En savoir plus : Tutoriel R pour débutants : devenez un expert en programmation R

Obtenir de l'aide avec le langage de programmation R

Même les meilleurs livres pour présenter les gens et faciliter leur entrée dans le monde de la programmation en R ne suffisent pas à eux seuls. Parfois, il faut apprendre et accéder aux fichiers d'aide de R. Ce fichier d'aide dont nous parlons sans cesse présente à l'utilisateur des informations détaillées sur l'utilisation de diverses dépendances dans R. Comment utiliser une fonction particulière, car chaque fonction intégrée est intégrée dans ces fichiers d'aide. Les exemples de code sur la façon d'utiliser la fonction spécifique sont également présents sur chacune de ces différentes pages d'aide.

Si vous souhaitez accéder aux fichiers d'aide de R, pour obtenir de l'aide sur l'utilisation d'une fonctionnalité particulière, vous devrez utiliser l'une des fonctions répertoriées ci-dessous :

1. ? : L'utilisation d'un seul point d'interrogation affiche les fichiers d'aide relatifs à toute fonction pour laquelle l'utilisateur souhaite obtenir de l'aide. Par exemple, "?data.frame" affichera la page des fichiers d'aide R contenant la documentation sur l'utilisation de la fonction data.frame().

2. ?? : Si vous souhaitez rechercher une sous-chaîne particulière dans les fichiers d'aide de R, " ??" fera le travail pour vous. Donc, si vous voulez connaître les noms d'une fonction qui contient le mot "liste", tout ce que vous avez à faire est de lancer "??liste" et votre problème sera résolu

3. RSiteSearch() : Cette fonction RSiteSearch() fait essentiellement ce dont elle porte le nom. Il effectue essentiellement une recherche en ligne sur la requête transmise en tant que paramètre de cette fonction. Ainsi, RSiteSearch ("modèles linéaires") compilera la recherche sur le site Web "RSiteSearch" pour la chaîne "modèles linéaires".

Si vous avez du mal à obtenir de l'aide pour R et que les documentations intégrées ne vous conviennent pas, il existe de nombreux packages complémentaires que vous pouvez installer pour obtenir toute l'aide dont vous avez besoin avec R. disponible en téléchargement proposé par le CRAN. Ce package R contient une fonction claire et concise qui rendrait la recherche de toutes sortes de requêtes à travers tous les fichiers d'aide disponibles sur le site "RSiteSearch".

L'installation du package est également relativement simple. Tout ce que vous avez à faire est d'exécuter le code install.packages ("sos") dans la console R, il ne vous reste plus qu'à charger le package. Le chargement du package peut être effectué via l'utilisation de la bibliothèque ("sos").

Avec l'installation du package "sos", vous aurez désormais accès à la fonction appelée findFn(). Cette fonction findFn() prend le paramètre de recherche comme argument, puis renvoie la liste des centaines de pages Web, qui contiennent l'argument qui a été passé. Ainsi, par exemple, si vous exécutez la fonction findFn ("régression") dans votre console R, vous serez confronté à une page Web contenant de nombreuses informations.

Les informations incluent des liens vers de nombreuses fonctions qui ont le mot régression dans le nom, ou même si elles ont l'expression régression dans leur texte d'aide, vous trouverez également une référence à celle-ci si vous utilisez la fonction findFn().

Lis: 6 idées de projets R intéressantes pour les débutants

Comment importer des données dans R

Le tableau suivant est pratique car il contient certaines fonctions qui vous seront très utiles lorsque vous souhaitez importer des données dans R :

Une fonction Ce qu'il fait Exemple
lire.table() Cette fonction est chargée de lire les données dont les colonnes ne sont pas jointes. Habituellement, cette fonction est utilisée lorsque les données que vous souhaitez lire ont leurs colonnes séparées par une virgule ou une tabulation. Une chose à noter est que vous pouvez spécifier vous-même le séparateur avec d'autres arguments différents qui décrivent avec précision les données que vous voulez que R lise. read.table(file= " monfichier", sep= " t",
en-tête=FAUX)
lire.csv() Cette fonction en termes bruts est une version très atténuée ou édulcorée de la méthode read.table(). Cette fonction a été codée en dur pour lire les données de tout fichier CSV transmis à cette fonction en tant qu'argument. Les fichiers CSV sont généralement des feuilles de calcul et des documents MS Excel. read.csv(file= " monfichier")
lire.csv2() Cette fonction est essentiellement une fonction read.csv() avec des modifications mineures. La fonction Read.csv2() a un préréglage où le séparateur des données est un point-virgule et la virgule sert de virgule flottante ou décimale. read.csv2(file= " monfichier",
en-tête=FAUX)
lire.delim() Cette fonction est utilisée lorsque le motif principal est de lire les fichiers qui ont été délimités. Le séparateur par défaut utilisé ici est la tabulation. read.delim(file= " monfichier",
en-tête=VRAI)
analyse() Cette fonction vous donne un contrôle plus fin et beaucoup plus précis sur les données que vous souhaitez faire lire par R si les données en question ne sont pas tabulaires. scan("monfichier",ignorer=1,
nmax=10)
readLines() Cette fonction est utilisée lorsque la lecture d'une ligne à la fois à partir d'un fichier texte est le travail requis que nous voulons que le programme effectue. readLines("monfichier")
lire.fwf Si les données que vous avez ont des dates au format à largeur fixe, vous devez utiliser cette fonction car elle lit les dates au format à largeur fixe. En termes plus simples, si les données que vous avez ont un nombre fixe de caractères dans chaque colonne, cette fonction doit être utilisée. read.fwf("monfichier",
largeurs=c(1,2,3)

L'hôte de fonction auquel vous aurez accès après avoir exécuté cette ligne de code et le but qu'ils servent sont répertoriés ci-dessous :

Une fonction Ce qu'il fait Exemple
lire.spss Cette fonction prend le nom d'un fichier SPSS comme argument et le lit dans le programme R. read.spss("monfichier")
lire.dta Cette fonction prend en entrée le nom de fichier au format binaire Stata et le lit dans le programme R. read.dta("monfichier")
lire.xport Cette fonction prend l'argument du nom d'un fichier d'exportation SAS et lit le fichier dans le programme R. read.export("monfichier")

La source

Consultez également : Pourquoi Learn R ? Les 8 meilleures raisons d'apprendre R

Différents types de données et la manipulation de base des tables

1. Il existe essentiellement trois types de données qui sont d'une importance majeure lorsque vous programmez dans R. Ces trois types sont à savoir : numérique, caractère et facteur. Vous pouvez rapidement effectuer une recherche pour savoir de quel type de données il s'agit, ou vous pouvez également transtyper en utilisant respectivement les deux commandes suivantes, is.factor() et as.factor().

2. S'il vous arrive d'importer une table dont les variables contiennent une ou plusieurs entrées, qui sont des caractères, R convertira automatiquement la table en type de données du facteur. Cependant, cela étant dit, vous pouvez toujours convertir les données en numérique en forçant R, en utilisant la commande = as.numeric(as.character(dat1$VAR1)).

3. La commande names (dat1)=c("ID", "X", "Y", "Z") renomme en fait la variable dans votre jeu de données. Vous devrez garder à l'esprit que la longueur du vecteur doit correspondre au nombre de variables que vous avez ; sinon, vous rencontrerez une erreur.

4. La commande fix (dat2) ouvre toutes les données que vous avez dans un document de feuille de calcul où vous pouvez modifier les cellules avec un simple double-clic dans les cellules.

5. Si les données dont vous disposez ne contiennent que des valeurs numériques dans le tableau, vous pouvez effectuer la transposition du tableau. Utilisez, dat2 = t(dat1), et la table nommée dat2 contiendra la transposition (transformant toutes les lignes en colonnes) de la table de données contenue dans dat1.

Conseils sur la façon de créer des données aléatoires et d'effectuer un échantillonnage aléatoire

1. La fonction rnorm(10) prend l'argument de 10 et crée dix échantillons aléatoires. Ces échantillons aléatoires sont générés à partir d'une distribution normale, qui a une moyenne nulle, et l'écart type de l'ensemble de données se trouve être 1.

2. La fonction runif(10) prend dix échantillons aléatoires différents pour créer une distribution uniforme et dont la valeur est comprise entre zéro et un.

3. La fonction round(rnorm(10)*3+15) prend dix échantillons, qui sont aléatoires à partir d'une distribution normale dont la moyenne est de 15, et l'écart type qu'elle a est de 3 et les virgules flottantes qui sont là dans le les données sont supprimées à l'aide de la fonction d'arrondi.

4. La fonction round(runif(10)*5+15) renvoie l'utilisateur avec des entiers aléatoires, dont la valeur est comprise entre les valeurs de 15 et 20. La distribution de ces valeurs sera uniforme.

5. La fonction sample(c("A", "B", "C"), 10, replace=TRUE) échantillonne et crée un échantillon aléatoire à partir de n'importe quel vecteur passé en argument à cette fonction.

Apprenez des cours de science des données dans les meilleures universités du monde. Gagnez des programmes Executive PG, des programmes de certificat avancés ou des programmes de maîtrise pour accélérer votre carrière.

Conseils sur la façon de transformer les données qui se trouvent dans la table de données

1. L'appel de fonction de la fonction de transformation fait comme ceci dat2=transform(dat1, VAR1=VAR1*0.4), multiplie les valeurs stockées dans VAR1 par 0,4 puis réaffecte à nouveau la valeur multipliée à VAR1.

2. L'appel de la fonction transform peut également être utilisé pour créer des variables avec des dépendances spécifiques sur des variables existantes. Si vous appelez la fonction comme ceci dat2=transform(dat1, VAR2=VAR1*2), elle créera une nouvelle variable avec le nom de VAR2, qui contiendra la valeur de VAR1 multipliée par un facteur de deux.

3. Vous pouvez également appeler la fonction de transformation pour modifier les valeurs sur n'importe quel site spécifique dont vous avez besoin. Pour effectuer cette tâche, vous devrez appeler la fonction comme dat2=transform(dat1, VAR1=ifelse(VAR3== "Site 1", VAR1*0.4, VAR1)). L'appel, comme mentionné précédemment de la fonction de transformation, multiplie les données stockées dans VAR1 pour les entrées de données, qui sont le lieu dit site 1. La valeur de la variable VAR1 reste la même partout ailleurs.

Lire : 8 projets étonnants de science des données dans R pour les débutants

Conclusion

Le monde de la programmation a connu un boom des langages au cours des dernières années. Ces langages de programmation visent à éradiquer et à concentrer son attention sur un aspect de l'informatique. Les langages comme R ont une approche statistique robuste et centrée sur la science des données, principalement en raison des fonctionnalités intégrées que possède ce langage.

Lorsque vous travaillez dans n'importe quel langage de programmation, avoir toutes les commandes à portée de main n'est pas une tâche facile. Maintenant, c'est là que la feuille de triche R vient à la rescousse. Une chose à retenir est que la meilleure feuille de triche R est celle que vous créez.

Quelle est la signification de C dans le langage de programmation R ?

La fonction C signifie 'Combiner' dans le langage de programmation R. Cette fonction est utilisée pour obtenir la sortie en passant des paramètres dans la fonction. Vous pouvez extraire des données de trois manières différentes avec l'utilisation de C dans R : en utilisant la commande c(row) pour extraire des lignes, la commande c(column) pour extraire des colonnes et la commande c(row, column) pour extraire les deux colonnes. et rangées.

Ici, vous devez fournir la valeur des lignes et des colonnes dans la fonction à partir de l'ensemble de données que vous utilisez. La fonction renverra un vecteur en retour à cette commande. En dehors de cela, vous pouvez utiliser la fonction c() pour combiner deux vecteurs différents.

Que sont les fonctions R ?

Les fonctions sont des modules de code autonomes utilisés pour effectuer une tâche spécifique. Habituellement, les fonctions prennent une structure de données particulière comme une valeur, une trame de données, un vecteur ou quoi que ce soit et la traitent pour renvoyer un résultat. Les arguments sont passés dans ces fonctions entre parenthèses pour spécifier les exigences.

Il existe deux types de fonctions utilisées dans R : de base et définies par l'utilisateur. Les fonctions de base sont celles qui sont déjà disponibles dans le langage de programmation R. Vous pouvez accéder à ces fonctions à partir de divers packages ou bibliothèques disponibles dans R. Chaque fonction est utilisée dans un but différent et pour accomplir une tâche spécifique. Certaines des fonctions de base de R sont sqrt(), round(), getwd(), etc. Puisqu'il n'est pas possible d'effectuer toutes les actions à l'aide des fonctions de base, vous devez prendre l'aide des fonctions définies par l'utilisateur en écrivant votre propre code pour effectuer certaines tâches personnalisées. Ces fonctions sont développées lorsque vous devez effectuer certaines actions plusieurs fois. Une fonction peut vous faciliter la tâche.

Quelles sont certaines des fonctionnalités clés du langage de programmation R ?

Il existe de nombreuses façons dont R peut aider les analystes de données et les data scientists. Certaines de ses caractéristiques clés l'aident à se démarquer de la foule générale des langages statistiques. Les fonctionnalités clés sont de fortes capacités graphiques, la capacité d'effectuer des calculs statistiques complexes, l'exécution de code sans avoir besoin d'un compilateur, la gestion des données, les capacités de traitement et de stockage des données, et la capacité de générer des rapports dans les formats souhaités.