R Cheat Sheet: quello che dovresti tenerlo a portata di mano
Pubblicato: 2020-05-29Sommario
introduzione
Lo stato del linguaggio di programmazione R è passato dall'essere un semplice linguaggio di programmazione creato per l'analisi statistica a uno strumento a tutto tondo più potente. Anche la base di utenti di R è cresciuta negli ultimi anni. Ora è impiegato da una miriade di programmatori, studiosi e professionisti. Per ottenere il massimo da qualsiasi linguaggio di programmazione, imparare a ricevere aiuto è fondamentale perché è inevitabile che si verifichino errori.
Quindi, con la conoscenza della sintassi, la conoscenza su come accedere ai file della guida di R e trovare aiuto da altre fonti è fondamentale per il successo come programmatore R. Ora, qui è dove il cheat sheet di R tornerà utile. Il cheat sheet di R contiene tutte le funzioni vitali insieme alle sue chiamate per un facile riferimento dei programmatori.
Ulteriori informazioni: Tutorial R per principianti: diventa un esperto di programmazione R
Ottenere aiuto con il linguaggio di programmazione R
Anche i migliori libri per introdurre le persone e facilitare il loro ingresso nel mondo della programmazione in R non sono sufficienti da soli. A volte è necessario imparare e accedere ai file della guida di R. Questo file della guida di cui continuiamo a parlare presenta all'utente informazioni dettagliate su come utilizzare le varie dipendenze in R. Come utilizzare una funzione particolare, poiché ogni funzione incorporata è inserita in questi file della guida. Gli esempi di codice su come utilizzare la funzione specifica sono presenti anche in ciascuna di queste diverse pagine della guida.
Se desideri accedere ai file della guida di R, per ottenere aiuto su come utilizzare una particolare funzionalità, dovrai utilizzare una qualsiasi delle funzioni elencate di seguito:
1. ?: L'uso di un singolo punto interrogativo visualizza i file della guida relativi a qualsiasi funzione per la quale l'utente desidera ottenere aiuto. Ad esempio, “?data.frame” visualizzerebbe la pagina dei file della guida di R che contengono la documentazione su come utilizzare la funzione data.frame().
2. ??: Se vuoi cercare una particolare sottostringa nei file della guida di R, “??” farà il lavoro per te. Quindi, se vuoi conoscere i nomi di una funzione che contiene la parola "lista", tutto ciò che devi fare è eseguire "??lista" e il tuo problema sarebbe risolto
3. RSiteSearch(): questa funzione RSiteSearch() esegue essenzialmente ciò da cui prende il nome. In sostanza, esegue una ricerca in linea sulla query che viene passata come parametro per questa funzione. Quindi, RSiteSearch ("modelli lineari") compilerà la ricerca sul sito Web "RSiteSearch" per la stringa "modelli lineari".
Se stai lottando per ottenere aiuto per R e la documentazione integrata non ti soddisfa, ci sono molti pacchetti aggiuntivi che puoi installare per ottenere tutto l'aiuto di cui hai bisogno con R. Pacchetti come "sos" è disponibile per il download offerto da CRAN. Questo pacchetto R contiene alcune funzioni chiare e concise che renderebbero la ricerca di tutti i tipi di query attraverso tutti i file di aiuto disponibili sul sito Web "RSiteSearch".
Anche l'installazione del pacchetto è ragionevolmente semplice. Tutto ciò che devi fare è eseguire il codice install.packages ("sos") nella console R, quindi tutto ciò che resta è caricare il pacchetto. Il caricamento del pacchetto può essere effettuato tramite l'uso della libreria ("sos").
Con l'installazione del pacchetto “sos” avrete ora accesso alla funzione chiamata findFn(). Questa funzione findFn() accetta il parametro di ricerca come argomento e quindi restituisce l'elenco di centinaia di pagine Web, che contengono l'argomento che è stato passato. Quindi, ad esempio, se esegui la funzione findFn ("regressione") nella tua console R, ti troverai di fronte a una pagina web contenente molte informazioni.
Le informazioni includono collegamenti a molte funzioni che hanno la parola regressione nel nome, o anche se hanno la frase regressione nel testo della guida, troverai anche un riferimento ad essa se usi la funzione findFn().
Leggi: 6 interessanti idee per progetti R per principianti
Come importare dati in R
La tabella seguente è utile perché contiene alcune funzioni che risulteranno molto utili quando si desidera importare dati in R:
Funzione | Cosa fa | Esempio |
leggi.tabella() | Questa funzione è responsabile della lettura dei dati le cui colonne non sono unite. Solitamente, questa funzione viene utilizzata quando i dati che si vogliono leggere hanno le colonne separate da una virgola o da una tabulazione. Una cosa da notare è che puoi specificare tu stesso il separatore insieme ad altri diversi argomenti che descrivono accuratamente i dati che vuoi che R legga. | read.table(file= “ miofile”, sep= “ t”, intestazione=FALSO) |
leggi.csv() | Questa funzione in termini grezzi è una versione molto attenuata o annacquata del metodo read.table(). Questa funzione è stata codificata per leggere i dati da qualsiasi file CSV che viene passato a questa funzione come argomento. I file CSV sono in genere fogli di calcolo e documenti MS Excel. | read.csv(file= “ miofile”) |
leggi.csv2() | Questa funzione è essenzialmente una funzione read.csv() con piccole modifiche. La funzione Read.csv2() ha un predefinito in cui il separatore dei dati è un punto e virgola e la virgola funge da punto mobile o decimale. | read.csv2(file= “ miofile”, intestazione=FALSO) |
read.delim() | Questa funzione viene utilizzata quando il motivo principale è leggere i file che sono stati delimitati. Il separatore predefinito utilizzato qui è tab. | read.delim(file= “ miofile”, intestazione=VERO) |
scansione() | Questa funzione ti dà un controllo più fine e molto più preciso sui dati che vuoi vengano letti da R se i dati in questione non sono tabulari. | scan("myfile",skip=1, nmax=10) |
readLines() | Questa funzione viene utilizzata quando la lettura di una riga alla volta da un file di testo è il lavoro richiesto che vogliamo che il programma esegua. | readLines ("il mio file") |
leggi.fwf | Se i dati che hai hanno date nel formato a larghezza fissa, dovresti usare questa funzione perché legge le date nel formato a larghezza fissa. In parole più semplici, se i dati che hai hanno un numero fisso di caratteri in ciascuna colonna, allora questa funzione dovrebbe essere utilizzata. | read.fwf ("il mio file", larghezze=c(1,2,3) |
L'host della funzione a cui avrai accesso dopo aver eseguito quella riga di codice e lo scopo che servono sono elencati di seguito:

Funzione | Cosa fa | Esempio |
read.spss | Questa funzione prende il nome di un file SPSS come argomento e lo legge nel programma R. | read.spss ("il mio file") |
leggi.dta | Questa funzione accetta l'input del nome del file in formato binario Stata e lo legge nel programma R. | read.dta ("il mio file") |
read.xport | Questa funzione prende l'argomento del nome di un file di esportazione SAS e legge il file nel programma R. | read.export ("il mio file") |
Fonte
Dai un'occhiata anche a: Perché imparare R? Gli 8 motivi principali per imparare R
Diversi tipi di dati e la manipolazione di base delle tabelle
1. Ci sono fondamentalmente tre tipi di dati che sono di grande importanza quando si programma in R. Questi tre tipi sono e precisamente: numerico, carattere e un fattore. Puoi eseguire rapidamente una ricerca per quale tipo di tipo di dati è questo, oppure puoi anche eseguire il typecast utilizzando i seguenti due comandi, rispettivamente, is.factor() e as.factor().
2. Se ti capita di importare una tabella le cui variabili contengono una o più voci, che sono caratteri, R eseguirà automaticamente il cast della tabella come tipo di dati del fattore. Tuttavia, detto questo puoi ancora eseguire il cast dei dati in numerico forzando R, usando il comando= as.numeric(as.character(dat1$VAR1)).
3. I nomi dei comandi (dat1)=c(“ID”, “X”, “Y”, “Z”) rinominano effettivamente la variabile nel set di dati. Dovrai tenere a mente e la lunghezza del vettore dovrebbe corrispondere al numero di variabili che hai; in caso contrario, ti imbatterai in un errore.
4. Il comando fix (dat2) apre tutti i dati che hai in un foglio di calcolo in cui puoi modificare le celle con un semplice doppio clic nelle celle.
5. Se i dati in tuo possesso contengono solo valori numerici nella tabella, puoi eseguire la trasposizione della tabella. Utilizzare, dat2 = t(dat1), e la tabella denominata dat2 conterrà la trasposizione (trasformando tutte le righe in colonne) della tabella di dati contenuta in dat1.
Suggerimenti su come creare dati casuali e come eseguire il campionamento casuale
1. La funzione rnorm(10) accetta l'argomento 10 e crea dieci campioni casuali. Questi campioni casuali sono generati da una distribuzione normale, che ha una media zero, e la deviazione standard del set di dati sembra essere 1.
2. La funzione runif(10) prende dieci diversi campioni casuali per creare una distribuzione uniforme e il cui valore è compreso tra zero e uno.
3. La funzione round(rnorm(10)*3+15) prende dieci campioni, che sono casuali da una distribuzione normale la cui media è 15, e la deviazione standard che ha è di 3 e i punti mobili che sono presenti nel i dati vengono rimossi con l'aiuto della funzione di arrotondamento.
4. La funzione round(runif(10)*5+15) restituisce all'utente numeri interi casuali, che hanno un valore compreso tra 15 e 20. La distribuzione di questi valori sarà uniforme.
5. La funzione sample(c(“A”, “B”, “C”), 10, replace=TRUE) campiona e crea un campione casuale da qualsiasi vettore che è stato passato come argomento a questa funzione.
Impara i corsi di scienza dei dati dalle migliori università del mondo. Guadagna programmi Executive PG, programmi di certificazione avanzati o programmi di master per accelerare la tua carriera.
Suggerimenti su come trasformare i dati all'interno della tabella dati
1. La chiamata alla funzione della funzione di trasformazione eseguita in questo modo dat2=transform(dat1, VAR1=VAR1*0.4), moltiplica i valori memorizzati in VAR1 per 0,4 e quindi riassegna nuovamente il valore moltiplicato a VAR1.
2. La chiamata della funzione transform può essere utilizzata anche per creare variabili con dipendenze specifiche da variabili esistenti. Se chiami la funzione in questo modo dat2=transform(dat1, VAR2=VAR1*2), creerà una nuova variabile con il nome di VAR2, che conterrà il valore di VAR1 moltiplicato per un fattore due.
3. È inoltre possibile chiamare la funzione di trasformazione per modificare i valori in qualsiasi sito specifico richiesto. Per eseguire tale attività, dovrai chiamare la funzione come dat2=transform(dat1, VAR1=ifelse(VAR3== “Sito 1”, VAR1*0.4, VAR1)). La chiamata, come accennato in precedenza della funzione di trasformazione, moltiplica i dati memorizzati in VAR1 per le voci di dati, che sono il luogo noto come sito 1. Il valore della variabile VAR1 rimane lo stesso ovunque.
Leggi: 8 sorprendenti progetti di scienza dei dati in R per principianti
Conclusione
Il mondo della programmazione ha visto un boom di linguaggi negli ultimi anni. Questi linguaggi di programmazione hanno lo scopo di sradicare e focalizzare la sua attenzione su un aspetto dell'informatica. I linguaggi come R hanno un solido approccio statistico e incentrato sulla scienza dei dati principalmente a causa delle caratteristiche integrate che questo linguaggio possiede.
Mentre si lavora in qualsiasi linguaggio di programmazione, avere tutti i comandi a portata di mano non è un compito facile. Ora, è qui che il cheat sheet di R viene in soccorso. Una cosa da ricordare sempre è che il miglior cheat sheet di R è quello che crei tu.
Qual è il significato di C nel linguaggio di programmazione R?
La funzione C sta per "Combina" nel linguaggio di programmazione R. Questa funzione viene utilizzata per ottenere l'output passando i parametri nella funzione. Puoi estrarre i dati in tre modi diversi con l'uso di C in R: usando il comando c(row) per estrarre le righe, il comando c(column) per estrarre le colonne e il comando c(row, column) per estrarre entrambe le colonne e righe.
Qui, devi fornire il valore di righe e colonne nella funzione dal set di dati che stai utilizzando. La funzione restituirà un vettore in cambio di questo comando. Oltre a questo, puoi usare la funzione c() per combinare due vettori diversi.
Cosa sono le funzioni R?
Le funzioni sono moduli autonomi di codice utilizzati per eseguire un'attività specifica. Di solito, le funzioni accettano una particolare struttura di dati come valore, frame di dati, vettore o qualsiasi altra cosa e la elaborano per restituire un risultato. Gli argomenti vengono passati in queste funzioni tra parentesi per specificare i requisiti.
Ci sono due tipi di funzioni utilizzate in R: di base e definite dall'utente. Le funzioni di base sono quelle già disponibili nel linguaggio di programmazione R. È possibile accedere a queste funzioni da vari pacchetti o librerie disponibili in R. Ogni funzione viene utilizzata per uno scopo diverso e per completare un'attività specifica. Alcune delle funzioni di base in R sono sqrt(), round(), getwd(), ecc. Poiché non è possibile completare ogni azione con l'aiuto delle funzioni di base, è necessario avvalersi dell'aiuto delle funzioni definite dall'utente scrivendo il tuo codice per eseguire determinate attività personalizzate. Queste funzioni vengono sviluppate quando devi eseguire determinate azioni più volte. Una funzione può semplificarti le cose.
Quali sono alcune delle caratteristiche chiave del linguaggio di programmazione R?
Ci sono molti modi in cui R può aiutare analisti di dati e scienziati di dati. Alcune delle sue caratteristiche chiave lo aiutano a distinguersi dalla massa generale dei linguaggi statistici. Le caratteristiche principali sono forti capacità grafiche, la capacità di eseguire calcoli statistici complessi, eseguire codice senza la necessità di alcun compilatore, data wrangling, gestione dei dati e capacità di archiviazione e la capacità di generare report nei formati desiderati.