R Cheat Sheet: el que debe tener a mano
Publicado: 2020-05-29Tabla de contenido
Introducción
El estado del lenguaje de programación R ha pasado de ser un mero lenguaje de programación creado para el análisis estadístico a una herramienta integral más potente. La base de usuarios de R también ha crecido en los últimos años. Ahora está siendo empleado por una gran cantidad de programadores, académicos y profesionales. Para aprovechar al máximo cualquier lenguaje de programación, aprender a obtener ayuda es esencial porque es probable que ocurran errores.
Por lo tanto, con el conocimiento de la sintaxis, el conocimiento sobre cómo acceder a los archivos de ayuda de R y encontrar ayuda de otras fuentes es fundamental para el éxito como programador de R. Ahora, aquí es donde la hoja de trucos de R será útil. La hoja de trucos de R contiene todas las funciones vitales junto con sus llamadas para una fácil referencia de los programadores.
Más información: Tutorial de R para principiantes: Conviértase en un experto en programación R
Obtener ayuda con el lenguaje de programación R
Incluso los mejores libros para presentar a las personas y facilitarles el camino hacia el mundo de la programación en R no son suficientes por sí solos. A veces, uno necesita aprender y acceder a los archivos de ayuda de R. Este archivo de ayuda del que seguimos hablando presenta al usuario información detallada sobre cómo usar varias dependencias en R. Cómo hacer uso de una función en particular, ya que cada función integrada se incluye en estos archivos de ayuda. Los ejemplos de código sobre cómo usar la función específica también se encuentran en cada una de estas diferentes páginas de ayuda.
Si desea acceder a los archivos de ayuda de R, para obtener ayuda sobre cómo usar una función en particular, deberá usar cualquiera de las funciones que se enumeran a continuación:
1. ?: El uso de un solo signo de interrogación muestra los archivos de ayuda correspondientes a cualquier función para la que el usuario desee obtener ayuda. Por ejemplo, “?data.frame” vería la página en los archivos de ayuda de R que contienen la documentación sobre cómo usar la función data.frame().
2. ??: si desea buscar una subcadena en particular en los archivos de ayuda de R, “??” hará el trabajo por ti. Entonces, si desea conocer los nombres de una función que contiene la palabra "lista", todo lo que tiene que hacer es ejecutar "?? lista" y su problema se resolverá
3. RSiteSearch(): Esta función RSiteSearch() esencialmente hace lo que le da nombre. Básicamente, realiza una búsqueda en línea sobre la consulta que se pasa como parámetro para esta función. Entonces, RSiteSearch ("modelos lineales") compilará la búsqueda en el sitio web "RSiteSearch" para la cadena "modelos lineales".
Si tiene dificultades para obtener ayuda para R y la documentación integrada no le sienta bien, hay muchos paquetes complementarios que puede instalar para obtener toda la ayuda que necesita con R. Paquetes como "sos" es disponible para descargar que ofrece CRAN. Este paquete de R contiene una función clara y concisa que haría la búsqueda de todo tipo de consultas a través de todos los archivos de ayuda disponibles en el sitio web "RSiteSearch".
La instalación del paquete también es razonablemente sencilla. Todo lo que necesita hacer es ejecutar el código install.packages ("sos") en la consola R, luego todo lo que queda es cargar el paquete. La carga del paquete se puede realizar mediante el uso de la biblioteca ("sos").
Con la instalación del paquete “sos”, ahora tendrá acceso a la función llamada findFn(). Esta función findFn() toma el parámetro de búsqueda como argumento y luego devuelve la lista de cientos de páginas web que contienen el argumento que se ha pasado. Entonces, por ejemplo, si ejecuta la función findFn ("regresión") en su consola R, se encontrará con una página web que contiene mucha información.
La información incluye enlaces a muchas funciones que tienen la palabra regresión en el nombre, o incluso si tienen la frase regresión en su texto de ayuda, también encontrará una referencia si usa la función findFn().
Leer: 6 ideas interesantes de proyectos R para principiantes
Cómo importar datos en R
La siguiente tabla es útil porque contiene algunas funciones que serán muy útiles cuando desee importar datos a R:
Función | Que hace | Ejemplo |
leer.tabla() | Esta función se encarga de leer los datos cuyas columnas no están unidas. Por lo general, esta función se emplea cuando los datos que desea leer tienen sus columnas separadas por una coma o un tabulador. Una cosa a tener en cuenta es que puede especificar el separador usted mismo junto con otros argumentos diferentes que describen con precisión los datos que desea que lea R. | read.table(archivo= “ miarchivo”, sep= “ t”, encabezado = FALSO) |
leer.csv() | Esta función en términos crudos es una versión muy atenuada o suavizada del método read.table(). Esta función se ha codificado de forma rígida para leer los datos de cualquier archivo CSV que se pase a esta función como argumento. Los archivos CSV suelen ser hojas de cálculo y documentos de MS Excel. | read.csv(archivo= “ miarchivo”) |
leer.csv2() | Esta función es esencialmente una función read.csv() con ajustes menores. La función Read.csv2() tiene un valor predeterminado donde el separador de datos es un punto y coma y la coma sirve como punto flotante o decimal. | read.csv2(file= “ miarchivo”, encabezado = FALSO) |
leer.delim() | Esta función se utiliza cuando el motivo principal es leer los archivos que han sido delimitados. El separador predeterminado que se utiliza aquí es la pestaña. | read.delim(archivo= “ miarchivo”, encabezado = VERDADERO) |
escanear() | Esta función le brinda un control más fino y mucho más preciso sobre los datos que desea que R lea si los datos en cuestión no son tabulares. | escanear(“miarchivo”,saltar=1, nmáx=10) |
leerlíneas() | Esta función se usa cuando leer una línea a la vez de un archivo de texto es el trabajo requerido que queremos que realice el programa. | readLines(“miarchivo”) |
leer.fwf | Si los datos que tiene tienen fechas en formato de ancho fijo, entonces debe usar esta función porque lee las fechas en formato de ancho fijo. En palabras más simples, si los datos que tiene tienen un número fijo de caracteres en cada columna, entonces se debe usar esta función. | read.fwf(“miarchivo”, anchos=c(1,2,3) |
La gran cantidad de funciones a las que obtendrá acceso después de ejecutar esa línea de código y el propósito al que sirven se enumeran a continuación:

Función | Que hace | Ejemplo |
leer.spss | Esta función toma el nombre de un archivo SPSS como argumento y lo lee en el programa R. | read.spss(“miarchivo”) |
leer.dta | Esta función toma la entrada del nombre del archivo en formato binario de Stata y lo lee en el programa R. | read.dta(“miarchivo”) |
leer.xportar | Esta función toma el argumento del nombre de un archivo de exportación SAS y lee el archivo en el programa R. | read.export(“miarchivo”) |
Fuente
Consulte también: ¿Por qué aprender R? Las 8 razones principales para aprender R
Diferentes tipos de datos y la manipulación básica de las tablas.
1. Básicamente, hay tres tipos de datos que son de gran importancia cuando se programa en R. Estos tres tipos son: numéricos, de carácter y factor. Puede hacer una búsqueda rápida de qué tipo de tipo de datos es este, o también puede encasillarlos usando los siguientes dos comandos, respectivamente, is.factor() y as.factor().
2. Si importa una tabla cuyas variables contienen una o más entradas, que son caracteres, R convertirá automáticamente la tabla como el tipo de datos del factor. Sin embargo, dicho esto, aún puede convertir los datos en numéricos forzando R, usando el comando = as.numeric(as.character(dat1$VAR1)).
3. El comando nombres (dat1)=c(“ID”, “X”, “Y”, “Z”) en realidad cambia el nombre de la variable en su conjunto de datos. Deberá tener en cuenta que la longitud del vector debe coincidir con la cantidad de variables que tiene; de lo contrario, se encontrará con un error.
4. El comando fix (dat2) abre todos los datos que tiene en un documento de hoja de cálculo donde puede editar las celdas con un simple doble clic en las celdas.
5. Si los datos que tiene solo contienen valores numéricos en la tabla, puede tomar la transposición de la tabla. Use, dat2 = t(dat1), y la tabla nombrada como dat2 contendrá la transposición (convirtiendo todas las filas en columnas) de la tabla de datos contenida en dat1.
Consejos sobre cómo crear datos aleatorios y cómo hacer un muestreo aleatorio
1. La función rnorm(10) toma el argumento de 10 y crea diez muestras aleatorias. Estas muestras aleatorias se generan a partir de una distribución normal, que tiene una media cero, y la desviación estándar del conjunto de datos es 1.
2. La función runif(10) toma diez muestras aleatorias diferentes para crear una distribución uniforme y cuyo valor está entre cero y uno.
3. La función round(rnorm(10)*3+15) toma diez muestras, las cuales son aleatorias de una distribución normal cuya media es 15, y la desviación estándar que tiene es de 3 y los puntos flotantes que hay en la los datos se eliminan con la ayuda de la función de redondeo.
4. La función round(runif(10)*5+15) devuelve al usuario enteros aleatorios, que tiene el valor entre los valores de 15 y 20. La distribución de estos valores será uniforme.
5. La función sample(c(“A”, “B”, “C”), 10, replace=TRUE) muestrea y crea una muestra aleatoria a partir de cualquier vector que se haya pasado como argumento a esta función.
Aprenda cursos de ciencia de datos de las mejores universidades del mundo. Obtenga programas Executive PG, programas de certificados avanzados o programas de maestría para acelerar su carrera.
Sugerencias sobre cómo transformar los datos que están dentro de la tabla de datos
1. La llamada de función de la función de transformación hecha así dat2=transform(dat1, VAR1=VAR1*0.4), multiplica los valores almacenados en VAR1 con 0,4 y luego reasigna el valor multiplicado a VAR1 nuevamente.
2. La llamada de la función transform también se puede usar para crear variables con dependencias específicas en variables existentes. Si llama a la función como esta dat2=transform(dat1, VAR2=VAR1*2), creará una nueva variable con el nombre de VAR2, que contendrá el valor de VAR1 multiplicado por un factor de dos.
3. También puede llamar a la función de transformación para modificar los valores en cualquier sitio específico que necesite. Para realizar esa tarea, deberá llamar a la función como dat2=transform(dat1, VAR1=ifelse(VAR3== “Sitio 1”, VAR1*0.4, VAR1)). La llamada, como se mencionó anteriormente de la función de transformación, multiplica los datos almacenados en VAR1 por las entradas de datos, que son el lugar conocido como sitio 1. El valor de la variable VAR1 permanece igual en todos los demás lugares.
Leer: 8 asombrosos proyectos de ciencia de datos en R para principiantes
Conclusión
El mundo de la programación ha visto un boom de lenguajes en los últimos años. Estos lenguajes de programación tienen como objetivo erradicar y centrar su atención en un aspecto de la informática. Los lenguajes como R tienen un sólido enfoque estadístico y centrado en la ciencia de datos principalmente debido a las características integradas que posee este lenguaje.
Mientras se trabaja en cualquier lenguaje de programación, tener todos los comandos al alcance de la mano no es una tarea fácil. Ahora, aquí es donde la hoja de trucos R viene al rescate. Una cosa que siempre debe recordar es que la mejor hoja de trucos de R es la que usted crea.
¿Cuál es el significado de C en el lenguaje de programación R?
La función C significa 'Combinar' en el lenguaje de programación R. Esta función se utiliza para obtener la salida pasando parámetros en la función. Puede extraer datos de tres maneras diferentes con el uso de C en R: usando el comando c(fila) para extraer filas, el comando c(columna) para extraer columnas y el comando c(fila, columna) para extraer ambas columnas y filas.
Aquí, debe proporcionar el valor de las filas y columnas en la función del conjunto de datos que está utilizando. La función devolverá un vector a cambio de este comando. Aparte de eso, puede usar la función c() para combinar dos vectores diferentes.
¿Qué son las funciones R?
Las funciones son módulos de código autónomos que se utilizan para realizar una tarea específica. Por lo general, las funciones toman una estructura de datos particular como valor, marco de datos, vector o cualquier cosa y la procesan para devolver un resultado. Los argumentos se pasan en estas funciones entre paréntesis para especificar los requisitos.
Hay dos tipos de funciones que se utilizan en R: básicas y definidas por el usuario. Las funciones básicas son las que ya están disponibles en el lenguaje de programación R. Puede acceder a estas funciones desde varios paquetes o bibliotecas que están disponibles en R. Cada función se usa para un propósito diferente y para completar una tarea específica. Algunas de las funciones básicas en R son sqrt(), round(), getwd(), etc. Dado que no es posible completar todas las acciones con la ayuda de las funciones básicas, necesita la ayuda de las funciones definidas por el usuario. escribiendo su propio código para realizar ciertas tareas personalizadas. Estas funciones se desarrollan cuando tienes que realizar ciertas acciones varias veces. Una función puede hacer esto más fácil para usted.
¿Cuáles son algunas de las características clave del lenguaje de programación R?
Hay muchas formas en que R puede ayudar a los analistas y científicos de datos. Algunas de sus características clave lo ayudan a destacarse entre la multitud general de lenguajes estadísticos. Las características clave son sólidas capacidades gráficas, la capacidad de realizar cálculos estadísticos complejos, ejecutar código sin la necesidad de ningún compilador, manejo de datos, capacidades de almacenamiento y manejo de datos, y la capacidad de generar informes en los formatos deseados.