R Cheat Sheet: O que você deve manter à mão

Publicados: 2020-05-29

Índice

Introdução

O status da linguagem de programação R cresceu de uma mera linguagem de programação feita para análise estatística para uma ferramenta mais potente e completa. A base de usuários do R também cresceu nos últimos anos. Ele agora está sendo empregado por uma série de programadores, acadêmicos e profissionais. Para tirar o máximo proveito de qualquer linguagem de programação, aprender como obter ajuda é essencial porque erros podem acontecer.

Portanto, com o conhecimento da sintaxe, o conhecimento sobre como acessar os arquivos de ajuda do R e encontrar ajuda de outras fontes é fundamental para o sucesso como programador de R. Agora, aqui é onde a folha de dicas do R será útil. A folha de dicas do R contém todas as funções vitais junto com suas chamadas para uma referência fácil dos programadores.

Saiba mais: Tutorial R para iniciantes: torne-se um especialista em programação R

Obtendo ajuda com a linguagem de programação R

Mesmo os melhores livros para apresentar as pessoas e facilitar seu caminho no mundo da programação em R não são suficientes por si só. Às vezes é preciso aprender e acessar os arquivos de ajuda do R. Este arquivo de ajuda sobre o qual continuamos falando apresenta ao usuário informações detalhadas sobre como usar várias dependências no R. Como usar uma função específica, pois cada função interna é incorporada a esses arquivos de ajuda. Os exemplos de código sobre como usar a função específica também estão em cada uma dessas diferentes páginas de ajuda.

Se você quiser acessar os arquivos de ajuda do R, para obter ajuda sobre como usar um determinado recurso, você terá que usar qualquer uma das funções listadas abaixo:

1. ?: O uso de um único ponto de interrogação exibe os arquivos de ajuda referentes a qualquer função que o usuário deseja obter ajuda. Por exemplo, “?data.frame” exibiria a página nos arquivos de ajuda do R que contêm a documentação sobre como usar a função data.frame().

2. ??: Se você deseja pesquisar uma substring específica nos arquivos de ajuda do R, “???” fará o trabalho para você. Então, se você quiser saber os nomes de uma função que contém a palavra “list” neles, tudo o que você precisa fazer é executar “??list” e seu problema será resolvido

3. RSiteSearch(): Esta função RSiteSearch() essencialmente faz o que lhe deu o nome. Essencialmente, ele faz uma pesquisa online sobre a consulta que é passada como parâmetro para essa função. Assim, RSiteSearch(“modelos lineares”) irá compilar a busca no site “RSiteSearch” para a string “modelos lineares”.

Se você está lutando para obter ajuda para o R e as documentações incorporadas não estão bem com você, existem muitos pacotes complementares que você pode instalar para obter toda a ajuda necessária com o R. Pacotes como “sos” são disponível para download que é oferecido pelo CRAN. Este pacote R contém alguma função clara e concisa que faria a busca por todos os tipos de consultas através de todos os arquivos de ajuda disponíveis no site “RSiteSearch”.

A instalação do pacote também é razoavelmente simples. Tudo o que você precisa fazer é executar o código install.packages(“sos”) no console do R, então tudo o que resta é carregar o pacote. O carregamento do pacote pode ser feito através do uso da biblioteca (“sos”).

Com a instalação do pacote “sos”, agora você terá acesso à função chamada findFn(). Essa função findFn() recebe o parâmetro de pesquisa como argumento e, em seguida, retorna a lista de centenas de páginas da Web, que contêm o argumento que foi passado. Assim, por exemplo, se você executar a função findFn (“regressão”) em seu console R, você se deparará com uma página da web contendo muitas informações.

As informações incluem links para muitas funções que têm a palavra regressão no nome, ou mesmo que tenham a frase regressão em seu texto de ajuda, você também encontrará uma referência a ela se usar a função findFn().

Leia: 6 ideias interessantes de projetos R para iniciantes

Como importar dados para R

A tabela a seguir é útil porque contém algumas funções que serão muito úteis quando você quiser importar dados para o R:

Função O que faz Exemplo
leia.tabela() Esta função é responsável por ler os dados cujas colunas não estão unidas. Normalmente, esta função é empregada quando os dados que se deseja ler têm suas colunas separadas por vírgula ou tabulação. Uma coisa a notar é que você mesmo pode especificar o separador juntamente com alguns outros argumentos diferentes que descrevem com precisão os dados que você deseja que o R leia. read.table(arquivo= meuarquivo”, sep= t”,
cabeçalho=FALSO)
leia.csv() Esta função em termos brutos é uma versão muito atenuada ou diluída do método read.table(). Esta função foi codificada para ler os dados de qualquer arquivo CSV que está sendo passado para esta função como um argumento. Os arquivos CSV geralmente são planilhas e documentos do MS Excel. read.csv(arquivo= meuarquivo”)
leia.csv2() Esta função é essencialmente uma função read.csv() com pequenos ajustes. A função Read.csv2() tem uma predefinição onde o separador dos dados é um ponto e vírgula e a vírgula serve como ponto flutuante ou decimal. read.csv2(arquivo= meuarquivo”,
cabeçalho=FALSO)
leia.delim() Esta função é utilizada quando o motivo principal é ler os arquivos que foram delimitados. O separador padrão que está sendo usado aqui é tab. read.delim(arquivo= meuarquivo”,
cabeçalho=VERDADEIRO)
Varredura() Esta função oferece um controle mais fino e muito mais preciso sobre os dados que você deseja que sejam lidos pelo R se os dados em questão não forem tabulares. scan(“meuarquivo”,skip=1,
nmax=10)
readLinhas() Esta função é usada quando ler uma linha de cada vez de um arquivo de texto é o trabalho necessário que queremos que o programa execute. readLines(“meuarquivo”)
leia.fwf Se os dados que você possui têm datas no formato de largura fixa, você deve usar esta função porque ela lê as datas no formato de largura fixa. Em palavras mais simples, se os dados que você possui têm um número fixo de caracteres em cada coluna, essa função deve ser usada. read.fwf(“meuarquivo”,
larguras=c(1,2,3)

O host de função ao qual você terá acesso após executar essa linha de código e a finalidade a que eles servem estão listados abaixo:

Função O que faz Exemplo
leia.spss Essa função recebe o nome de um arquivo SPSS como argumento e o lê no programa R. read.spss(“meuarquivo”)
leia.dta Esta função recebe a entrada do nome do arquivo do formato binário Stata e o lê no programa R. read.dta(“meuarquivo”)
leia.xport Esta função recebe o argumento do nome de um arquivo de exportação SAS e lê o arquivo no programa R. read.export(“meuarquivo”)

Fonte

Confira também: Por que aprender R? As 8 principais razões para aprender R

Diferentes tipos de dados e a manipulação básica das tabelas

1. Existem basicamente três tipos de dados que são de grande importância quando você está programando em R. Esses três tipos são: numérico, caractere e fator. Você pode fazer uma busca rápida para que tipo de dado é este, ou você também pode fazer um typecast usando os dois comandos a seguir, respectivamente, is.factor() e as.factor().

2. Se você importar uma tabela cujas variáveis ​​contenham uma ou mais entradas, que são caracteres, então R irá automaticamente converter a tabela como o tipo de dado do fator. No entanto, dito isso, você ainda pode converter os dados em numérico forçando R, usando o comando= as.numeric(as.character(dat1$VAR1)).

3. Os nomes dos comandos (dat1)=c(“ID”, “X”, “Y”, “Z”) na verdade renomeiam a variável em seu conjunto de dados. Você terá que ter em mente que o comprimento do vetor deve corresponder ao número de variáveis ​​que você possui; caso contrário, você encontrará um erro.

4. O comando fix (dat2) abre todos os dados que você tem em um documento de planilha onde você pode editar as células com um simples clique duplo nas células.

5. Se os dados que você possui contiverem apenas valores numéricos na tabela, você pode fazer a transposição da tabela. Use, dat2 = t(dat1), e a tabela nomeada como dat2 conterá a transposição (transformando todas as linhas em colunas) da tabela de dados contida em dat1.

Dicas sobre como criar dados aleatórios e como fazer amostragem aleatória

1. A função rnorm(10) recebe o argumento de 10 e cria dez amostras aleatórias. Essas amostras aleatórias são geradas a partir de uma distribuição normal, que tem média zero, e o desvio padrão do conjunto de dados é 1.

2. A função runif(10) pega dez amostras aleatórias diferentes para criar uma distribuição uniforme e cujo valor esteja entre zero e um.

3. A função round(rnorm(10)*3+15) pega dez amostras, que são aleatórias de uma distribuição normal cuja média é 15, e o desvio padrão que ela tem é de 3 e os pontos flutuantes que existem na os dados são removidos com a ajuda da função de arredondamento.

4. A função round(runif(10)*5+15) devolve ao usuário inteiros aleatórios, que tem o valor entre os valores de 15 e 20. A distribuição desses valores será uniforme.

5. A função sample(c(“A”, “B”, “C”), 10, replace=TRUE) amostra e cria uma amostra aleatória de qualquer vetor que foi passado como argumento para esta função.

Aprenda cursos de ciência de dados das melhores universidades do mundo. Ganhe Programas PG Executivos, Programas de Certificado Avançado ou Programas de Mestrado para acelerar sua carreira.

Dicas de como transformar dados que estão dentro da tabela de dados

1. A chamada da função transform feita assim dat2=transform(dat1, VAR1=VAR1*0.4), multiplica os valores armazenados em VAR1 por 0,4 e então reatribui o valor multiplicado a VAR1 novamente.

2. A chamada da função transform também pode ser usada para criar variáveis ​​com dependências específicas de variáveis ​​existentes. Se você chamar a função assim dat2=transform(dat1, VAR2=VAR1*2), ela criará uma nova variável com o nome de VAR2, que conterá o valor de VAR1 multiplicado por um fator de dois.

3. Você também pode chamar a função transform para modificar os valores em qualquer site específico que você precisar. Para realizar essa tarefa, você terá que chamar a função como dat2=transform(dat1, VAR1=ifelse(VAR3== “Site 1”, VAR1*0.4, VAR1)). A chamada, como mencionado anteriormente da função transform, multiplica os dados armazenados em VAR1 pelas entradas de dados, que são o local conhecido como site 1. O valor da variável VAR1 permanece o mesmo em todos os outros lugares.

Leia: 8 projetos surpreendentes de ciência de dados em R para iniciantes

Conclusão

O mundo da programação viu um boom de linguagens nos últimos anos. Essas linguagens de programação visam erradicar e concentrar sua atenção em um aspecto da computação. As linguagens como R têm uma abordagem robusta centrada em estatística e ciência de dados principalmente por causa dos recursos incorporados que essa linguagem possui.

Ao trabalhar em qualquer linguagem de programação, ter todos os comandos na ponta dos dedos não é uma tarefa fácil. Agora, é aqui que a folha de dicas do R vem em socorro. Uma coisa a lembrar sempre é que a melhor folha de dicas do R é aquela que você cria.

Qual é o significado de C na linguagem de programação R?

A função C significa 'Combine' na linguagem de programação R. Esta função é utilizada para obter a saída passando parâmetros na função. Você pode extrair dados de três maneiras diferentes com o uso de C em R: usando o comando c(row) para extrair linhas, o comando c(column) para extrair colunas e o comando c(row, column) para extrair ambas as colunas e fileiras.

Aqui, você deve fornecer o valor das linhas e colunas na função do conjunto de dados que está utilizando. A função retornará um vetor em retorno a este comando. Fora isso, você pode usar a função c() para combinar dois vetores diferentes.

O que são funções R?

Funções são módulos de código independentes que são usados ​​para executar uma tarefa específica. Normalmente, as funções recebem uma estrutura de dados específica como valor, dataframe, vetor ou qualquer coisa e a processam para retornar um resultado. Os argumentos são passados ​​nessas funções entre parênteses para especificar os requisitos.

Existem dois tipos de funções sendo usadas em R: básicas e definidas pelo usuário. As funções básicas são as que já estão disponíveis na linguagem de programação R. Você pode acessar essas funções a partir de vários pacotes ou bibliotecas que estão disponíveis no R. Cada função é usada para uma finalidade diferente e para concluir uma tarefa específica. Algumas das funções básicas em R são sqrt(), round(), getwd(), etc. Como não é possível completar todas as ações com a ajuda de funções básicas, você precisa da ajuda das funções definidas pelo usuário escrevendo seu próprio código para executar determinadas tarefas personalizadas. Essas funções são desenvolvidas quando você precisa executar determinadas ações várias vezes. Uma função pode tornar isso mais fácil para você.

Quais são alguns dos principais recursos da linguagem de programação R?

Existem muitas maneiras de o R ajudar analistas de dados e cientistas de dados. Alguns de seus principais recursos o ajudam a se destacar da multidão geral de linguagens estatísticas. Os principais recursos são fortes recursos gráficos, capacidade de realizar cálculos estatísticos complexos, execução de código sem a necessidade de qualquer compilador, manipulação de dados, capacidade de manipulação e armazenamento de dados e a capacidade de gerar relatórios nos formatos desejados.