Шпаргалка R: та, которую вы должны держать под рукой
Опубликовано: 2020-05-29Оглавление
Введение
Статус языка программирования R вырос из простого языка программирования, предназначенного для статистического анализа, в более мощный универсальный инструмент. База пользователей R также выросла за последние несколько лет. В настоящее время он используется множеством программистов, ученых и практиков. Чтобы максимально эффективно использовать любой язык программирования, необходимо научиться получать помощь, потому что ошибки неизбежно случаются.
Таким образом, при знании синтаксиса знание того, как получить доступ к файлам справки R и найти справку из других источников, имеет решающее значение для успеха программиста R. Теперь здесь пригодится шпаргалка по R. Шпаргалка R содержит все жизненно важные функции, а также призывы к легкому справочнику программистов.
Узнать больше: Учебное пособие по R для начинающих: станьте экспертом в программировании на R
Получение помощи по языку программирования R
Даже лучших книг, которые знакомят людей и облегчают им путь в мир программирования на R, самих по себе недостаточно. Иногда нужно изучить и получить доступ к файлам справки R. Этот файл справки, о котором мы продолжаем говорить, предоставляет пользователю детальную информацию о том, как использовать различные зависимости в R. Как использовать конкретную функцию, поскольку каждая встроенная функция встроена в эти файлы справки. Примеры кода о том, как использовать конкретную функцию, также есть на каждой из этих разных страниц справки.
Если вы хотите получить доступ к файлам справки R, чтобы получить помощь по использованию определенной функции, вам придется использовать любую из функций, перечисленных ниже:
1. ?: Использование одного вопросительного знака отображает файлы справки, относящиеся к любой функции, для которой пользователь хочет получить помощь. Например, «?data.frame» будет отображать страницу в файлах справки R, содержащую документацию по использованию функции data.frame().
2. ??: Если вы хотите найти определенную подстроку в файлах справки R, «??» сделает работу за вас. Итак, если вы хотите узнать имена функций, которые содержат слово «список», все, что вам нужно сделать, это запустить «??list», и ваша проблема будет решена.
3. RSiteSearch(): Эта функция RSiteSearch() по существу делает то, в честь чего она названа. По сути, он выполняет онлайн-поиск по запросу, который передается в качестве параметра для этой функции. Итак, RSiteSearch («линейные модели») скомпилирует поиск на веб-сайте «RSiteSearch» для строки «линейные модели».
Если вы изо всех сил пытаетесь получить помощь по R, а встроенная документация вас не устраивает, существует множество дополнительных пакетов, которые вы можете установить, чтобы получить всю необходимую помощь по R. Такие пакеты, как «sos», доступен для скачивания, который предлагает CRAN. Этот пакет R содержит четкую и лаконичную функцию, которая позволит выполнять поиск всех видов запросов по всем файлам справки, доступным на веб-сайте «RSiteSearch».
Установка пакета также достаточно проста. Все, что вам нужно сделать, это запустить код install.packages («sos») в консоли R, после чего останется только загрузить пакет. Загрузка пакета может быть выполнена с помощью библиотеки ("sos").
После установки пакета «sos» у вас появится доступ к функции findFn(). Эта функция findFn() принимает параметр поиска в качестве аргумента, а затем возвращает список сотен веб-страниц, содержащих переданный аргумент. Так, например, если вы запустите функцию findFn («регрессия») в консоли R, вы столкнетесь с веб-страницей, содержащей много информации.
Информация включает ссылки на многие функции, в названии которых есть слово регрессия, или даже если в их тексте справки есть фраза регрессия, вы также найдете ссылку на нее, если воспользуетесь функцией findFn().
Читайте: 6 интересных идей проекта R для начинающих
Как импортировать данные в R
Следующая таблица удобна, потому что она содержит некоторые функции, которые очень пригодятся, когда вы захотите импортировать данные в R:
Функция | Что оно делает | Пример |
читать.таблицу() | Эта функция отвечает за чтение данных, столбцы которых не объединены. Обычно эта функция используется, когда столбцы данных, которые вы хотите прочитать, разделены запятой или табуляцией. Следует отметить, что вы можете указать разделитель самостоятельно вместе с некоторыми другими различными аргументами, которые точно описывают данные, которые вы хотите, чтобы R читал. | read.table (файл = « мой файл» , sep = « t», заголовок=ЛОЖЬ) |
читать.csv() | Грубо говоря, эта функция представляет собой очень смягченную или разбавленную версию метода read.table(). Эта функция была жестко закодирована для чтения данных из любого CSV-файла, который передается в эту функцию в качестве аргумента. Файлы CSV обычно представляют собой электронные таблицы и документы MS Excel. | read.csv (файл = « мой файл» ) |
читать.csv2() | Эта функция по сути является функцией read.csv() с небольшими изменениями. Функция Read.csv2() имеет предустановку, в которой разделителем данных является точка с запятой, а запятая служит плавающей или десятичной точкой. | read.csv2 (файл = « мой файл» , заголовок=ЛОЖЬ) |
читать.разделитель() | Эта функция используется, когда основной целью является чтение файлов с разделителями. Разделителем по умолчанию, который здесь используется, является табуляция. | read.delim (файл = « мой файл» , заголовок = ИСТИНА) |
сканирование() | Эта функция дает вам более тонкий и гораздо более точный контроль над данными, которые вы хотите прочитать с помощью R, если рассматриваемые данные не являются табличными. | сканирование("мой файл",пропустить=1, пмакс=10) |
читать линии () | Эта функция используется, когда чтение по одной строке из текстового файла является необходимой задачей, которую мы хотим, чтобы программа выполняла. | readLines("мой файл") |
читать.fwf | Если данные, которые у вас есть, имеют даты в формате с фиксированной шириной, вам следует использовать эту функцию, потому что она считывает даты в формате с фиксированной шириной. Проще говоря, если данные, которые у вас есть, имеют фиксированное количество символов в каждом столбце, следует использовать эту функцию. | read.fwf («мой файл», ширина=с(1,2,3) |
Ниже перечислены функции, к которым вы получите доступ после запуска этой строки кода, и цели, которым они служат:

Функция | Что оно делает | Пример |
read.spss | Эта функция принимает в качестве аргумента имя файла SPSS и считывает его в программу R. | read.spss("мой файл") |
read.dta | Эта функция принимает на вход имя файла в двоичном формате Stata и считывает его в программу R. | read.dta («мой файл») |
read.xport | Эта функция принимает в качестве аргумента имя файла экспорта SAS и считывает файл в программу R. | read.export («мой файл») |
Источник
Также проверьте: Зачем изучать R? 8 главных причин изучить R
Различные типы данных и основные операции с таблицами
1. В основном существует три типа данных, которые имеют большое значение при программировании в R. Вот эти три типа: числовые, символьные и множительные. Вы можете быстро выполнить поиск того, какой это тип данных, или вы также можете выполнить приведение типов, используя следующие две команды, соответственно, is.factor() и as.factor().
2. Если вам случится импортировать таблицу, переменные которой содержат одну или несколько записей, которые являются символами, то R автоматически приведёт таблицу к типу данных фактора. Однако при этом вы все равно можете преобразовать данные в числовые, заставив R, используя команду = as.numeric(as.character(dat1$VAR1)).
3. Имена команд (dat1)=c("ID", "X", "Y", "Z") фактически переименовывают переменную в вашем наборе данных. Вам нужно будет помнить, что длина вектора должна соответствовать количеству переменных, которые у вас есть; в противном случае вы столкнетесь с ошибкой.
4. Команда fix (dat2) открывает все имеющиеся у вас данные в электронной таблице, где вы можете редактировать ячейки простым двойным щелчком в ячейках.
5. Если данные, которые у вас есть, содержат только числовые значения в таблице, вы можете выполнить транспонирование таблицы. Используйте dat2 = t(dat1), и таблица с именем dat2 будет содержать транспонирование (преобразование всех строк в столбцы) таблицы данных, содержащейся в dat1.
Советы о том, как создать случайные данные и как сделать случайную выборку
1. Функция rnorm(10) принимает аргумент 10 и создает десять случайных выборок. Эти случайные выборки генерируются из нормального распределения, которое имеет нулевое среднее значение, а стандартное отклонение набора данных равно 1.
2. Функция runif(10) использует десять различных случайных выборок для создания равномерного распределения со значением от нуля до единицы.
3. Функция round(rnorm(10)*3+15) берет десять выборок, которые являются случайными из нормального распределения, среднее значение которого равно 15, а стандартное отклонение равно 3, а плавающие точки находятся в данные удаляются с помощью функции округления.
4. Функция round(runif(10)*5+15) возвращает пользователю случайные целые числа, значение которых находится между значениями 15 и 20. Распределение этих значений будет равномерным.
5. Функция sample(c("A", "B", "C"), 10, replace=TRUE) производит выборку и создает случайную выборку из любого вектора, переданного в качестве аргумента этой функции.
Изучите курсы по науке о данных в лучших университетах мира. Участвуйте в программах Executive PG, Advanced Certificate Programs или Master Programs, чтобы ускорить свою карьеру.
Советы по преобразованию данных, находящихся внутри таблицы данных
1. Функциональный вызов функции преобразования, выполненный следующим образом: dat2=transform(dat1, VAR1=VAR1*0.4), умножает значения, хранящиеся в VAR1, на 0,4, а затем снова присваивает умноженное значение переменной VAR1.
2. Вызов функции преобразования также можно использовать для создания переменных с определенными зависимостями от существующих переменных. Если вы вызовете такую функцию dat2=transform(dat1, VAR2=VAR1*2), она создаст новую переменную с именем VAR2, которая будет содержать значение VAR1, умноженное на два.
3. Вы также можете вызвать функцию преобразования, чтобы изменить значения на любом конкретном сайте, который вам нужен. Для выполнения этой задачи вам нужно будет вызвать функцию типа dat2=transform(dat1, VAR1=ifelse(VAR3== «Сайт 1», VAR1*0,4, VAR1)). Вызов функции преобразования, как упоминалось ранее, умножает данные, хранящиеся в VAR1, на записи данных, которые являются местом, известным как сайт 1. Значение переменной VAR1 остается одинаковым везде.
Читайте : 8 удивительных проектов по науке о данных в R для начинающих
Заключение
За последние несколько лет в мире программирования произошел бум языков. Эти языки программирования нацелены на искоренение и сосредоточение внимания на одном аспекте вычислений. Такие языки, как R, имеют надежный подход, ориентированный на статистику и науку о данных, в основном из-за встроенных функций, которыми обладает этот язык.
При работе на любом языке программирования иметь под рукой каждую команду — непростая задача. Вот тут-то и приходит на помощь шпаргалка R. Всегда нужно помнить одну вещь: лучшая шпаргалка по R — это та, которую вы создаете.
Что означает C в языке программирования R?
Функция C означает «Объединить» на языке программирования R. Эта функция используется для получения вывода путем передачи параметров в функцию. Вы можете извлекать данные тремя различными способами с помощью C в R: используя команду c(row) для извлечения строк, команду c(column) для извлечения столбцов и команду c(row, column) для извлечения обоих столбцов. и ряды.
Здесь вы должны указать значение строк и столбцов в функции из набора данных, который вы используете. В ответ на эту команду функция вернет вектор. Помимо этого, вы можете использовать функцию c() для объединения двух разных векторов.
Что такое R-функции?
Функции — это автономные модули кода, которые используются для выполнения определенной задачи. Обычно функции принимают определенную структуру данных, такую как значение, кадр данных, вектор или что-то еще, и обрабатывают ее для возврата результата. Аргументы передаются в эти функции в скобках для указания требований.
В R используются два типа функций: базовые и определяемые пользователем. Базовые функции — это те, которые уже доступны в языке программирования R. Вы можете получить доступ к этим функциям из различных пакетов или библиотек, доступных в R. Каждая функция используется для разных целей и для выполнения определенной задачи. Некоторыми из основных функций в R являются sqrt(), round(), getwd() и т. д. Поскольку невозможно выполнить каждое действие с помощью базовых функций, вам необходимо воспользоваться помощью пользовательских функций. путем написания собственного кода для выполнения определенных настраиваемых задач. Эти функции разработаны, когда вам нужно выполнить определенные действия несколько раз. Функция может сделать это проще для вас.
Каковы некоторые из ключевых особенностей языка программирования R?
Существует множество способов, которыми R может помочь аналитикам данных и специалистам по данным. Некоторые из его ключевых особенностей помогают ему выделиться из общей массы статистических языков. Ключевыми функциями являются мощные графические возможности, возможность выполнять сложные статистические расчеты, выполнение кода без необходимости использования какого-либо компилятора, обработка данных, возможности обработки и хранения данных, а также возможность создавать отчеты в желаемых форматах.