Введение в статистическое программирование с помощью R

{title}

R является статистическим языком программирования, он бесплатный и с открытым исходным кодом. Он в основном используется для сбора данных или статистических операций, все с целью создания приложений для анализа больших объемов данных.
Интерфейс командной строки R в начале может быть несколько пугающим, но это становится неясным после оценки силы и возможностей, которые дает нам язык для обмена и воспроизведения анализа информации.

R установка


R можно скачать бесплатно для всех существующих бесплатных платформ сегодня, у нас есть возможность установить его на Windows, Linux и даже Mac .
Для целей данного руководства мы будем использовать версию для Windows, которую можно найти на официальной странице проекта по следующей ссылке. После загрузки и установки у нас будет наша функциональная копия R, если мы ее выполним, у нас будет начальный экран R, который должен выглядеть следующим образом:

{title}

Установка RStudio


R позволяет нам работать с данными быстро и эффективно, однако его интерфейс по умолчанию не подходит для этой задачи. Одна из проблем заключается в том, что все открывается в отдельных окнах, что затрудняет работу, а также интерфейс командной строки не одинаков во всех операционных системах.
Хотя существует много интерфейсов для решения этой проблемы, в этом руководстве мы будем использовать RStudio, который доступен для всех платформ, но важно отметить, что необходимо установить R перед установкой, чтобы получить версию Windows, мы переходим к следующей ссылку и скачать соответствующую версию.
После установки мы запускаем RStudio и должны увидеть основной интерфейс:

{title}


RStudio дает нам организацию всех окон R в пределах одной панели и дополнительно дает нам доступ к функциям, которые могут быть довольно трудно найти, в дополнение к этому мы можем упомянуть другие дополнительные преимущества:
  • Это позволяет нам разделить нашу работу на проекты, где у каждого из них будет свой рабочий каталог, история и исходные файлы.
  • Интеграция с GitHub .
  • Это позволяет хранить историю в графическом виде.
  • Вы можете экспортировать графику в разных форматах и ​​размерах.
  • Это позволяет нам завершать код с помощью табличной клавиши.
  • Вы можете создавать интерактивную графику благодаря определенным пакетам.
Как мы видим, RStudio - это довольно оптимальный способ работы с R, однако на рынке есть и другие решения, каждый должен изучить их и оценить, лучше ли они адаптируются к потребностям каждого.

Использование консоли R


Есть несколько способов работы с R, где в первую очередь мы обратимся к консоли R, хотя в этом случае мы не можем сохранить проделанную работу, весьма полезно протестировать некоторые функции и начать знакомство с языком.
Работа с консолью довольно проста, мы вводим команду, а затем R выдает нам ее вывод, давайте попробуем выполнить простую операцию сложения, подобную следующей:
 > 10 + 7 

Нажмите Enter и автоматически R в следующей строке даст нам ответ на нашу операцию:

{title}


Как видно на рисунке, первая строка содержит команду с нашей операцией, важно отметить, что R не требует использования точки с запятой для завершения строки или любого другого оператора завершения. Мы видим во второй строке перед ответом [1], это указывает на способ, которым R выполняет арифметические операции и использует векторы, одна означает индекс первого элемента вектора, где мы можем подчеркнуть, что многие другие языки обрабатывают индексы с нуля, но R делает это с одного.

Работа со скриптами


Как мы упоминали ранее, консоль весьма полезна, но работать она не лучше, в основном потому, что у нее нет возможности хранить наши команды и возможность вводить только одну команду за раз, что-то подобное происходит с Python, но мы не должны волноваться, так как RStudio предоставляет нам окно скриптов, расположенное в верхней части нашей консоли, но если мы его найдем, перейдем в File> New File> R Script или нажмите Shift + Command + N.
В основном сценарий R представляет собой простой текст с расширением .R. Чтобы увидеть, как это работает, мы можем воссоздать нашу арифметическую операцию из предыдущего примера, создав новый скрипт и добавив несколько дополнительных командных строк, давайте посмотрим:
 10 + 7 1:50 print («Привет, мир») 

Скрипт R можно запускать построчно с помощью опции в верхнем меню, которая называется « Выполнить», и ее вывод будет отображаться в консоли, давайте посмотрим ответ для каждой строки нашего скрипта:

$config[ads_text5] not found

{title}


Как мы видим, первая строка дает нам результат, который мы получили ранее, вторая строка создает список чисел от 1 до 50, где число в квадратных скобках является первым индексом для этой строки, и, наконец, у нас создается впечатление классического Hello World .
Изучив способы работы с языком, мы перейдем к более теоретическим концепциям, чтобы лучше понять, что у нас есть в языке для работы и достижения наших проектов.

переменные


Как и во всех языках программирования, переменные являются одним из наиболее важных аспектов, чтобы создать их в R, нам нужно только написать его имя без определения типа. Мы используем оператор присваивания, чтобы присвоить значение переменной.
важно

$config[ads_text6] not found

Мы можем присвоить значение переменной со знаком равенства, но это плохая практика в R, чтобы сделать правильное присвоение оператором <- используется .
Давайте посмотрим, как выглядит присвоение значения переменной, а затем напечатаем его:

 х <- 58 х 

Мы также можем назначить несколько значений нашим переменным с помощью функции concatenate:
 и <- с (5, 2, 11, 28, 17) 

Если мы выполним пример, мы увидим на правой панели, как у нас есть значение x и числовой список, назначенный y :



Кроме того, чтобы исключить переменную из рабочей области, мы должны использовать только функцию rm, мы можем даже очистить всю рабочую область, давайте посмотрим, как мы это делаем:
 rm (x) rm (список = ls ()) 

В первой строке мы исключаем переменную, а во второй строке все пространство.

Структуры данных


В языке у нас есть четыре структуры данных, которые распознаются R :
векторы

Вектор - это одномерный массив, в котором все присутствующие в нем данные должны быть одного типа, целого числа, символа и т. Д. Кроме того, важно отметить, что это базовый объект данных в R.
Массивы и матрицы

Матрица аналогична вектору, где данные должны быть одного типа, однако матрица имеет два измерения, а информация организована в строки и столбцы. Массив похож на матрицу, но может иметь более двух измерений.
Фреймы данных

Фреймы данных - это набор векторов одинаковой длины, он похож на матрицу, но особенность этого типа структуры состоит в том, что они могут быть смешанными типами данных, где даже векторы могут иметь имена.
списки

Наиболее общий тип структуры в R, список - это набор элементов любого вида, длины или структуры, у нас могут быть даже другие списки.
Кроме того, R имеет несколько функций, которые позволяют нам преобразовывать один тип структуры в другой, давайте посмотрим:
as.vector ()

Эта функция позволяет преобразовывать матрицы в одномерные векторы.
as.matrix ()

Вы можете преобразовать структуры данных в массив.
as.data.frame ()

Вы можете преобразовать структуры данных во фреймы данных.
as.list ()

Вы можете конвертировать структуры данных в списки.

пакеты


Одной из сильных сторон R является то, что вы можете добавлять пакеты, которые позволяют нам расширять функциональные возможности языка. На других языках эти дополнения входят в библиотеки, но в R библиотека - это место, где хранятся все пакеты.
Пакеты R могут приходить из двух разных мест, некоторые поставляются с R по умолчанию, но не активны, а другие могут быть получены из онлайн-хранилищ.
Чтобы увидеть пакеты, которые в данный момент установлены или загружены, мы можем выполнить следующие функции:
 библиотека () поиск () 

Функция library () возвращает нам список пакетов, которые в данный момент установлены, давайте посмотрим, что мы бросаем, когда выполняем эту строку:


Функция search (), с другой стороны, показывает консолью пакеты, которые загружены в данный момент, давайте посмотрим на следующем изображении, какие пакеты мы загрузили:


В дополнение к установке пакетов мы можем сделать это несколькими способами, первый - через параметр в верхнем меню Инструменты> Установить пакеты, а затем у нас есть свои собственные языковые функции, последний - тот, который мы рекомендуем, поскольку он может быть частью нашего скрипта.
Чтобы установить пакет, мы используем install.packages, после этого мы должны включить его, мы можем использовать библиотеку или требовать его, однако лучше использовать последний, чтобы избежать путаницы с областью действия функций, давайте посмотрим, как мы устанавливаем и включаем пакет ggplot2 :
 install.packages ("ggplot2") require ("ggplot2") 

Наконец, чтобы удалить пакет, мы можем использовать remove.packages, давайте посмотрим, как он используется:
 remove.packages ("ggplot2") 

На этом мы завершаем этот урок, с которым у нас уже есть представление о том, как работать с R, в дополнение к разъясненным пунктам, таким как переменные и структуры данных, существенным аспектам, которые мы должны знать, чтобы в полной мере воспользоваться преимуществами этого мощного и эффективный язык.