Open source
Programming
R
24 November 2015

swirl: стремительное погружение в R (learning by doing)

Tutorial


Еще каких-нибудь полтора года назад я был одним из тех, кто убежденно говорил «Нет, программирование — это точно не для меня». Не рискну сказать, что я стал программистом, но за последний год R заменил мне большинство повседневных программ для работы. Я работаю исследователем. С интересом наблюдаю, как постепенно R становится стандартом в академическом мире. В общем, в мире ширится понимание того, что с компьютером имеет смысл общаться чуть свободнее, чем на уровне программ click&drag. Так, совсем недавно Медуза писала о том, что не все прогеры девственники программирование стоит изучать гораздо более широкому кругу людей, чем всегда было принято считать.

В этом посте я расскажу об одном из самых коротких путей к программированию — изучении R с помощью специального пакета swirl (пакет в R — это то же, что во многих других языках называется библиотекой, расширение/дополнение исходного функционала). Пост рассчитан на читателя с нулевым знанием R, заинтересованного в изучении этого языка программирования; он поможет, как мне кажется, максимально эффективно и безболезненно сделать первые шаги в темный лес программирования.

Почему именно R?
Короткий ответ: потому что только этим я могу поделиться, других языков программирования не знаю.

Развернутый ответ: R — универсальный инструмент, который может пригодиться очень широкому кругу специалистов. Это полностью открытый и очень динамично развивающийся проект с кучей вдохновенных последователей по всему миру. Каждый может написать свой пакет и выложить в открытом доступе (это действительно не очень сложно). R предоставляет безграничные возможности для визуализации данных. Чтобы вдохновиться, можно заглянуть в одну из галерей (например, вот или вот). Возможности анализа данных безграничны. Только чтобы обратить внимание на самое впечатляющее, предлагаю взглянуть на этот пост.

На Хабре довольно много публикаций с использованием R. Есть и посты о самом языке, например шпаргалка R. Много любопытного можно вычитать из текста человека, заставшего R чуть ли не у самых истоков.

Для исследователя R — это просто must.


Итак, вы все еще со мной. Значит, без лишних слов проделаем несколько простых шагов, чтобы начать активное обучение.

Внимание!
Для обучения понадобится минимальное владение английским. Вообще, надо привыкать, что компьютер предпочитает обходиться без великого и могучего.


Шаг 1. Установка R
Тут все просто. Заходим на официальный сайт, скачиваем под свою ось, устанавливаем. Никаких сложностей. Хитрости есть, но об этом в следующем посте.

Шаг 2. Устанавливаем RStudio
Аналогично. Заходим на официальный сайт, скачиваем под свою ось, устанавливаем. Совсем никаких сложностей.

Что еще за RStudio?
RStudio — это ide (графическая оболочка) для R, вероятно, самый распространенный способ использования R вообще. Это отдельная программа, которая надстраивается над R. Есть, конечно, хардкорные прогеры, которые теряют душевное спокойствие при виде нарисованной кнопки gui. Но оставим их в покое: большинству пользователей интерфейс RStudio не только придется по вкусу, но и значительно облегчит жизнь. Кроме того, есть в RStudio и действительно уникальные плюсы типа проектов и вспомогательных функций для создания пакетов. Ну да ладно… Плюсы RStudio тянут на отдельный пост. Пока ограничимся тем, что программу стоит установить.

Программа бесплатно для персонального использования. Без каких-либо ограничений. Компаниям за установку в коммерческих целях придется платить.


Шаг 3. Устанавливаем swirl

Все, что нужно — написать в консоли следующую строчку и нажать Enter

install.packages("swirl")


Некоторое время в консоли будет отображаться процесс установки пакета. В конце программа отрапортует, что все хорошо. Теперь надо подгрузить swirl. Для этого используем функцию

library("swirl")


Все! Интерактивное обучение началось.

Если трудно вот так вот просто начать писать команды...
… все то же самое можно проделать в RStudio с помощью удобного графического интерфейса.

В правой нижней части экрана в Rstudio находится панель со вспомогательной информацией. Нас интересует вкладка Packages. Далее Нажимаем кнопку Install



и появляется диалоговое окно установки пакетов. Вводим в поисковую строку swirl и подтверждаем установку.



Начинается процесс установки. Он может занять некоторое время. По завершении программа отчитается об успешной установке, а swirl появится в списке пакетов.



Если в RStudio отметить нужный пакет в списке, он подгрузится в текущей сессии. При этом необходимая функция сама пропечатается в консоли.



Многие простые операции в RStudio можно сделать с помощью графического интерфейса.

Существует довольно много интерактивных курсов, разработанных под swirl (в принципе, никто не мешает разработать и свой). Список официальных курсов можно посмотреть на github страничке разработчиков. По умолчанию устанавливается курс R Programming. С него и имеет смысл начать всем, знакомящимся с R.

R Programming и Coursera
Курс разработан командой исследователей из университета Джона Хопкинса в качестве дополнения к курсу на Coursera. Для глубинного освоения R можно пройти все курсы специализации Data Science на Coursera. Подробнее об этом опыте можно почитать на Хабре.

Дополнительные курсы устанавливаются специальной функцией пакета swirl, например

install_from_swirl('Regression_Models')


Стремительного обучения!

+10
13.9k 97
Support the author
Comments 7
Top of the day