10 курсов по языку программирования R — от базовых до суперпродвинутых
R — это функциональный язык для статистической обработки данных и создания визуализаций. Он помогает совершать научные открытия, получать маркетинговые инсайты и ориентироваться в хаосе big data. А еще с его помощью можно распознать самую депрессивную песню Radiohead и проанализировать комментарии на Reddit. Собрали 12 курсов, которые помогут освоить язык R как программистам, так и специалистам, далеким от ИТ.
Зачем учить R?
Язык программирования R помогает Ford спрогнозировать, какие автомобили будут пользоваться спросом, а правозащитникам позволяет оценить влияние войн на регионы. Его используют Amazon, Twitter и Facebook, чтобы эффективнее настраивать таргет, а программисты создают с его помощью мемы. А еще R использовали для оценки перспектив вакцинации от COVID-19. Пока его чаще всего применяют в науке и медицине, чуть реже — в госсекторе, консалтинге и страховании, но популярность языка постоянно растет — за последний год он поднялся в индексе TIOBE с 20-го на 8-е место. Сегодня язык осваивают как ученые, так и data scientists — и последние стабильно возглавляют рейтинги самых востребованных специалистов.
R любят и ненавидят примерно в той же степени, что и Java, хотя он считается относительно простым языком, который легко можно освоить с нуля. Но вам точно пригодятся аналитические навыки и знание статистики.
Язык часто сравнивают с Python, но у них разные сценарии применения — R чаще применяется для статистического анализа, а Python для создания алгоритмов. Поэтому, если вы хотите создавать системы распознавания лиц или создавать робомобили, то лучше использовать Python. А вот если хотите приложить руку к масштабным журналистским расследованиям или к открытию нового лекарства, то R точно вам подойдет.
Программирование на R (Coursera)
Курс, разработанный Университетом Джонса Хопкинса (США), ведут специалисты по биостатистике — они рассказывают, как использовать R для статистических вычислений и знакомят с базовыми функциями языка. Впрочем, сам курс не назовешь базовым — для его прохождения пригодятся и знания статистики, и программирования. В отзывах студенты отмечают сложность домашних заданий, но при этом признают, что узнали что-то новое, даже если прежде работали с R.
Data Science: Основы R (edХ)
Курс Гарвардского университета сразу же погружает слушателей в реалии работы — авторам предлагают использовать язык программирования, чтобы проанализировать датасет о преступности в США. Программа знакомит с базовым синтаксисом R, учит работать с инструментами и пакетами данных, в том числе dplyr и ggplot2. Курс подойдет новичкам, но авторы советуют не ограничиваться основами и после окончания записаться на программы более продвинутого уровня.
R программирование от А до Я (Udemy)
Курс последовательно разбирает основные моменты работы с R: матрицы, датафреймы, векторы, пакеты и инструменты визуализации. Лекции ведет практикующий data scientist Кирилл Еременко, обучение у которого прошло почти 2 млн студентов.
После каждого тематического блока вы будете выполнять небольшие практические задания, а еще примените R для работы со спортивной статистикой.
Буткемп по анализу данных и машинному обучению с R (Udemy)
Автор курса — Хосе Портийя, магистр наук из Университета Санта-Клары — научит вас использовать R для анализа данных, машинного обучения и визуализации данных. Программа максимально подробно разбирает все аспекты применения R и акцентирует особое внимание на работе с нейросетями. В общей сложности в нее входит 100 видеолекций, и каждую из них сопровождает детальный разбор кода.
Создатели материалов утверждают, что это самый подробный и проработанный курс по R на Udemy. Судя по отзывам, он действительно понравился многим — и ученым, и айтишникам.
Программирование на R: продвинутая аналитика на R для Data Science (Udemy)
Углубленный курс по R предполагает, что вы уже изучили базовый синтаксис языка, освоили пакеты GGPlot2, датафреймы и векторы. На занятиях вы узнаете, как подготовить данные к работе, как настроить функции Lists и Apply, как использовать apply (), lapply () и sapply (), а также в каких ситуациях какой инструмент лучше применять.
Автора курса Кирилла Еременко хвалят за точные формулировки, понятные объяснения сложных концепций, но при этом многие посчитали программу слишком легкой для продвинутого уровня.
Статистика в R (Coursera)
Специализация включает сразу пять курсов по R, в том числе модуль по линейной регрессии, моделированию и байесовской статистике.
Финальный блок посвящен практике — вы примените язык программирования для решения конкретной бизнес-задачи, а заодно примените изученные технологии.
Стоит учитывать, что курс ведут не data-аналитики, а специалисты по статистике, поэтому лучше всего курс подойдет новичкам, которые хотят разобраться в этой дисциплине.
Язык R для аналитики (Нетология)
На курсе вы узнаете, как собирать данные из разных источников, строить прогнозы и визуализации в R-Studio, преобразовывать R‑скрипты, а также автомтаизировать рутинные задачи.
Кластеризация, линейная регрессия, датафреймы, функции spread, gather, separate — это лишь часть процессов и инструментов, которые вы освоите за полтора месяца.
Занятия проходят в формате онлайн-семинаров с тестированием или практическим домашним заданием после каждой темы. По итогу обучения вы подготовите дипломный проект — инструмент улучшения работы интернет-магазина или приложения для моделирования доходности личных накоплений.
Профессия Data Scientist (Skillbox)
Курс подходит для новичков, экспертов и аналитиков. По окончании курса вы станете специалистом по анализу данных, алгоритмам машинного обучения и нейросетям, а главное, освоите самый популярный язык для работы с данными.
Занятия разбирают, как разрабатывать дашборды и интерактивную инфографику, работать с библиотеками Pandas, NumPy и Matplotlib, а также с базами данных PostgreSQL, SQLite3, MongoDB. Кроме того, вы узнаете, как применять нейронные сети для решения реальных задач. Например, освоите фреймворки для обучения нейронных сетей Tensorflow и Keras. По итогу вы легко сможете создавать рекомендательные системы для бизнеса и других сфер.
Бесплатный курс R для Data Science
Курс выстроен в формате рассылки — вы будете регулярно получать на почту письма со ссылками на файлы в формате R Notebook и тут же приступать к практике. На уроках вы узнаете, как устроены типы и структуры данных в R, как использовать инструкции, писать функции и подключать модули. Авторы также разбирают продвинутый синтаксис, приемы визуализации данных и такие концепции, как теорема Байеса, теория вероятности и измерения центральной тенденции.
После курса вы научитесь доставать важную информацию из хаоса, визуализировать результаты на графиках и освоитесь в новой среде разработки.
Изучите R (Codecademy)
В этом курсе вы познакомитесь с базовыми концепциями языка R, а именно узнаете как собирать и очищать датасеты, готовить данные для анализа с помощью dplyr и tidyr, а также создавать визуализации, используя пакета ggplot2. Авторы также обещают объяснить, в чем заключается особенность R и чем он отличается от других языков — это поможет понять, стоит ли его изучать.
По итогу вы создадите портфолио из трех проектов — первый посвящен демографическим трендам, второй социальным проблемам, а третий — переписи населения.
Сертифицированный курс по аналитике на R (Edureka)
В отличие от других курсов, эта программа сфокусирована на применение R в бизнес-аналитике. Лекции разбирают основные статистические функции и концепции, но также показывают, где и в каких сценариях следует применять язык, как устроена экосистема R и какое сообщество сформировалось вокруг него.
Финальный проект по итогу курса — это прогноз и визуализация данных о доходах людей на основе их возраста, образования, класса и профессии. Также вам предстоит аккумулировать и изучать данные из Twitter.
Введение в R (Datacamp)
По данным Datacamp, количество пользователей языка R с каждым годом растет на 40%. При этом еще в 2012 году им пользовалось около 2 млн человек. Вступить в это коммьюнити можно, пройдя экспресс-курс продолжительностью всего 4 часа. Но больше времени придется уделить практике — курс предусматривает 62 упражнения.
Интересно, что программу составил сооснователь Datacamp Джонатан Корнелиссен, который обладает степенью PhD по «финансовой эконометрике». Первый вводный модуль можно пройти бесплатно — это поможет понять, подойдет ли вам формат и подача.
Читать на dev.by