Дапамажыце dev.by 🤍
Падтрымаць

Как свитчнуться в Big Data. Эксперт поделился free roadmap для тех, кто уже в IT

Профессии, связанные с большими данными, становятся все более востребоваными, а среди специалистов тут меньше конкуренции, чем во фронтенде или тестировании. Разбираемся, как войти в Data Engineering, Data Science и Data Analytics.

Пакінуць каментарый
Как свитчнуться в Big Data. Эксперт поделился free roadmap для тех, кто уже в IT

Профессии, связанные с большими данными, становятся все более востребоваными, а среди специалистов тут меньше конкуренции, чем во фронтенде или тестировании. Разбираемся, как войти в Data Engineering, Data Science и Data Analytics.

Большие данные применяются буквально везде — в маркетинге, здравоохранении, банковской сфере, промышленности, сельском хозяйстве. В IT есть сразу несколько профессий, которые подразумевают работу с BIg Data. Попасть в них с нуля без образования и опыта довольно сложно, но если вы уже работаете в IT на любой технической должности, это будет большим подспорьем. Мы собрали в roadmap полезные ресурсы для самостоятельного обучения и несколько недорогих курсов, которые позволят в кратчайшие сроки сменить сферу. 

Разобраться в теме и выбрать полезные материалы помог Вячеслав (имя изменено) — Data Delivery Manager.

Содержание
Примечание Adviser

В статье есть ссылки партнеров. Если вы что-то покупаете у них с нашей помощью — вы также поддерживаете dev.by. (Вот другой способ).

При этом редакция и авторы независимы в выборе темы, концепции материала, фокуса описания, подхода к услугам или товарам. Прежде чем что-то советовать, мы много читаем и смотрим по теме, говорим с экспертами. Редакция может выражать свое мнение и пробовать всё на себе.

Если рекомендательный материал обновляется, мы в самом начале указываем, что и когда поменялось.

Какие направления есть в Big Data

В первую очередь важно определиться, чем именно вам хочется заниматься. Вот основные профессии, которые можно освоить.

  1. Data Software Engineers — создают и управляют масштабируемыми приложениями для обработки данных, манипулируют различными типами данных. Они интегрируют системы и совершенствуют алгоритмы, включая модели машинного обучения — для оптимизации обработки и обеспечения аналитики, основанной на данных, в организациях.
  2. Data Analytics Engineers — используют корпоративные данные для получения значимых бизнес-аналитических данных. Результат их работы помогает принимать информированные стратегические решения в бизнесе.
  3. Data Scientists — используют научные методы, алгоритмы и системы для получения инсайтов из структурированных и неструктурированных данных. Основываясь на статистике, анализе данных и различных дисциплинах, таких как машинное обучение и большие данные, Data Science объединяет методы из математики, статистики, информатики и знания предметной области для понимания явлений реального мира.
  4. Data Quality Engineers — обеспечивают качество данных, разрабатывая стратегии, планы и структуры тестирования. Они сотрудничают с заинтересованными сторонами, автоматизируют проверки качества. Эти специалисты выступают в роли защитников качества данных и способствуют командной работе, продвигая качество данных и управление ими в проектах и организациях.

Навыки, которые требуются в этих специальностях, во многом пересекаются. Можно просто начать изучать, к примеру, Python или SQL и в процессе решить, чем больше хочется заняться.

Чем поможет в Big Data ваш айтишный бэкграунд

Всех технических специалистов в IT объединяет схожий образ мышления, подход к решению проблем, знания процессов, которые схожи в большинстве компаний, набор софт-скиллов. К тому же, выучив хотя бы один язык программирования, будет гораздо проще учить второй и осваивать какие-то новые технологии. Если уделять учебе достаточно времени и найти хорошего ментора, смена профессии — вопрос нескольких месяцев.

Вячеслав, Data Delivery Manager

Я был разработчиком на Java, спустя 7 лет перешел в Data Software Engineering, а теперь работаю на должности Data Delivery Manager. Изначально причина перехода была в том, что в Java было сложно расти. Основной технический рост у меня шел в первые 2-3 года. Потом развитие было слабым и не поддерживалось компанией, как мне кажется. Я походил на несколько интервью других компаний и понял, что отстал от мира. Спрашивали про технологии и базы, про которые я не знал.

В EPAM была возможность ретрейнинга из других направлений в Data. Я прошел интервью и попал в компанию. Все процессы онбординга были хорошо налажены, это мне сразу понравилось. Перешел на меньшую зарплату, поскольку моей мотивацией было изучение и развитие. Я числился в компании и три месяца проходил курсы. Ходил как на работу, но учился. Получал зарплату за это.

За 3 месяца я изучил Hadoop, Spark, Scala, Kafka — все самое основное. Был личный ментор, к которому я обращался за помощью. Но это был занятой архитектор и поймать его было сложновато. После тренинга у меня был экзамен (собеседование) с ментором из другой локации. По результату получил бейджик о прохождении программы. Очень быстро, буквально через неделю, мне нашли проект и я начал работать.

Выбирая новую специальность, можно отталкиваться от того, что вы уже знаете. Просто посмотрите вакансии в хорошие компании и сопоставьте требования со своим опытом. Возможно, часть языков и технологий вам уже знакомы. Скажем, в Data Science востребован Python и знания Machine Learning, в Data Analytics — SQL и опыт работы аналитиком в других областях IT.

Вячеслав, Data Delivery Manager

Предыдущий опыт в IT мне очень помог: и hard-, и soft-скиллы. Перейти в Data Software Engineering проще всего с позиции Java Developer или Python Developer. Тут нужны знания Java/Python, SQL, Bash, Docker, Git. Вообще в DSE очень большое число разных технологий и направлений. Знать их все не возможно и не обязательно. Например, разные клауды. Kafka, Databricks или Airflow — все сразу знать глубоко не нужно. Тут редко применяется сразу все на серьезном уровне.

Самые ценные знания, которые можно освоить самому:

  • Java, Scala;
  • Databricks (Scala);
  • Основы Клауда: по AWS Fundamentals or Azure Fundamentals я смотрел курсы на Udemy;
  • Docker Essentials, тоже изучал на Udemy.

Ресурсы для учебы

Мы собрали качественные бесплатные материалы и недорогие курсы, которые будут полезны в разных областях работы с данными. Начинать можно с чего угодно и постепенно осваивать все больше технологий — пока список ваших навыков не будет соответствовать списку требований на желаемую должность.

Python

Один из самых распространенных языков в Big Data. Считается не таким уж сложным для обучения — если вы программируете сейчас на чем-то другом, освоить Python не составит труда.

Бесплатно учиться можно по роликам на Youtube. Например, есть сжатый, но исчерпывающий курс на канале Bro Code. Вас ждут 12 часов объяснений и пошаговых инструкций. Если внимательно прослушаете и выполните все практические задания, уже сможете программировать на начальном уровне.

Если вам нужны более подробные объяснения и тесты для самопроверки, Вячеслав рекомендует недорогой курс Мичиганского университета на Coursera. Это специализация из 5 отдельных курсов, нацеленная именно на работу с данными. Вы получите глубокие знания, применимые в Big Data и поработаете с структурами данных.

TIP от Adviser: Учиться на Coursera выгоднее с подпиской Coursera Plus. За $59 в месяц можно пройти неограниченное число учебных программ из более чем 7000. Это идеальный вариант, если вы готовы посвятить много времени учебе.

Также есть хороший базовый курс по Python на CodeAcademy. Программа включает теоретические основы, тесты и практические задания, которые удобно выполнять прямо на платформе.

SQL

Освоить азы языка можно на подробном бесплатном курсе на Khan Academy. Это материалы в текстовом формате, удобно структурированные по урокам: читайте, выполняйте задания и погружайтесь в новые темы в удобном темпе.

Если вам более удобен видеоформат и интерактивные тесты, можно снова обратиться к CodeAcademy. Азы SQL на курсе поданы кратко и доступно, а подписка начинается от $12 в месяц.

Java

Для тех, кто наметил карьерный трек в Data Engineering, этот язык скорее всего будет нужен, и уж точно не будет лишним. Есть хороший бесплатный курс на Udemy — вы просто слушаете теорию по видео и выполняете задания в своем темпе. Поскольку никакой самопроверки тут не предусмотрено, было бы полезно иметь ментора, который сможет иногда смотреть и комментировать ваши работы. В остальном на курсе достаточно материалов для старта.

TIP от Adviser: Обычная стоимость курсов на Udemy от 30 до 80$, но сейчас скидки до 80%. Распродажа продлится всего 2 дня.

Выбрать курс

Если хотите учиться с интерактивными тестами, можно взять короткий курс на CodeAcademy. А для тех, кто хочет сразу глубоко погрузиться в предмет, есть учебная программа на Coursera — рассчитана на полгода, зато точно позволит разобраться во всех деталях и стать профи.

Databricks/Spark

Databricks — платформа для анализа данных на базе движка Spark, который обеспечивает параллельную или распределенную обработку данных. Технология актуальна для инженеров, аналитиков и Data Scientists.

Пройти обучение пользованию платформой можно на официальном сайте DataBricks: среди материалов есть текстовые инструкции, видеокурсы. На Youtube-канале Databricks можно проходить уроки под конкретные задачи и смотреть вебинары.

Основы работы с самим Spark можно освоить на бесплатном курсе от Cognitive Class — это видеолекции, структурированные в учебную программу.

Docker

Это программная платформа для работы с контейнерными приложениями. Docker позволяет локально разворачивать базы данных, а также выводить ML-модели в продакшен.

Хороший бесплатный курс доступен на Cognitive Class, также бесплатное руководство есть на Udemy. А еще на официальном сайте платформы есть подробный тьюториал и даже интерактивное пространство для отработки навыков.

Облачные сервисы

Если вы хотите работать с Azure, есть хорошее бесплатное руководство от Microsoft. Чтение уроков займет около часа, также нужно заложить время на запоминание и отработку навыков. Хорошо, если у вас будет человек, с которым можно проконсультироваться при возникновении непонятных вопросов.

По Google Cloud можно пройти бесплатное обучение на Udemy. Это видеолекции общей длительностью менее двух часов, которые дадут вам представление о платформе.

И еще немного полезного

Есть комьюнити Data Zen — оно создано для начинающих спецов в разных областях работы с данными. Можно участвовать бесплатно, получать полезные материалы и посещать онлайн-мероприятия: полезные лекции и вебинары от экспертов в индустрии.

По основам Data Science доступен бесплатный курс на Cognitive Class. Он дает хорошие базовые знания, но лучше сочетать самостоятельное обучение с консультациями с ментором, чтобы разбирать непонятные вопросы. А если вы пока не определились, в какую точно сферу хотите, пройдите на Cognitive Class обучение основам Big Data. Это будет интересно и полезно вне зависимости от того, какую специализацию вы в итоге выберете.

Как видите, профессиям по работе с данными вполне реально обучиться самостоятельно — в сети множество бесплатных материалов. Дальше главное — сила воли и планирование: важно заниматься регулярно и планомерно, чтобы достичь результатов. И, конечно, для успешного обучения следует проявлять любопытство вне рамок программы: больше гуглить самостоятельно, общаться с профессионалами, посещать мероприятия и быть в курсе новостей индустрии.

Не забывайте читать Adviser. Рассказываем о возможностях обучения и карьерного роста, рекомендуем курсы и разбираем сложные темы с экспертами. А также пишем о жизни вне работы: о ментальном и физическом здоровье, безопасности, хобби и инвестировании.

8 вопросов специалисту про карьеру в ML: все про стек собесы рост в профессии и как туда свитчнуться
8 вопросов специалисту про карьеру в ML: все про стек, собесы, рост в профессии и как туда свитчнуться
По теме
8 вопросов специалисту про карьеру в ML: все про стек, собесы, рост в профессии и как туда свитчнуться
Самое важное о Machine Learning за 3 месяца. Курс от фаундера DeepLearning.AI Эндрю Ын
Самое важное о Machine Learning за 3 месяца. Курс от фаундера DeepLearning.AI Эндрю Ын 
По теме
Самое важное о Machine Learning за 3 месяца. Курс от фаундера DeepLearning.AI Эндрю Ын
Математика для Machine Learning и Data Science: основы которые точно надо знать
Математика для Machine Learning и Data Science: основы, которые точно надо знать
По теме
Математика для Machine Learning и Data Science: основы, которые точно надо знать
Чытайце таксама
6 онлайн-курсов и интенсивов для Product Manager
6 онлайн-курсов и интенсивов для Product Manager
6 онлайн-курсов и интенсивов для Product Manager
Собрали проверенные онлайн-курсы и интенсивы для Product Manager. Часть из них подойдёт тем, кто только присматривается к профессии, другие — для повышения квалификации опытных специалистов.
2 каментарыя
Как очистить Mac? Лучшие  платные приложения для macOS
Как очистить Mac? Лучшие платные приложения для macOS
Как очистить Mac? Лучшие платные приложения для macOS
Чем больше вы используете свой Mac, тем больше он будет накапливать файлов и других данных. Большая часть этой информации — это то, что вам нужно — ваши документы, фотографии, видео и т. д., в то время как другая часть будет включать ненужные данные, которые просто засоряют устройство, замедляют его работу и бесполезно занимают место. Например, загруженные видео и мемы из телеграм-каналов, скриншоты трехлетней давности и прочая ерунда.К счастью, существует множество программ, которые просканируют накопившийся мусор и наведут за вас порядок. Но из чего выбирать прямо сейчас? Вот 5 платных очистителей Mac, на которые, на наш взгляд, стоит обратить внимание.
8 каментарыяў
10 лучших сертификаций Coursera, чтобы освоить новую специальность
10 лучших сертификаций Coursera, чтобы освоить новую специальность
10 лучших сертификаций Coursera, чтобы освоить новую специальность
Проанализировали Coursera в поисках лучших профессиональных программ на 2022 год, освоение которых позволит получить востребованную специальность.
1 каментарый
12 курсов по Java, на которые стоит обратить внимание новичкам и профи
12 курсов по Java, на которые стоит обратить внимание новичкам и профи
12 курсов по Java, на которые стоит обратить внимание новичкам и профи
Java по-прежнему входит в список самых популярных языков программирования. Вместе с Digital Defund составили список курсов, которые подойдут как новичкам, так и людям с опытом программирования, и помогут освоить этот востребованный язык. 

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.