Как свитчнуться в Big Data. Эксперт поделился free roadmap для тех, кто уже в IT
Профессии, связанные с большими данными, становятся все более востребоваными, а среди специалистов тут меньше конкуренции, чем во фронтенде или тестировании. Разбираемся, как войти в Data Engineering, Data Science и Data Analytics.
Большие данные применяются буквально везде — в маркетинге, здравоохранении, банковской сфере, промышленности, сельском хозяйстве. В IT есть сразу несколько профессий, которые подразумевают работу с BIg Data. Попасть в них с нуля без образования и опыта довольно сложно, но если вы уже работаете в IT на любой технической должности, это будет большим подспорьем. Мы собрали в roadmap полезные ресурсы для самостоятельного обучения и несколько недорогих курсов, которые позволят в кратчайшие сроки сменить сферу.
Какие направления есть в Big Data
В первую очередь важно определиться, чем именно вам хочется заниматься. Вот основные профессии, которые можно освоить.
Data Software Engineers — создают и управляют масштабируемыми приложениями для обработки данных, манипулируют различными типами данных. Они интегрируют системы и совершенствуют алгоритмы, включая модели машинного обучения — для оптимизации обработки и обеспечения аналитики, основанной на данных, в организациях.
Data Analytics Engineers — используют корпоративные данные для получения значимых бизнес-аналитических данных. Результат их работы помогает принимать информированные стратегические решения в бизнесе.
Data Scientists — используют научные методы, алгоритмы и системы для получения инсайтов из структурированных и неструктурированных данных. Основываясь на статистике, анализе данных и различных дисциплинах, таких как машинное обучение и большие данные, Data Science объединяет методы из математики, статистики, информатики и знания предметной области для понимания явлений реального мира.
Data Quality Engineers — обеспечивают качество данных, разрабатывая стратегии, планы и структуры тестирования. Они сотрудничают с заинтересованными сторонами, автоматизируют проверки качества. Эти специалисты выступают в роли защитников качества данных и способствуют командной работе, продвигая качество данных и управление ими в проектах и организациях.
Навыки, которые требуются в этих специальностях, во многом пересекаются. Можно просто начать изучать, к примеру, Python или SQL и в процессе решить, чем больше хочется заняться.
Чем поможет в Big Data ваш айтишный бэкграунд
Всех технических специалистов в IT объединяет схожий образ мышления, подход к решению проблем, знания процессов, которые схожи в большинстве компаний, набор софт-скиллов. К тому же, выучив хотя бы один язык программирования, будет гораздо проще учить второй и осваивать какие-то новые технологии. Если уделять учебе достаточно времени и найти хорошего ментора, смена профессии — вопрос нескольких месяцев.
Выбирая новую специальность, можно отталкиваться от того, что вы уже знаете. Просто посмотрите вакансии в хорошие компании и сопоставьте требования со своим опытом. Возможно, часть языков и технологий вам уже знакомы. Скажем, в Data Science востребован Python и знания Machine Learning, в Data Analytics — SQL и опыт работы аналитиком в других областях IT.
Ресурсы для учебы
Мы собрали качественные бесплатные материалы и недорогие курсы, которые будут полезны в разных областях работы с данными. Начинать можно с чего угодно и постепенно осваивать все больше технологий — пока список ваших навыков не будет соответствовать списку требований на желаемую должность.
Python
Один из самых распространенных языков в Big Data. Считается не таким уж сложным для обучения — если вы программируете сейчас на чем-то другом, освоить Python не составит труда.
Бесплатно учиться можно по роликам на Youtube. Например, есть сжатый, но исчерпывающий курс на канале Bro Code. Вас ждут 12 часов объяснений и пошаговых инструкций. Если внимательно прослушаете и выполните все практические задания, уже сможете программировать на начальном уровне.
Если вам нужны более подробные объяснения и тесты для самопроверки, Вячеслав рекомендует недорогойкурс Мичиганского университета на Coursera. Это специализация из 5 отдельных курсов, нацеленная именно на работу с данными. Вы получите глубокие знания, применимые в Big Data и поработаете с структурами данных.
Также есть хорошийбазовый курс по Python на CodeAcademy. Программа включает теоретические основы, тесты и практические задания, которые удобно выполнять прямо на платформе.
SQL
Освоить азы языка можно на подробном бесплатном курсе на Khan Academy. Это материалы в текстовом формате, удобно структурированные по урокам: читайте, выполняйте задания и погружайтесь в новые темы в удобном темпе.
Если вам более удобен видеоформат и интерактивные тесты, можно снова обратиться к CodeAcademy. Азы SQL на курсе поданы кратко и доступно, а подписка начинается от $12 в месяц.
Java
Для тех, кто наметил карьерный трек в Data Engineering, этот язык скорее всего будет нужен, и уж точно не будет лишним. Есть хороший бесплатный курс на Udemy — вы просто слушаете теорию по видео и выполняете задания в своем темпе. Поскольку никакой самопроверки тут не предусмотрено, было бы полезно иметь ментора, который сможет иногда смотреть и комментировать ваши работы. В остальном на курсе достаточно материалов для старта.
Если хотите учиться с интерактивными тестами, можно взять короткий курс на CodeAcademy. А для тех, кто хочет сразу глубоко погрузиться в предмет, есть учебная программа на Coursera — рассчитана на полгода, зато точно позволит разобраться во всех деталях и стать профи.
Databricks/Spark
Databricks — платформа для анализа данных на базе движка Spark, который обеспечивает параллельную или распределенную обработку данных. Технология актуальна для инженеров, аналитиков и Data Scientists.
Это программная платформа для работы с контейнерными приложениями. Docker позволяет локально разворачивать базы данных, а также выводить ML-модели в продакшен.
Если вы хотите работать с Azure, есть хорошее бесплатное руководство от Microsoft. Чтение уроков займет около часа, также нужно заложить время на запоминание и отработку навыков. Хорошо, если у вас будет человек, с которым можно проконсультироваться при возникновении непонятных вопросов.
По Google Cloud можно пройти бесплатное обучение на Udemy. Это видеолекции общей длительностью менее двух часов, которые дадут вам представление о платформе.
И еще немного полезного
Есть комьюнити Data Zen — оно создано для начинающих спецов в разных областях работы с данными. Можно участвовать бесплатно, получать полезные материалы и посещать онлайн-мероприятия: полезные лекции и вебинары от экспертов в индустрии.
По основам Data Science доступен бесплатный курс на Cognitive Class. Он дает хорошие базовые знания, но лучше сочетать самостоятельное обучение с консультациями с ментором, чтобы разбирать непонятные вопросы. А если вы пока не определились, в какую точно сферу хотите, пройдите на Cognitive Class обучение основам Big Data. Это будет интересно и полезно вне зависимости от того, какую специализацию вы в итоге выберете.
Как видите, профессиям по работе с данными вполне реально обучиться самостоятельно — в сети множество бесплатных материалов. Дальше главное — сила воли и планирование: важно заниматься регулярно и планомерно, чтобы достичь результатов. И, конечно, для успешного обучения следует проявлять любопытство вне рамок программы: больше гуглить самостоятельно, общаться с профессионалами, посещать мероприятия и быть в курсе новостей индустрии.
Собрали проверенные онлайн-курсы и интенсивы для Product Manager. Часть из них подойдёт тем, кто только присматривается к профессии, другие — для повышения квалификации опытных специалистов.
Как очистить Mac? Лучшие платные приложения для macOS
Чем больше вы используете свой Mac, тем больше он будет накапливать файлов и других данных. Большая часть этой информации — это то, что вам нужно — ваши документы, фотографии, видео и т. д., в то время как другая часть будет включать ненужные данные, которые просто засоряют устройство, замедляют его работу и бесполезно занимают место. Например, загруженные видео и мемы из телеграм-каналов, скриншоты трехлетней давности и прочая ерунда.К счастью, существует множество программ, которые просканируют накопившийся мусор и наведут за вас порядок. Но из чего выбирать прямо сейчас? Вот 5 платных очистителей Mac, на которые, на наш взгляд, стоит обратить внимание.
12 курсов по Java, на которые стоит обратить внимание новичкам и профи
Java по-прежнему входит в список самых популярных языков программирования. Вместе с Digital Defund составили список курсов, которые подойдут как новичкам, так и людям с опытом программирования, и помогут освоить этот востребованный язык.
Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот
Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале
Абмеркаванне
Каментуйце без абмежаванняў
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.