Data Science at Scale: Курс науки о данных для работы с гигантскими объемами информации

Специализация Data Science at Scale от Университета Вашингтона  состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.

Оставить комментарий
Примечание Adviser

В этой статье ссылки партнеров. Это значит, что если вы что-то покупаете с нашей помощью — вы также поддерживаете dev.by. (Вот другой способ).

При этом редакция и авторы независимы в выборе темы, концепции материала, фокуса описания, подхода к услугам или товарам. Прежде чем что-то советовать, мы много читаем и смотрим по теме, говорим с экспертами.

Редакция может выражать свое мнение и пробовать всё на себе.

Если рекомендательный материал обновляется, мы указываем, что и когда поменялось, в самом начале.

Data Science at Scale — подход, который позволяет эффективно извлекать ценную информацию из огромных и разнородных данных, используя современные технологии и методы для работы в условиях больших объемов, высокой скорости поступления данных и разнообразия их типов.

Специализация «Data Science в масштабе» / Coursera

Специализация включает 4 курса. Вы научитесь визуализировать данные и передавать результаты, а также разбираться в юридических и этических вопросах, связанных с большими данными. В заключительном проекте Capstone, разработанном в партнерстве с платформой для цифровых стажировок Coursolve, сможете применить свои новые навыки в реальном проекте. 

Кто преподаёт

Преподаватель курса Билл Хоу — ведущий специалист в области науки о данных. Сейчас он работает на факультете информатики и техники Университета Вашингтона, где также занимает должность директора нескольких исследовательских программ. Текущие исследования Билла Хоу сосредоточены на масштабируемых системах обработки данных, параллельных базах данных и применении вычислительных методов в науке и инженерии.

Программа обучения

1. Манипулирование данными в масштабе: системы и алгоритмы

Анализ данных заменил сбор данных как ключевой элемент в принятии решений на основе фактов. Курс познакомит вас с системами и алгоритмами, которые используют параллельные базы данных, распределенные системы и языки программирования для создания масштабируемых платформ анализа данных. Вы узнаете, как оценивать облачные вычисления, базы данных SQL и NoSQL, MapReduce, Spark и другие специализированные системы.

2. Практическая прогнозирующая аналитика: модели и методы

Курс научит вас разрабатывать статистические эксперименты и анализировать их результаты с использованием современных методов. Вы изучите основные методы классификации и оптимизации, а также методы неконтролируемого обучения и графовой аналитики.

3. Коммуникация результатов Data Science

Вы научитесь создавать и критиковать визуализации данных, объяснять конфиденциальность и этические вопросы в науке о данных, а также использовать облачные вычисления для воспроизводимого анализа данных. Итоговое задание курса связано с анализом графиков в облаке, для выполнения которого потребуется использовать Amazon Web Services (AWS).

4. Data Science at Scale — Capstone Project

В заключительном проекте Capstone вам предстоит поработать над реальным проектом, применяя все навыки, полученные в ходе специализации. Каждая задача Capstone напрямую связана с реальными партнерами, заинтересованными в итоговых результатах.

Пройти курс

TIP от Adviser: Учиться на Coursera еще выгоднее с подпиской Coursera Plus. За $59 в месяц можно пройти неограниченное число учебных программ из более чем 7 тысяч. Идеальный вариант, если вы готовы посвятить много времени учебе.

Попробовать Coursera Plus

Как свитчнуться в Big Data. Эксперт поделился free roadmap для тех, кто уже в IT 
По теме
Как свитчнуться в Big Data. Эксперт поделился free roadmap для тех, кто уже в IT
Как управлять машинами, которые умнее тебя? Разбираемся с AI этикой (и рекомендуем курсы)
По теме
Как управлять машинами, которые умнее тебя? Разбираемся с AI этикой (и рекомендуем курсы)

Читать на dev.by