Серия успешных сделок белорусских стартапов в области компьютерного зрения и машинного обучения подтолкнула нас к запуску цикла материалов о том, как стать специалистом в этих областях. В первом материале этой серии советы нынешним и будущим специалистам давал «Яндекс». Сегодня специалист минского центра разработки Wargaming расскажет, чем у них занимаются Data Scientist’ы и что учить, чтобы попасть к ним в команду. Слово — Андрею Ярмоле, Manager of Data Science в СООО «Гейм Стрим».
Задачи Data Scientist’ов в Wargaming
«Священный Грааль» не только Data Science, но и любой аналитики в игровой индустрии — измерить fun (удовольствие) каждого игрока. Его невозможно измерить напрямую. Поэтому Data Science подходит к этой задаче, аппроксимируя fun. Для анализа используются объективные данные, например, частота и длительность игры, успешность игрока, поведение в игре и т. д.
В сферу ответственности Data Scientist входят несколько классов задач. Остановлюсь на основных:
1. Разработка математических моделей, которые описывают путь развития игрока внутри игры (Player Journey). Такие модели помогают гейм-дизайнерам выявить препятствия, приводящие к оттоку игроков, улучшить баланс игры, оценить состояние игровой экономики, прогнозировать эффект изменений в игре и т. д.
2. Разработка предиктивных моделей. Они помогают оценить вероятность ухода из игры или покупки предмета для каждого игрока. Такие модели востребованы при проведении акций и кампаний, нацеленных на увеличение вовлеченности пользователей.
3. Выявление девиантного поведения. Эта задача очень важна для компаний-разработчиков многопользовательских игр. К девиантному поведению относится использование читов, ботов и ненормативной лексики. Data Scientist разрабатывают алгоритмы, позволяющие находить игроков, которые нарушают правила.
Потребность в аналитике в Wargaming растет постоянно, соответственно, регулярно появляются новые вакансии, связанные с анализом данных. Например, в настоящее время мы ищем Data Scientist в мою команду.
С чего начать: основы геймдизайна и Wargaming Forge
Data Science лежит на стыке нескольких областей: математика, статистика, разработка ПО и доменная экспертиза. К сожалению, сейчас нет программ, которые готовят Data Scientist именно для игровой индустрии. Тем, кто хочет стать Data Scientist в этой области, я бы рекомендовал параллельно с изучением Machine Learning познакомиться с основами гейм-дизайна и регулярно читать портал для разработчиков игр Gamasutra.
Лучший курс для начинающих (при наличии базы) — Machine Learning от Andrew Ng. Если интересуют офлайн-курсы, то стоит попробовать свои силы в Wargaming Forge — образовательной программе от Wargaming и InDataLabs.
Дисциплины, фреймворки и алгоритмы
Существует немало готовых фреймворков для работы с алгоритмами Machine Learning. В результате некоторым кажется, что на математику налегать не нужно. К сожалению, использование алгоритмов без понимания приводит к ситуации «забиваем гвоздь микроскопом». Кроме того, отсутствие достаточной математической подготовки — одно из главных препятствий, мешающих стать экспертом в Data Science.
Будущим Data Scientist я рекомендую освоить дисциплины:
- Теория вероятностей;
- Математическая статистика;
- Математические методы анализа данных;
- Дискретная математика;
- Теория графов;
- Теория алгоритмов;
- Математические методы оптимизации;
- Исследование операций;
- Методы имитационного моделирования;
- Теория информации;
- Численные методы.
В игровой индустрии применяются те же инструменты Machine Learning, что и в других. В Wargaming, например, используются R, Python, Spark, SAS Enterprise Miner, H20. Такое разнообразие инструментов необходимо для эффективного процесса создания моделей от прототипа до деплоймента.
Мне кажется, участие в соревнованиях на Kaggle или любых других подобных — лучший способ получить данные из различных областей. Также можно почерпнуть много полезных «фишек», разбирая решения победителей. В сообществе DataTalks в Facebook мы переодически выкладываем материалы и анонсы мероприятий.
Будущие специальности: кто в игре, тот и победит
Мне кажется, что мало какая индустрия предоставляет Data Scientist’у такое разнообразие задач и данных, как игровая. Мы обрабатываем множество данных, применяем для анализа все существующие методы и алгоритмы. Кроме того, игровая индустрия позволяет участвовать в кросс-дисциплинарных исследованиях. Например, недавно мы разработали методологию на стыке Data Science и социологии, которая позволяет выявлять элементы игры, наиболее влияющие на уровень удовлетворённости игроков.
ИИ, нейронные сети, если они используются правильно, несомненно, являются и будут являться конкурентным преимуществом в будущем. Но игровая индустрия потому и называется игровой, что главное в ней — это игра.
Фото: из архива Сергея Кадомского
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.