Как Мельничек и Матвеенко делают точный (наконец-то!) прогноз погоды. Пока на час и километр

Создатели намерены сказать нам определённо, когда пойдёт дождь.

46 комментариев

Приложение с прогнозом дождя Rainbow.ai от Юрия Мельничка и Александра Матвеенко выходит на Product Hunt 22 августа. В период, когда начинается сезон плохой погоды и всем важен точный прогноз, создатели намерены собрать метрики продукта и с ними искать новых инвесторов.

Перед выходом основатели стартапа пообщались с dev.by.

Об основателях

Юрий Мельничек

ИТ-предприниматель, венчурный инвестор. Основатель Maps.me, компании AImatter, сооснователь инвесткомпании Bulba Ventures. В инвестпортфеле также: OneSoil, Gero, Vochi.

Александр Матвеенко

ИТ-менеджер, венчурный инвестор. В 2014-2015 — Project manager в Maps.me. В 2016-2017 — фаундер и СЕО в MapData. После слияния проекта с основным бизнесом Mapbox в конце 2017 года ещё 1+ год руководил минским подразделением Mapbox. В 2020 году работал с Huawei. CEO Rainbow.ai.

Что такое Rainbow.ai

Мобильное приложение, передающее гиперлокальный прогноз погоды (с фокусом на осадках) на основе данных радаров с использованием машинного обучения. 

Как возникла идея 

Александр Матвеенко:
— После ухода из Mapbox я сначала был в саббатикале, потом полгода работал с Huawei. Когда их забанил Google, они стали создавать собственные сервисы, в том числе карты, и я в Минске собирал команду для этого проекта. А в 2021 году пришёл Юра и заразил меня идеей погоды. Мол, прогнозных сервисов куча, рынок есть, а правильных предсказаний нет, — давай сделаем.
Юрий Мельничек:
— Дело было в Швейцарии. Я уже думал над этой идеей и шёл по радару в однодневный поход. По прогнозу дождевой фронт должен был пролететь мимо. Но на пути оказалась гора, он врезался в неё и начал осыпаться. И вот я иду и думаю: странно, я же в капюшоне, а всё равно чувствую, как дождик стучит по голове. Потом смотрю — а там град размером с виноград. Града в прогнозе вообще не было.   

В чём вообще проблема

Мельничек и Матвеенко могут долго рассказывать про то, почему прогнозы осадков, даже опирающиеся на данные радаров, никуда не годятся. Верить им нельзя — непременно промокнешь или, наоборот, зря возьмешь зонт. Основная причина в том, что радарные приложения работают по стандартному алгоритму Optical Flow, который моделирует движение тучи без поправок на особенности рельефа и поведение грозовых фронтов в этой местности в прошлом.

Юрий Мельничек:

— Радарные приложения в 2021 году уже были. Но, как нам кажется, работали они шаблонно: вот несётся буря, и приложения просто продолжают её движение — неважно, есть ли на пути гора. В то же время было несколько идей под эгидой «сейчас мы применим ML, и всё станет лучше».

Прогнозировать движение грозового фронта можно с помощью нейронных сетей, добавляя к радарным данным карту местности и натренировав нейросеть на данных, как именно в этой местности шёл грозовой фронт в прошлом. В случае с радарами машинное обучение может сделать больше, чем классическое алгоритмическое компьютерное зрение.

По словам Мельничка, другие проблемы — малая гранулярность и непонятность прогноза для пользователя.

— Почасовой прогноз, как сейчас в приложениях, не покрывает всех потребностей. Допустим, вы видите над отметкой «12.00», что вероятность дождя — 40%. Что это значит? В какое именно время и где пойдёт дождь, пойдёт ли он вообще? И что это будет за дождь — кап-кап или ливень? 

Не хватало простого, понятного прогноза. Сравните с навигатором. Допустим, вы выезжаете из Минска в Берлин, навигатор показывает прогнозное время прибытия 14.37. Он не рисует, что с вероятностью 60% вы приедете с 14 до 15. В пути он скорректирует время прибытия с учётом простоев на границе, пробок, ремонтных работ и т. д.

Вот так же надо и про дождь. Нужна не история с распределением вероятности, а предсказание, во сколько дождь начнётся и во сколько закончится.

Матвеенко дополняет: ещё одна проблема в том, что радарные данные очень шумные.

— Приложения берут данные радаров так, как их публикует источник, без глубокой обработки и устранения помех. Классический пример: на метеорадар во Внуково отбрасывает гигантскую тень Москва-сити — так, будто там всегда идет дождь. Если мимо пролетает птица, она тоже оставляет сектор засветки. Радар может показать очень плотную влажность даже в солнечную погоду за счёт физических процессов, отражаемых в атмосфере. Все эти паттерны мы стараемся устранять.

Во всех задачах должно помочь машинное обучение.

Одна из ошибок радаров — т. н. лучи, или сектора
Фильтрация этих ошибок

Юрий Мельничек:

— Когда мы начали работать с ML, увидели ещё одно гигантское преимущество. Источников данных много — не только метеорадары, но и метеостанции, мультиспектральные спутниковые снимки, глобальные климатические модели. Данные с них разрозненные и не всегда адекватные. Например, любительская станция может быть без подогрева: пошёл снег, а датчик его не видит. Солнце пригрело, снег растаял — датчик решил, что идёт дождь. 

Так вот с помощью ML можно объединить прогнозы, которые дают глобальные климатические модели, данные с метеорадаров и метеостанций.

Некоторые компании моделируют всю атмосферу Земли, но даже суперкомпьютер делает это долго. Нормой считается выкладывать новую модель каждые несколько часов. С такой периодичностью не получится быстро скорректировать метеопрогноз. 

У нас простой подход: мы не моделируем всю атмосферу — нейронные сети просто продляют траекторию движения грозы. Это позволяет уже сейчас пересчитывать прогноз для всей планеты каждые 10 минут, а в будущем — ещё чаще.

Александр Матвеенко:

— Есть ещё одна идея. В каждом смартфоне есть барометр. Мы хотим, чтобы люди со всего мира подключились и вместе с геолокацией делились данными с мобильных барометров. Хотим подмешивать их в модель и уточнять прогноз.

Но сначала их надо будет проанализировать, очистить от случайных вещей, сопоставить с прошлыми данными. Почему понизилось давление — потому что пошёл дождь, или просто пользователь полез в подвал за огурцами?

Что уже получилось 

Год назад в сторы вышли Android- и iOS-версии Rainbow.ai, с тех пор разработчики  добавляют в него функционал. На днях выходит релиз с трекингом ураганов.

Как ураган выглядит на метеорадарах

Александр Матвеенко:

— Мы много времени потратили на создание приложения, которое понравится нам самим. Было несколько итераций, в ходе которых переделывали дизайн, юзабилити и т. д. На вопросе, в какой цвет красить дождь, команда раскололась: одним нравился зелёный, а другим — фиолетовый. Мы отказались от идеи с процентами вероятности — вместо этого присылаем пользователю уведомление, что дождь начнется, допустим, в 17.22. Если видим, что он закончится в течение часа, то пишем еще и время завершения. 

Прогноз пока только на ближайший час, но со временем время будет увеличиваться. Уже есть план, как продлить прогноз на четыре часа, а потом и на 12 или даже 16 часов. 

В идеале через год мы будем предупреждать обо всех важных погодных явлениях на ближайший день, при этом пользователь сам будет выбирать, что для него важно — низкое давление или штормовой ветер.

Гиперлокальный прогноз — это на какую площадь?

Несколько сот метров. У нас пока больше — 1×1 км. Но и приложение пока далеко не конечный продукт, а скорее MVP. В этому году гранулярность улучшим. 

Какая ваша аудитория?

Сейчас месячная аудитория — 40-60 тысяч. Таргет же — миллиард пользователей со всего мира. 

Юрий Мельничек:

— Для приложения в Stealth Mode («режиме невидимки») 60 тысяч — это очень прилично. Приложение пока не рекламируется, мы закупаем совсем немного трафика — не для маркетинга, а чтобы ставить эксперименты.

Команда

На старте в 2021 году на проекте работал только один программист, который собирал данные. Сейчас Rainbow.ai — это 15 человек, находящихся преимущественно в Варшаве. В основном — беларусы плюс несколько россиян.

Александр Матвеенко:

— На старте у нас было несколько вариантов локации: Минск, Киев, Варшава, Берлин. Минск мы отмели, так как там уже не было достаточного количества программистов и становилось всё сложнее вести бизнес.

Юрий Мельничек:

— За Киев была борьба: я костьми лёг, чтобы только не Киев. Как оказалось, не зря. 

Александр Матвеенко:

— Оставались Варшава и Берлин. Стоимость содержания офиса и налоги там были на удивление одинаковыми, налоги в Польше даже чуть выше. Выбрали Варшаву, так как она ближе культурно, а ещё из-за программы Poland. Business Harbour.

Мы сразу договорились, что распределённую команду не строим. У нас много удалёнки, но люди всё равно собираются в офисе. PBH для этого отлично подходила.

Юрий Мельничек:

— У меня все компании переехали в Польшу. На самом деле, выбора-то и не было. Ну где ещё можно сделать офис? В Польше для этого есть рынок талантов. В Литве — нет, она очень маленькая, в Дубае — нет, туда только всех завозить. В других странах ЕС есть, но туда тяжело релоцировать людей. А в Польшу — легко. Для стартапов здесь есть решение всех проблем под ключ.

Александр Матвеенко:

— У нас в команде сейчас 15 человек: ML-специалисты работают удалённо, остальные приходят в варшавский офис. Команда укомплектована: есть разработчики Android- и iOS-платформы, продакт-менеджер, руководитель маркетинга, несколько человек заняты на обработке данных. Начинаем формировать отдел маркетинга.

Наш СТО — бывший техлид из Mapbox Денис Корончик: с опытом в геймдеве и картографии, он синергично вписался в команду.

Есть ещё административный директор из Польши. Сначала мы хотели взять своего, но потом решили, что директор будет эффективнее решать вопросы с местными органами и банками, если разговаривает с ними на польском. 

Юрий Мельничек:

— Потом правда выяснилось, что он на четверть беларус.

Монетизация

Модель монетизации гибридная — подписка и реклама. Подписка даёт доступ к дополнительным функциям.

Юрий Мельничек:

— В будущем в зависимости от региона мы будем делать упор на один из источников. В США традиционно лучше работает подписка, а в Юго-Восточной Азии, где осадки — огромная проблема, а люди победнее, вероятно, будем привлекать рекламу.

Александр Матвеенко:

— Один релиз назад мы запустили подписку — пока просто для того, чтобы была. Все наши друзья, родственники и другие лояльные пользователи подписались за $4,99 в месяц. В цифрах это всего ничего, но мы ожидаем повышения количества подписок от сезона ураганов, который уже сейчас начинается.

Как влияет App Tracking Transparency — правило Apple, которое мешает таргетингу рекламы

После того как Apple изменила настройки конфиденциальности и убрала доступ разработчикам к IDFA (The Identifier for Advertisers) по умолчанию, делать прибыльный бизнес в мобильной сфере стало гораздо сложнее. Рекламодатели не могут как раньше отслеживать активность пользователей и настраивать таргетинг. Но для Rainbow.ai это, кажется, не проблема.

Юрий Мельничек:

— Есть широкие и узкие темы. OneSoil, например, суперузкая тема, она интересна только людям в агробизнесе. У Vochi аудитория пошире, но всё равно это ниша для тех, кто создаёт контент. Maps.me намного шире, а погода — ещё более широкая тема. Да, из-за ограничений трекинга сейчас сложно делать таргетинг, пользователя нельзя идентифицировать. Но в погодном домене это и не нужно: ураган затрагивает всех пользователей вне зависимости от их социального статуса, дохода, интересов.

Мы будем запускать рекламные кампании в те моменты и в тех регионах, когда и где идёт непогода. Если идёт ураган на Флориду, то просто запускаем таргетинг туда. Положение пользователей по IP-адресу определяется достаточно хорошо.

Инвестиции

Юрий Мельничек и Александр Матвеенко — ранние инвесторы. Позже к ним присоединились два венчурных фонда с беларусскими корнями — Kolas Ventures и Veras Capitals. К концу года, после сбора метрик, стартап планирует искать новые инвестиции.

Юрий Мельничек:

— Начинали мы с Сашей, вкладывая свои деньги. Теперь я продолжаю вкладывать плюс несколько близких инвесторов, которые были с нами в предыдущих проектах (OneSoil, Vochi), на раннем этапе подключились по конвертируемым займам.

Инвесторам интересны метрики продукта — метрики метеоприложения лучше всего снимать в сезон плохой погоды. Сейчас он как раз наступает (дожди в Европе, ураганы в США), поэтому план такой: запускаемся на Product Hunt, смотрим какие метрики показывает продукт и с ними в конце 2023 года идём поднимать раунд. 


dev.by, как и другим честным медиа, сегодня очень сложно: редакция работает за пределами страны, а наши рекламные доходы сократились в несколько раз. Но мы справляемся — с вашей помощью. Это вы делитесь с нами инфоповодами, мнениями, опытом, временем и вниманием. А 210 читателей поддерживают нас донатами.

Через Patreon

Из Беларуси — через Donorbox.

И еще криптой. Тут кошельки.

Спасибо, что прочитали это сообщение.

У главного агростартапа беларусов — спин-офф. Делают полевую камеру с AI 
По теме
У главного агростартапа беларусов — спин-офф. Делают полевую камеру с AI

Читать на dev.by