CTO стартапа, куда вложились основатели MSQRD, говорит про «зубной» AI с планом на миллиард

Основатели MSQRD Евгений Невгень и Сергей Гончар вложили «несколько сотен тысяч долларов» в российский проект Diagnocat — технологию, которая с помощью AI по снимкам определяет состояние зубов, находит проблемы и подсказывает, как их лечить. Проект придумал Владимир Александровский, владелец сети стоматологических клиник в России и основатель группы медицинских компаний «Фэнтези». Кофаундер Матвей Ежов (СТО) рассказывает, как именно команда учит нейросети обгонять human level.

Оставить комментарий

— Мы не просто команда айтишников, которая собралась и решила что-то сделать для врачей — говорит Матвей Ежов. —  У нас есть врач — наш фаундер Владимир Александровский, который понял, что в стоматологии не хватает экспертизы по быстрому анализу снимков, по визуализации. И потом уже собрал команду айтишников. У него есть сеть стоматологических клиник в Москве, он сам практиковал как стоматолог. Второй наш эксперт в команде — Евгений Шумилов, тоже врач. Долгое время он продавал томографы. За счёт их контактов у нас огромное количество внешней экспертизы: рентгенологи, консультанты, в том числе из других стран.

В технической команде Diagnocat работает шесть инженеров, среди них один CTO-универсал — это Матвей. Один full stack разработчик, три ресерчера и дата-инженер. Плюс команда менеджеров и разметчиков.

«Не просто срезать несколько минут рутинной работы врача, а сделать что-то принципиально новое»

С чем вы работаете сегодня?

Основные снимки в стоматологии: 3D-снимок всей челюстно-лицевой области, панорамный двухмерный снимок и прицельные снимки, когда на скане видны только несколько конкретных зубов.

Мы работаем с 3D-снимком. Этот скан трёхмерный, его нельзя просто так взять и посмотреть. Информация, которая содержится внутри кубиков-вокселей (объемный аналог пикселей — прим. ред.) снаружи не видна, и нужно «ползать» внутри снимка, делать срезы. Такая процедура занимает очень много времени и требует особого обучения и ПО. Специалистов, которые могут этим заниматься, очень мало — на тысячу стоматологов приходится один рентгенолог. Наша технология снимет с них большой кусок работы и позволит сконцентрироваться на действительно сложных и интересных случаях.

Система Diagnocat состоит из четырех отдельных нейросетей, которые работают в двух направлениях:

  • локализация: находить анатомические образования внутри черепа — зубы, кости, каналы, пазухи и прочее,
  • диагностика: определять, что в зубе, канале, кости не так: кариес, периодонтит, другие патологии — и как это лечить.
Панорамная реконструкция. Diagnocat.
Читала в интервью, что у вас более 20 тысяч исследований. Этого достаточно? Откуда берете новые данные?

Мы обучаем наши нейросети на нескольких наборах исследований. Все наши данные российские, из клиник Владимира. Там все пациенты, когда приходят на приём, подписывают документ, мол, согласен, что результаты сканирования могут быть использованы в научных целях. Мы берём базу, выгружаем эти исследования, деперсонализируем. После этого — размечаем, то есть присваиваем вокселям определённые метки. Вот это — зуб, вот это — кариес.

20 тысяч (а сейчас уже значительно больше) — это пул неразмеченных исследований. То есть это результаты 3D-снимков без описания, без сегментации, без диагнозов. Сейчас из этого пула мы постоянно вытаскиваем новое исследование и размечаем его по разным направлениям.

Размеченных исследований у нас около семи тысяч. Уровень разметки делаем разный. Некоторые размечены поверхностно, например, нам известно, что в таком-то зубе есть кариес и всё. Другие размечены сложнее: каждому вокселю внутри скана присвоена определенная метка. Этих меток может быть разное количество и каждая будет обозначать какие-то анатомические факты.

«Если в такой стартап на стадии Seed привлекать деньги в России, то инвесторы оценили бы его в $1,5 млн, а в США — в $10-12 млн»

Разметка — это то, над чем мы постоянно ломаем голову: как размечать, на предмет чего, как обучать и организовывать людей, которые это делают. Цель — вытащить из исследования как можно больше релевантной информации для врача и упаковать в такой формат, который для него будет максимально полезным и удобным, поможет общаться с пациентами. Сложно сказать, сколько данных нам нужно — конечной точки нет. Как только мы закончим размечать то, что делаем сейчас, то просто начнем размечать что-то еще, — говорит Матвей.

Diagnocat уже начали патентовать технологию в США. Следующий большой шаг — одобрение FDA (Food and Drug Administration, Управление по санитарному надзору за качеством пищевых продуктов и медикаментов).

Зубы с проблемами автоматически отмечаются. Diagnocat.

В качестве одобренного FDA AI-проекта Матвей приводит в пример HeartFlow. Это компания, которая тоже работает с визуализацией медицинских данных. Они могут по снимку «вычислить» и визуализировать модель сосудов сердца, а потом определить, в каких частях нужно поставить специальные пружинки (стенты), чтобы улучшить кровоток. Раньше эта процедура занимала очень много времени и требовала высочайшей экспертизы. HeartFlow помогает просчитать место для операции с максимальной точностью и всего за несколько минут. Это значит, что AI не только экономит время врача, но и делает сложную операцию значительно безопасней.  

Другой пример — Viz.ai. Делает анализ кровотока в бассейне сонной артерии при подозрении на инсульт. Цель — определить место «неполадки» и выбрать правильную терапию. Каждые 10 минут промедления при инсультах повышают смертность. Для традиционного метода (когда только врачи определяют диагноз) нужны высококвалифицированные спецы, которых в неотложке есть далеко не всегда. Без Viz.ai диагностика занимает более часа.

— К такому применению технологий стремимся и мы в Diagnocat. Не просто срезать несколько минут рутинной работы врача, а сделать что-то принципиально новое, что раньше было невозможно. Например, до нас никто не мог по снимку разделить и визуализировать (сегментировать) все анатомические области в голове — челюсти, зубы, каналы, пазухи — и построить их точные модели. Мы будем это делать. Diagnocat — это не только про зубы. Мы стремимся к тому, чтобы определять все элементы, которые участвуют в стоматологических операциях, — говорит Матвей.

Лучше, чем человек

— Мы работаем над тем, чтобы показывать результаты лучше, чем human level. По локализации мы уже обгоняем человека. По диагностике — сложнее. Есть чисто технические сложности. Например, на снимке может быть затемнение, и пока не всегда удается четко определить — это кариес или просто затенение от инструмента. Есть недостатки в исследованиях — редкие случаи мы определяем пока что значительно хуже людей, сложно собрать репрезентативный дата-сет. Наши консультанты составили список из нескольких десятков разных состояний, которые связаны с онкологией, с непонятными образованиями, аномалиями развития. Тут мы учимся.

Но это еще не все. Мало просто увидеть патологию, надо доказать ее. Это отдельная работа. Сейчас мы начинаем большое исследование по измерению human level в разных странах. Схема такая: взять врачей, раздать им задание на диагностику и измерить, насколько они соглашаются с результатами друг друга и с нашими результатами. Если врачи чаще согласны между собой, чем алгоритм с врачами — мы хуже человека определяем диагноз. Наоборот — лучше.

Отчёт о состоянии зуба, который составляют совместно AI и человек. Diagnocat.

На маленьком семпле врачи очень редко соглашались друг с другом. По сложным состояниям уровень согласия между врачами среднего уровня был меньше 30%. По более простым состояниям — больше 70%. Сейчас нужно проверить на больших выборках вместе с внешними экспертами.

Где тестируете?

Сам продукт с лета мы тестируем в клиниках Владимира. Скоро запустим тестирование во внешней клинике, тоже в России. Human level будем изучать в трех странах: Россия, одна страна в Европе (не скажу) и в Турции.

Первый запуск будет в России, основная прибыль — в Штатах

Как Евгений Невгень и Сергей Гончар участвуют в проекте?

Гончар очень помогает с технической экспертизой по 3D, по инженерной части в целом. Невгень — по продукту, в том числе в части дизайна. И по отношению с инвесторами, помогает их привлекать. Они оба ещё помогают находить технарей в команду. Вот меня именно они и привлекли.

Разработка MSQRD была в Беларуси. Тут льготы, кадры, ИТ-страна. Не думали о том, чтобы и Diagnocat перевести сюда?

Нет, не планируем. Но, возможно, откроем у вас офис. У нас есть несколько крутых специалистов из Беларуси которые нас консультируют, возможно, потом они вольются в проект и мы для них сделаем в Минске «отдел». А вообще — мы распределенная компания — не привязываемся к месту.

Вас ждут на рынке в США? Что показывает исследование рынка?

Показывает, что мы очень актуальны в Штатах. Руководители клиник и наши консультанты, с которыми мы общаемся, — все говорят, что хотят такой продукт.

По теме
Все материалы по теме
Будете ли запускаться в СНГ или не выгодно?

Однозначно. Первый запуск будет в России. Дальше пойдем в Штаты. По поводу выгоды… У всех продуктов, которые запускаются больше, чем в одной стране, есть персонализированная ценовая политика. В России и СНГ цена может быть ниже, чем в других регионах. Не только потому, что уровень жизни ниже, но и потому, что люди здесь просто не хотят платить. Наш продукт будет продаваться в России по сниженным ценам, в то время как в Штатах, уже сейчас, стоимость одного рентгенологического отчета (от врача) стоит $70-150 за одно исследование.

Как врачи реагируют на технологию? Нет отторжения — какая-то технология должна заменить их экспертизу?

Так говорят, как правило, очень крутые специалисты, которые видят дефекты программы. Но они тоже резко не критикуют. Говорят: «Да, эта программа не для нас, я бы ее использовать не стал, но для менее опытного врача она будет очень полезна».

По поводу «заменить их экспертизу». Я уже говорил, что рентгенологи довольны, потому что могут сосредоточиться на важных и интересных случаях. А стоматологи довольны, потому что их основная работа все равно мануальная, а в диагностике хорошо бы найти помощь. То есть как ни крути — всем хорошо.

Вообще, реакция на продукт не такая жесткая, как мы думали (смеется).

Какие у вас есть конкуренты?

Есть ребята Ocutri (выпускники факультета вычислительной математики и кибернетики МГУ). Их сравнивают с нами, но про них мало информации. Судя по сайту, они занимаются всем подряд. А когда занимаешься всем подряд, у тебя нет шансов построить продукт, где нужно много врачебной экспертизы. Прямые конкуренты у нас есть в Израиле, прямо то же самое делают. Компания Orca Dental Ai. Мы к ним ездили в гости, и нас активно убеждали, как это сложно, и что нам этой сферой не нужно заниматься (смеется).

Но вообще наш рынок настолько большой и непонятный, что конкуренты никак не мешают.

Весной 2019 года вы едете представлять Diagnocat на Международной стоматологической выставке в Кельн. Что лично вы ждете от поездки?

Я жду пользователей, трафика на серверы — операционный геморрой, вот чего я жду (смеется). На самом деле это будет глобальный запуск, будет много пользователей, польется фидбек. Будут результаты, метрики — очень круто.

Какой пока самый негативный отзыв о Diagnocat?

А не было пока негативных. Вот когда доктор откроет снимок, зальёт в Diagnocat, поставит наш диагноз без проверки (хотя мы всегда просим проверять) и облажается — вот тогда будут негативные отзывы. Пока рано.

Конечный проект будет тоже давать альтернативное мнение или может полностью заменить врача-рентгенолога?

Зависит от того, насколько мы будем хороши. Если покажем очень хороший перформанс и докажем это регуляторам, сможем сделать автономный вариант. У нас есть план больше чем на десять лет вперед. Там мы выстраиваем многомиллиардную компанию. Я его вам, конечно, не расскажу — это же хитрый план о том, как захватить весь мир.

Слева направо: Сергей Гончар (MSQRD), Владимир Александровский (Diagnocat), Евгений Невгень (MSQRD) и Матвей Ежов (Diagnocat).


По словам Владимира Александровского, за полтора года основатели проекта — он, Евгений Невгень и Сергей Гончар — вложили в Diagnocat несколько сотен тысяч долларов собственных средств:

— Проект должен стать масштабным и финансировать его дальше собственными средствами затруднительно. Мы начали искать инвесторов среди венчурных фондов в Европе и США. Про объем требующихся вложений скажу так: если в такой стартап на ранней стадии (Seed) привлекать деньги в России, то инвесторы оценили бы его в $1,5 млн, в Европе — $5-7 млн, а в США — в $10-12 млн.


Читать на dev.by