Ещё один ИT-гигант открыл доступ к своей системе на основе искусственного интеллекта. Несмотря на то, что Yahoo скоро будет продана, у компании ещё осталось секретное оружие. Издание Wired доказывает, почему механизм CaffeOnSpark заслуживает внимания, пишет Hightech.fm.
В своё время компания создала Hadoop — платформу с открытым кодом для обработки данных, которой успешно пользовались Facebook, Twitter и целый ряд других компаний. Для обучения систем на основе искусственного интеллекта данные играют не меньшую роль, чем алгоритмы. И именно богатый набор данных — главное достоинство Yahoo и CaffeOnSpark.
CaffeOnSpark работает на основе глубокого обучения и позволяет с большей точностью искать фотографии на принадлежащем Yahoo сервисе Flickr. Механизм поиска использует не описания снимков и не ключевые слова, проставленные пользователями, а характеристики самих фотографий — их цветовую гамму, изображённые на них объекты и живые существа.
Все подобные системы постоянно обучаются и совершенствуются в зависимости от количества потребляемого ими контента — чем больше фотографий «видит» алгоритм, тем умнее он становится.
На Flickr хранятся миллиарды фотографий и подвергать из глубокому изучению можно на тех же самых серверах, на той же самой инфраструктуре — и это ещё один плюс Yahoo.
CaffeOnSpark состоит из алгоритма глубокого обучения Caffe и системы обработки данных Spark. Обе технологии могут работать на базе платформы Hadoop. То есть технологии Yahoo позволяют накладывать один механизм и использовать их группами. Это упрощает работу разработчикам ИИ и позволяет распределять процессы глубокого обучения на нескольких серверах. Такой возможности нет даже у TensorFlow от Google, поэтому доступ к открытому коду CaffeOnSpark — это хорошие новости для многих специалистов в области ИT.
Напомним, крупнейшие ИT-компании мира и исследовательские лаборатории ведут активные разработки в области искусственного интеллекта и машинного обучения. В январе 2016 года исследователи Microsoft выложили на GitHub исходники инструментария CNTK (Computational Network Toolkit) с реализацией алгоритмов глубокого машинного обучения, который предназначен для ускорения работ в сфере искусственного интеллекта. Неделей ранее та же Yahoo открыла для всех желающих крупнейший массив данных в области машинного обучения. В 2015-м Google сделала свою систему машинного обучения TensorFlow открытой для всех желающих. Microsoft также открыла код среды для машинного обучения.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.