Google обновила самый крупный датасет для компьютерного зрения
Разработчики AI-подразделения Google выпустили 6 версию датасета Open Images, в которую добавили новые виды маркировки, пишет Neurohive.
Разработчики AI-подразделения Google выпустили 6 версию датасета Open Images, в которую добавили новые виды маркировки, пишет Neurohive.
В последней версии датасета появились так называемые «локализованные нарративы» для 500 тысяч изображений. Это новый вид мультимодальной разметки, в которой синхронизированы текст аннотации, начитка и движения указателя мыши по описываемым предметам.
Помимо этого, в Open Images V6 значительно расширены типы разметки визуальных взаимосвязей между объектами на изображениях (например «человек катается на скейтборде», «собака ловит летящий диск»). Также добавлено 2,5 млн разметок человеческих действий («прыгает», «улыбается») и 23,5 млн меток изображений.
Open Images — самый крупный размеченный датасет с картинками, который активно используется для задач компьютерного зрения. Он содержит 9 млн изображений.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.