Semyon 0 Жалоба Опубликовано July 17, 2016 Здравствуйте. У меня есть множество фотографий, на которых есть множество похожих предметов. Пример на фото. Мне необходимо найти границы каждого такого предмета. Сейчас я занимаюсь поиском прямоугольных коробок товара. Сначала нахожу логотипы на фото, потом к каждому логотипу пытаюсь найти границу коробки, на которой этот логотип находится. Использую алгоритм Хафа для поиска и выделения линий. Мой код (с использованием OpenCV) сейчас выделяет примерно 20% коробок. Данных (размеченных коробок) не очень много, что не позволяет нормально обучить статистические алгоритмы (напр., нейросети) Подскажите, пожалуйста, способы выделить коробки, особенно с учётом их похожести. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
BeS 53 Жалоба Опубликовано July 18, 2016 В свое время ковыряли вот такой вот детектор. Оно основано на матчинге особых точек и умеет детектировать объекты и определять их позу в 3D. Из минусов - довольно геморойно создавать базу объектов (помимо картинок с разных ракурсов требуются еще облака точек), не очень быстрая работа на большом разрешении и точность хуже, чем у Deep Learning'а. Вот примерно так оно работает: Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
mrgloom 242 Жалоба Опубликовано July 18, 2016 Вот такой пример есть https://introlab.github.io/find-object/ https://github.com/introlab/find-object/wiki/BeersWall Кстати эту задачу для мерчендайзинга кто то уже коммерчески решил? по Texture object detction Так там надо облако точек, т.е. надо 2 камеры или кинект? Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
BeS 53 Жалоба Опубликовано July 18, 2016 3 hours ago, mrgloom said: по Texture object detction Так там надо облако точек, т.е. надо 2 камеры или кинект? Оно работает с монокамерой, но для построения базы объектов, которые он ищет, нужны облака точек, которые можно получать разными способами, в том числе и кинектом. Смысл там в том, что у тебя для каждого объекта есть несколько изображений с разных ракурсов + облако, та из всего этого лепишь модель объекта, а потом можешь во первых матчить этот объект с разных ракурсов на сцену, а во вторых решать задачу pnp для определения позы объекта. Но все это уже немного CV-некромантия и так уже никто не делает) Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
mrgloom 242 Жалоба Опубликовано July 19, 2016 А как делают? Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
BeS 53 Жалоба Опубликовано July 19, 2016 6 hours ago, mrgloom said: А как делают? Нынче модно семантическую сегментацию делать при помощи какого-нибудь SegNet/FCN. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах