ProgerX
Пользователи-
Количество публикаций
47 -
Зарегистрирован
-
Посещение
Все публикации пользователя ProgerX
-
Под такими системами слежения за объектами я понимаю что-то типа такого: Причём, "изображение" людей тут пересекаются, при этом система продолжает отлично функционировать и следить. Вот ещё понравилось такое видео: Система следит за машиной, а когда из неё выходит человек, система следит за обеими объектами Не очень тут понял, почему система следила именно за этой машиной, когда были и остальные.. походу она следит за всем, что движется или двигалось Вот ещё наглядное видео с какими-то отмеченными точками на объектах: А какими способами достигается подобное? Могу предположить, что здесь задействованы оптические потоки. После чего локализуются места где этих "потоков" больше всего - там движется объект. Там где нет потоков (ниже какого-то порога наверное, а то зная качество своей вебки, могу представить, что двигаются там все без исключения пиксели ) - соответственно там фон, не движущийся объект..
-
Хочу попытаться сделать что-то типа такого: но опыта очень и очень мало в распознавании образов, а в программировании, обратно - достаточно Только на одном опыте программинга далеко в этом деле не уедешь. Можете что-то порекомендовать? В какую сторону хотя бы смотреть? На какие алгоритмы стоит обратить внимание?
-
Запускаю сэмпл facedetect из пакета OpenCV вот так: ./facedetect --cascade=../../haarcascades/haarcascade_frontalface_alt2.xml 0 Помимо моего лица, он находит штуки два на обоях, дверях. Не очень радуют меня эти сбои, покуда есть подозрения, что такие сбои только из-за моей вебкамеры (Logitech QuickCam Communicate Deluxe). Кто-нибудь пробовал работать с этим приложением? Часто ли оно даёт у Вас подобные сбои? На самом деле, камера просто отвратительно нечёткая. Вот пример её съёмки: http://rapidshare.de/files/47770677/capture2.avi.html далее я поднимаю насыщенность. Видно что пиксели так и не могут усидеть на месте В этом-то и проблема Вдруг, если именно по аналогии камера и "создаёт" фейковые лица, что opencv путается постоянно.. Кстати, а никто не знает ли как там происходит распознавание лица? По одному кадру или анализируются и предыдущие? Если первое - то проблема не в камере, а в алгоритме OpenCV, а если второе.. то вполне возможно, что logitech подвёл своей дорогой, но некачественной камерой.
-
Есть ли вообще какие-то среды разработки для распознавания речи? Может даже OpenCV что-то умеет в подобном направлении? В принципе распознавание образов, наверное, одно для всех, а основа здесь - это предобработка полученных данных. А дальше уже кластеризировать образы - кто во что горазд
-
Накопал в GIMP'е такой интересный эффект "постеризации" изображения (Colors->Posterise). Сразу прикинул, что это можно неплохо заюзать в удалении шумов А какой алгоритм может быть у такой штуки? Насколько я понимаю, это сведение цветов изображения к меньшему числу цветов..
-
Как осуществляется постеризация изображения?
ProgerX replied to ProgerX's topic in Обсуждение общих вопросов
Аа.. приблизительно вырисовывается возможный алгоритм постеризации изображения. Изначально задаём необходимое количество цветов (финальное, которое будет в постеризованном изображении), ну и используя поиск ближайшего цвета в палитре: http://algolist.manual.ru/graphics/find_col.php чего-нибудь делаем для достижения результата (чего-нибудь - это "ответ на вопрос" в какой цвет закрасить текущий цвет картинки (то бишь к какому цвету этот цвет является более ближним) ). -
Спасибо за туториал! Я думаю для кроссплатформенной работы со звуком PortAudio подойдёт.. хотя не работал с ним ещё. Только выполнил пару примеров снятия микрофонного звука и проигрывания его.. работает
-
В джаббере фигово единственное то, что почему-то там не удаётся зарегистрировать ник в пределах одной комнаты.. В последствии чего, любой может пользоваться твоим ником, заходить под ним, оставлять от твоего имени сообщения.. Может кто-то нашёл решение этой проблемы?
-
Как работают системы слежения за объектами?
ProgerX replied to ProgerX's topic in Обсуждение общих вопросов
Ещё, кстати, недавно читал, что фильтр Калмана используют для слежения за объектами.. -
Тоже верно, конечно Ну там ведь разные цветовые настройки, освещение, линзы даже наверное отличаются у разных камер (мегапикселями и прочими параметрами)..
-
А непосредственно захват звука что производит? OpenCV или WinAPI?
-
ёёёмоё... послушал демо - это просто нечто! Последний раз когда я игрался с разными Speech API от майкрософта... Ну в общем, это просто несравнимо. Это они изначально слоги записывают, а дальше комбинируют и получают вот такую вот речь или там принципиально иная технология порождения речи?
-
Кстати, а когда работают с "бинокулярным зрением" (когда используют две и более камеры), обязательно ли нужно, чтобы эти камеры были идентичными моделями или нет? Просто я так представил человека с разными глазами.. но с другой стороны, разное зрение у глаз одного человека - бывает
-
Погоди, а в OpenCV даже аудиозахват есть? Фигасе.. пошёл срочно изучать эту тему! А "mmsystem.h" для чего используется? (подключено, по крайней мере ). А воспроизводить и генерировать звуки оно не умеет случаем?
-
Либо рисовать можно, в принципе, там куда выводишь изображение (с отрисовкой). А участок окружности можно через полярные координаты отрисовать..
-
Как работают системы слежения за объектами?
ProgerX replied to ProgerX's topic in Обсуждение общих вопросов
А MeanShift это что? Читал описание функции "GoodFeaturesToTrack", по-моему на этом сайте скачанном.. А что понимается под сильными угловыми точками и вообще собственными числами? -
440 баксов.. Вообще, интересная вещь для робототехники, наверное. Правда дома у меня такой бордак, что он просто не проедет
-
А ещё сходу придумать можно такое: если точку предполагается искать одну, то исходить из того факта, что чаще всего она бывает ближе к центру.. Соответственно раскручиваем Архимедову спираль и по ней ищем попадение в лазер. В качестве оптимизации - чтобы постоянно не расчитывать точки спирали (они ведь одни и те же всегда) - кэшим их в массив точек и считываем отсюда. Во сколько решений разных
-
А результаты работы такого алгоритма где-то можно посмотреть? Интересно насколько хорошо он может текст от изображения отделять.. честно говоря, в такое даже вериться с трудом..
-
Я вот могу предложить некоторый алгоритм поиска подобной точки (непосредственно поиска центра). Строим решётку по всей плоскости. Расстояния между точками должны быть такими, меньше которого точка у нас не поместилась бы.. Таким образом мы быстро натыкаемся на нашу точку (определяем например по порогу). После того как мы определили любую точку нашего лазера - в разные стороны запускаемся попиксельно (проверяя где пятно==цвет ещё существует). После мы получаем минимум по Х, по У и их максимумы. Делим пополам - получаем центр. Интересно, в OpenCV алгоритм оптимальнее? В качестве развития идеи, в алгоритме можно двигаться не попиксельно, а тоже перепрыгивая через некоторое расстояние. А как хватнули лишнего - так назад на один шаг и попиксельно смотрим где там границу потеряли.
-
А под crust'ом там что имеют ввиду?
-
Клёво оптимизировали, не задев особенностей архитектуры
-
А.. ну тогда понятно. Хотя я почему-то так и думал Кстати, а скомпиленные проги с использованием OpenCV работают под любыми процессорами?
-
По заливке сложно представить как я буду угадывать - фон это или тело.. По поводу cvAbsDiff - да это тоже самое, наверное, в принципе.. Только его надо разово применить, а далее обрабатывать полученный массив разниц. В чём отличие этих cv* функций, они быстрее? Я просто смотрю, что много в OpenCV есть таких функций, которые есть, в принципе, везде И зачем они их только наделали может они быстрее работают, чем возможные мои реализации подобных функций.. Кстати, сейчас запустил эту программу. Подрегулировал баланс белого - и почти отлично стало! Баланс я как регулировал.. Поднял saturation до потолка - так отлично видно как пиксели скачут. И далее поймал такой баланс, где амплитуда скачков минимальна.. ну и вот - уже смотрибельно Дырки некоторые есть, но для начала сойдёт! Тем более что никакую цель я не преследую сейчас. Исключительно научиться работать с камерой и OpenCV. Да и плюс к тому - я ещё ни HSV не использовал, ни видеоаккумулятор, поэтому всё ещё впереди! А для начала - вполне!
-
Кстати, попробовал сделать вот так: c1 = cvGetAt( bgWithoutFace, i, j ); c2 = cvGetAt( currentFrame, i, j ); int dSum = abs( c1.val[ 0 ] - c2.val[ 0 ] ) + abs( c1.val[ 1 ] - c2.val[ 1 ] ) + abs( c1.val[ 2 ] - c2.val[ 2 ] ); if ( dSum < 30 ) { .... } чё.. весело Хотя бы уже что-то. Получаем вырезание себя и вклеивание на фон, только у "себя" дырки в теле частенько появляются внушительных размеров