BeS

Пользователи

Профиль Активность

Количество публикаций
349
Зарегистрирован
June 25, 2012
Посещение
June 30, 2018
Days Won
43

Тип публикации

Вся активность

Профили

Форум

Все публикации пользователя BeS

Библиотека сверточных нейронных сетей

BeS replied to _me_'s topic in Вопросы по нейросетям и ИИ

Там есть раздел с туториалами: http://eblearn.cs.nyu.edu:21991/doku.php?id=all_tutorials
- July 29, 2013
- 23 replies
Проекция --> в 3D

BeS replied to jpelikan's topic in OpenCV

В общем случае при построении обратного отображении к R^3 -> R^2, получаем отображение R^2 -> R^3, где каждой точке (x, y) соответствует множество точек {(x, y, z)}. В случае проекции конкретного 3D объекта на 2D плоскость, каждой точке плоского изображения может соответствовать несколько точек 3D объекта(какая конкретно - зависит от ракурса и т.д. и т.п.). Т.е. для нахождения соответствия вам скорей всего придется проецировать все 3D точки на искомую плоскость, а дальше разрешать сюръективность при помощи эвристик(например из всех 3D точек отобразившихся в одну 2D точку выбирать ближайшую по цвету и т.п.).
- July 3, 2013
- 6 replies
VIBE

BeS добавил тему в OpenCV

Кому интересно, написал довольно шуструю вычиталку фона(пока только последовательная версия, до распараллеливания пока руки не дошли) основанную на алгоритме VIBE с оберткой для использования в OpenCV. Оригинальная статья: http://orbi.ulg.ac.be/bitstream/2268/145853/1/Barnich2011ViBe.pdf Мои исходные коды: https://github.com/BelBES/VIBE
- May 24, 2013
- - 4
Трекинг точек на лице

BeS replied to iamx4nd3r's topic in OpenCV

Ну наверно это выглядеть должно примерно как в этом видео: http://www.ecse.rpi.edu/homepages/cvrl/Demo/Demo_Wang.avi Где узлы "сетки" это ваши синие точки. А оптимизировать вероятно длины ребер и углы между ними. Более подробно не знаю т.к. не занимался задачей распознавания мимики.
- May 3, 2013
- 9 replies
Трекинг точек на лице

BeS replied to iamx4nd3r's topic in OpenCV

1) Не советую использовать ANSI C интерфейсы в opencv, т.к. уже в opencv 3.0 эти интерфейсы по сути deprecated, в следующих версиях их вероятно выпилят полностью. 2) Судя по примеру картинки - точки не рандомно по лицу натыканы, а имеют какую-то структуру. Отсюда возникает мысль, что имеет смысл построить параметрическую модель(модель в виде графа мне кажется вполне приемлемой) этих точек и искать их положение через задачу оптимизации. Так вы сможете достраивать модель даже в том случае, если некоторое число точек не было найдено.
- April 29, 2013
- 9 replies
Необработанное исключение

BeS replied to David's topic in OpenCV

PDB файлы - это всего лишь файлы содержащие дебажную информацию, без них максимум что не получится отладчиком зайти в opencv'шные библиотеки.
- April 25, 2013
- 30 replies
Распознавание объектов на столе

BeS replied to pnp2000's topic in OpenCV

Все зависит от характера объектов. Вы-бы лучше выложили пример изображения с объектами.
- April 22, 2013
- 16 replies
Распознавание дорожных знаков

BeS replied to Loko's topic in OpenCV

С FANN не работал - не знаю. "предобучением через отжиг" - грубо говоря сначала раскаляем динамическую систему(берем большие значения весов в НС), а затем остужаем её, при этом ДС переходит в некоторое состояние равновесия, полученную таким образом НС использовать как начальное приближение при обучении методом обратого распространения ошибки. Подробнее можно почитать например в книге Хайкина "Нейросети: полный курс".
- April 10, 2013
- 12 replies
некоторые вопросы по SVM

BeS replied to mrgloom's topic in Обсуждение общих вопросов

1)Суть применения kernel trick - повышение размерности задачи, как альтернативу ему, можно пробовать понижать размерность за счет фильтрации шумов при помощи например МГК или RF, правда для линейно неразделимых и разумно подобранных фич этот трюк прокатит навряд ли. 3)Kernel Trick вообще никаких гарантий не дает, есть лишь предположение о том, что при отображении данных в пространство большей размерности множества окажутся линейно разделимыми. 4)Насколько я помню, для случая линейно разделимости только 1 гиперплоскость является оптимальной и много гиперплоскостей могут быть допустимыми.Причем и опорные вектора и гиперплоскость вроде находятся в этом случае однозначно.
- April 8, 2013
- 3 replies
- - 1
Распознавание дорожных знаков

BeS replied to Loko's topic in OpenCV

Для детектирования использовать LatentSVM. Для распознавания использовать глубокую сеть с предобучением через отжиг (на задаче распознавания знаков на таких сетях на практике достигают точности в районе 99,8%).
- April 8, 2013
- 12 replies
Подсчет людей в кадре

BeS replied to nikrubab's topic in OpenCV

Подтормаживает потому, что: 1) вероятно вы используете изображения большого размера 2) вероятно вы используете Хааровские классификаторы, если взять LBP, то алгоритм будет ворочаться пошустрее, но менее точно. В туториале с opencv.org есть переменная std::vector<cv::Rect> faces; Там лежат координаты ROI всех найденных лиц, faces.size() вернет количество лиц найденных на изображении.
- April 5, 2013
- 11 replies
Подсчет людей в кадре

BeS replied to nikrubab's topic in OpenCV

Чтобы прочитать консольный вывод, существует магическая кнопка F10 в VS, тогда можно выполнять программу пошагово и смотреть на чем краш происходит. Cannot find or open the PDB file - это значит, что не найдены файлы с дебажной информацией. The thread 'Win32 Thread' (0x9d8) has exited with code -1073741510 (0xc000013a). - это по видимому говорит о том, что где-то в приложении есть мультитрэйдинг и в нем некорректно, либо авварийно завершаются порожденные потоки(основной судя по всему корректно умирает). По поводу сампла на opencv: http://docs.opencv.org/doc/tutorials/objdetect/cascade_classifier/cascade_classifier.html#cascade-classifier вот туториал по созданию каскадных классификаторов на основе Хааровски слабых классификаторов.
- April 5, 2013
- 11 replies
"Похожесть" звуковых файлов

BeS replied to mrgloom's topic in Обсуждение общих вопросов

Ну в Shazam, например, для поиска песен используется Time-Frequency Analysis, вероятно для поиска "похожих" песен тоже можно применить)
- April 5, 2013
- 9 replies
Подсчет людей в кадре

BeS replied to nikrubab's topic in OpenCV

У вас должен быть список координат ROI найденных лиц? слить ROI который принадлежат одним и тем-же лицам и будет вам размер вектора соотвествовать числу лиц в кадре...
- April 4, 2013
- 11 replies
deep learning

BeS replied to mrgloom's topic in Обсуждение общих вопросов

А никто не знает хорошего описания на русском языке по Deep Learning? А то на английском вагон статей, а в рунете такое ощущение что никто не пользуется.
- March 27, 2013
- 10 replies
Лекции по машинному обучению

BeS replied to Smorodov's topic in Вопросы по нейросетям и ИИ

У Золотых Н.Ю. на сайте есть еще методички к лабораторным работам с описанием основ работы с R http://www.uic.unn.ru/~zny/ml/ А еще есть интересный сайт, где можно повышать свои скилы в это области, участвуя в конкурсах https://www.kaggle.com/
- March 27, 2013
- 20 replies
Сборка OpenCV под Linux на ARM, ругается x264

BeS replied to Artemka86's topic in OpenCV

А как победили?
- March 23, 2013
- 4 replies
нейросеть в opencv

BeS replied to Scouty's topic in OpenCV

Вот там есть документация по всем алгоритмам машинного обучения в OpenCV: http://docs.opencv.org/modules/ml/doc/ml.html
- March 21, 2013
- 4 replies
Решатель уравнения Пуассона и пара примеров применения.

BeS replied to Smorodov's topic in OpenCV

А не пробовали скармливать этому солверу ГУ как у вас, а в качестве начальных условий например сифтовые дескрипторы? Интересно было-бы взглянуть на результаты.
- March 19, 2013
- 9 replies
Решатель уравнения Пуассона и пара примеров применения.

BeS replied to Smorodov's topic in OpenCV

У вас в коде в нескольких местах присутствуют примерно такие конструкции: for(int i=0;i<H-1;i++) { for(int j=0;j<W-1;j++) { gyy.at<float>(i+1,j)=gy.at<float>(i+1,j)-gy.at<float>(i,j); gxx.at<float>(i,j+1)=gx.at<float>(i,j+1)-gx.at<float>(i,j); } } Если тут использовать для обращения к отдельным элементам вместо .at<> явное обращение через указатель, то будет прирост производительности.
- March 18, 2013
- 9 replies
- - 1
сшивка в панораму

BeS replied to mrgloom's topic in OpenCV

Ну у нас есть для каждой точки SIFT дескриптор, образ ищем как точка с ближайшим по заданной метрике дескриптором. Собственно пары точек это если говорить терминами OpenCV - это объекты типа cv::DMatch. Вообще ваша задача мне напоминает Kinect Fusion, только в вашем случае пространственной информации меньше. Вот описание того, как работает kinfu: http://razorvision.tumblr.com/post/15039827747/how-kinect-and-kinect-fusion-kinfu-work, может оно натолкнет на какую-то идею.
- February 8, 2013
- 46 replies
- - 1
сшивка в панораму

BeS replied to mrgloom's topic in OpenCV

Я не понимаю что вы пытаетесь формализовать в виде графа и какие циклы обходить...
- February 8, 2013
- 46 replies
сшивка в панораму

BeS replied to mrgloom's topic in OpenCV

У вас есть два набора точек с каждого изображения. Берем один из наборов как исходный и пытаемся найти каждой точке из набора образ в наборе точек с другого изображения -> получаем пары точек. Ребро в графе связывает 2 пары точек, т.е. 2 точки исходного изображения и 2 точки соответствующих образов. По последней ссылке, насколько я понял при беглом осмотре, на каждом шаге берем новое изображение, строим гомографию между ним и каждым изображением уже вошедшим в панораму, потом пытаемся вклеить это изображение в сцену минимизируя ошибку преобразования при добавлении этого изображения.
- February 8, 2013
- 46 replies
сшивка в панораму

BeS replied to mrgloom's topic in OpenCV

Да, строю полный подграф с вершинами представляющими соответствия, а "хитрая формула" - это ф-я оценки взаимного расположения для 4х точек(2 точки с каждой вершины). Потом я строю для каждой вершины окрестрость (выбираю те вершины вес от котороых до текущей больше порогового) и в окрестности ищу локальный максимум при помощи линейного программирования, затем для пересекающихся локальных максимумов(окрестность строю для каждой вершины, поэтому много чего пересекаться будет) объединяю окрестности и на выходе получаю уже образы, размер которых определается размером локальных максимумов. Свойство непересечения логично вытекает из физической природы мира (одна и та же точка не может принадлежать разным объектам). Оптимальное в глобальном смысле решение не гарантируется (т.к. оно будет соответствовать глобальному максимуму, который мы не ищем), но решение получается приемлемым. Ищем мы столько образов сколько есть на изображении а не только максимальный. Размеры образов для поиска можно регулировать выбирая различную ф-ю задающую вес ребра и выбирая различные окрестности. Мера похожести задается при помощи выбора различных криетриев для построения исходного набора соответствий и выбор различных весовых функций. Для N изображений я даже не задумывался как обобщить, можно и все изображения попарно прогонять, а можно попробовать последовательно прогнать и транзитивно строить преобразования между всеми изображениями (гесли знаем гомографию A -> B и B -> C, то логично предположить, что мы сможем аналитически построить преобразование A -> C), но это надо на практике проверять уже.
- February 7, 2013
- 46 replies
сшивка в панораму

BeS replied to mrgloom's topic in OpenCV

Клика — полный подграф неориентированного графа. Другими словами, клика графа есть подмножество его вершин, такое, что между каждой парой вершин этого подмножества существует ребро и, кроме того, это подмножество не принадлежит никакому большему подмножеству с тем же свойством. В данном случае ссылку я кинул только для того, чтобы показать идею того, как это принципиально решается. По сути вы хотите решить NP-полную задачу, а они за "умеренное"(относительно полного перебора естественно) время решаются через линейное программирование. Собственно эту задачу я и решал) В статье у меня граф как раз так и строится, только там в качестве вершин используются не патчи с одного изображения а соответствия, тем самым я сразу уменьшил количество рассматриваемых вершин(можно сразу отсеять совсем неудачные варианты просто по дистанции между дескрипторами) и получаю возможность свести задачу с полного перебора по двум графам к задаче оптимизации на одном графе. Если вас интересует построение панорам в принципе, то я бы посоветовал вам посмотреть вот эту книгу: http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf , там вроде целая глава была посвящена склеиванию панорам.
- February 7, 2013
- 46 replies

Войти

BeS

Количество публикаций

Зарегистрирован

Посещение

Days Won

Тип публикации

Профили

Форум

Все публикации пользователя BeS

Библиотека сверточных нейронных сетей

Проекция --> в 3D

VIBE

Трекинг точек на лице

Трекинг точек на лице

Необработанное исключение

Распознавание объектов на столе

Распознавание дорожных знаков

некоторые вопросы по SVM

Распознавание дорожных знаков

Подсчет людей в кадре

Подсчет людей в кадре

"Похожесть" звуковых файлов

Подсчет людей в кадре

deep learning

Лекции по машинному обучению

Сборка OpenCV под Linux на ARM, ругается x264

нейросеть в opencv

Решатель уравнения Пуассона и пара примеров применения.

Решатель уравнения Пуассона и пара примеров применения.

сшивка в панораму

сшивка в панораму

сшивка в панораму

сшивка в панораму

сшивка в панораму

Навигация

Последняя активность