-
Content count
28 -
Joined
-
Last visited
-
Тема хоть и прикладная но не узкая, т.к. если не использовать маркеры, нужно реализовать робастный 3D-трекинг, а это не решенная задача. Плюс, большинство систем AR пока не учитывают освещение (есть несколько статей). Не совсем понятно, что значит трехмерная реальность на базе OpenCV, задачи противоположные. С помощью зрения получают матрицу преобразования (позу), с которой работает графическая библиотека, каждый кадр. Сравнительно новый подход к AR: http://www.robots.ox.ac.uk/~gk/PTAM Ориентированный исключительно на развлечения http://www.openframeworks.cc/ (есть биндинги к opencv и artoolkit)
-
Вырезать кусок из jpeg, сделать чёрно-белым и перевести в матрицу из 1 и 0
Cfr replied to Deff's topic in OpenCV
Вроде бы CvGet2D тоже не поддерживает. Битовые изображения (и даже кодированные по длине) поддерживает библиотека http://camellia.sourceforge.net/ #include <opencv/cv.h> #include <opencv/highgui.h> #include <camellia.h> int main() { CamImage *i = (CamImage*)cvLoadImage("./1.png", CV_LOAD_IMAGE_GRAYSCALE); CamImage t; camAllocateImage(&t, i->width, i->height, CAM_DEPTH_1U); camThreshold(i, &t, 100); camSavePGM(&t, "./1.bin.pgm"); IplImage *b = cvLoadImage("./1.bin.pgm"); cvNamedWindow("thr"); cvShowImage("thr", ; cvWaitKey(0); }[/code] Хотя, не нашел как преобразовать битовое изображение в серое (кроме идиотского сохранить-загрузить) BTW, а зачем нужна битовая матрица? Чем не подходит байтовая или с числами с плавающей точкой (масштабированная к нулям и единицам)? -
Есть биндинги OpenCV к Octave (частично совместима с Matlab) и Python (тут есть NumPy, SciPy и еще куча пакетов для научных вычислений).
-
Перейти уже на нормальные средства разработки
-
Надо строить модель движения.
-
Перспективные и интересные проекты в области машинного зрения
Cfr replied to kvarg's topic in Обсуждение общих вопросов
AR --- раздел 3D-зрения, лучшими теоретическими источниками будут [1] и [2]. Ну, это чтобы полностью всё понять, на практике хватит разобраться с главами по 3D проекциям и калибровке камеры в [3] + почитаться статьи (хотя бы википедию) про способ ARToolkit [4]. Кстати, английская страница википедии вроде неплохо всё освещает [5]. Сейчас всё больше хотят перейти на AR без маркеров, для этого пробуют vSLAM (самая известная OSS-система -- monoSLAM [6]) и алгоритмы SFM (например, Bundle Adjustment, есть открытая софтинка PTAM [7]). Кстати, диссертация автора PTAM [8] содержит прекрасный обзор современного состояния AR. В сети можно найти массу туториалов и курсов, мне очень понравился [9] (отличное краткое введение в 3D трекинг) и [10]. Книги, полностью посвященные AR не смотрел. Лучше всего, если есть по-настоящему научный интерес, прочесть [1], если исключительно инженерный, поковырять ARToolkit и PTAM, хотя с последним будет сложно без науки разобраться [1] http://www.robots.ox.ac.uk/~vgg/hzbook/index.html [2] http://mitpress.mit.edu/catalog/item/defau...2&tid=10195 [3] Стокман, Шапиро ``Компьютерное Зрение'' [4] http://www.hitl.washington.edu/artoolkit/ [5] http://en.wikipedia.org/wiki/Augmented_reality [6] http://www.doc.ic.ac.uk/~ajd/Scene/download.html [7] http://www.robots.ox.ac.uk/~gk/PTAM/ [8] http://www.robots.ox.ac.uk/~gk/publication...n2006Thesis.pdf [9] http://130.203.133.121:8080/viewdoc/summar...=10.1.1.84.8498 [10] http://campar.in.tum.de/Far/AugmentedRealityIISoSe2004 -
Cfr started following Перспективные и интересные проекты в области машинного зрения
-
Как-то я запутался. Фильтр Калмана может предсказывать (экстраполировать), это одна из фаз его работы (предсказание текущего (или следующего) состояния, затем коррекция).
-
Перспективные и интересные проекты в области машинного зрения
Cfr replied to kvarg's topic in Обсуждение общих вопросов
Не понятно. Кажется, очень перспективное направление, но занимаются им все подряд, любители и коммерческие фирмы. Однако, достаточно общего решения для markerless пока не найдено. Очень много приложений на мобильниках, в рекламе и играх. Опять же, для получения опыта подходит очень хорошо. Кстати, если кто из Петербурга, скоро буду читать лекцию по AR (классический алгоритм как в ARToolkit + немного BundleAdjustment и SLAM), если интересно -- пишите в личку/cfr.ssvATgmail.com. Ну, где ж найти такую работу? Я бы с удовольствием устроился (конечно, если это не институт с <10K зарплатами). Полнофункциональную --- в каком смысле? Раньше (хотя бы 3 года назад), когда не было OpenCV и других открытых библиотек с реализациями AdaBoost, смесей гауссианов, фильтров Калмана и MCMC, было сложно. А сейчас, это даже бакалавр сделает. -
Перспективные и интересные проекты в области машинного зрения
Cfr replied to kvarg's topic in Обсуждение общих вопросов
Автоматические системы видеонаблюдения есть во всех универах даже у нас, производителей тоже море, не особо перспективная задача, хотя полезная для изучения (трекинг, обучаемые детекторы, классификация). -
Определение координат и углов пзиционировния камеры
Cfr replied to milk3d's topic in Обсуждение общих вопросов
Не знаю, как вы получили решение, но для перспективной проекции их 8 штук (4 перед камерой). Проблема прекрасно изучена и называется P3P. Чаще всего решается оптимизацией (обычно, Гаусса-Ньютона), хотя для этого желательно знать приближенное значение, иначе можно уехать в одно из трех "ненастоящих". Можно как-то выбирать из четырех аналитических. Можно воспользоваться слабо-перспективной проекцией, хотя точность не очень высока (только когда объект достаточно далеко от камеры). Вообще, P4P и старше прекрасно решаются, в OpenCV есть алгоритмы. -
Есть пара шикарных книг на английском, почти уже классика: Hartley & Zisserman http://www.robots.ox.ac.uk/~vgg/hzbook/hzbook1.html Faugeras & Luong http://www.amazon.com/Geometry-Multiple-Im...tion/0262062208 Можно своровать на гигапедии. На русском есть немного в Современном подходе, но я не стал бы её советовать. Вообще задача хорошо решена если не в реальном времени, MS уже вводят сервис типа Photo Tourism. Если покопаться, в интернете можно найти много исходников по реконструкции, например IBVH: http://people.csail.mit.edu/wojciech/
-
Стереозрение для одной камеры -- Structure from motion В частности, как заметил Smorodov, можно сдвигать камеру и определять её координаты относительно первой (например, гомографией).
-
Извините, что разрушаю идиллию, но в OpenCV полно подобного рода алгоритмов См. camshift и floodfill.