Перейти к содержимому
Compvision.ru

Smorodov

Главные администраторы
  • Количество публикаций

    3 873
  • Зарегистрирован

  • Посещение

  • Days Won

    346

Все публикации пользователя Smorodov

  1. Детектор кругов

    Ну еще всякие RANSAC бывают.http://stackoverflow.com/questions/26222525/opencv-detect-partial-circle-with-noise
  2. Детектор кругов

    Есть: http://docs.opencv.org/2.4/modules/imgproc/doc/feature_detection.html?highlight=houghcircles#houghcircles
  3. Можно посмотреть здесь: http://programming-by-demonstration.org/sourcecodes.php, здесь не напрямую конечно, но в качестве источника вдохновения может подойти.
  4. Спасибо, попробую. Насколько я понял, решателя в готовом виде там нет, но есть пример с реализацией сопряженного градиента: https://arrayfire.com/sparse-matrices-in-arrayfire-v3-4/
  5. Нелинейный Кальман, это фильтр частиц. А вообще с птицами случай сложный. Если одна птица влетела в дерево, а другая вылетела, или две ? Может тут и не нужно держать трек ? Разпознавалку птиц можно сделать по скорости изменения конфигурации объекта, то есть птица машет крыльями меняется ее силуэт, меняется он довольно часто (зависит от вида птицы конечно), можно фиксировать флюктуации яркости объекта (изменение гистограммы яркостей во времени) .
  6. Отправляю: http://docs.opencv.org/2.4/doc/tutorials/core/how_to_scan_images/how_to_scan_images.html У ас MathTemplate выдаст изображение с типом элементов float если мне не изменяет склероз. http://docs.opencv.org/trunk/d4/dc6/tutorial_py_template_matching.html см. картинки слева. И снизу, кстати есть пример поиска монеток на экране (на питоне, но смысл тот-же). Просканировали его и выбрали максимумы.
  7. Работа с float изображением

    Ну так камера-то (как и человеческий глаз кстати) видит не в пикселях и не в метрах, а в угловых единицах. Есть угол зрения камеры по вертикали и по горизонтали, если смещаетесь на какое то расстояние от оптической оси камеры, то можно найти угол, он будет пропорционален расстоянию от центра изображения. Точное значение можно посчитать если учесть угол обзора, естественно, это верно если камера откалибрована.
  8. Как думаете, что за метод ?

    Наткнулся на картунизатор, как думаете какие тут преобразования? Для нейронки слишком четко, для детектора граней слишком аккуратно, борода и волосы преобразованы грамотно. Сайт: http://itoon.net/#onlinedemo Исходное: Результат:
  9. Как думаете, что за метод ?

    Да, но стилизация штука тонкая, может глаз на лбу выскочить, или еще что, тут этого нет. Но я думаю все таки нейронка, специфически обученная.
  10. Как думаете, что за метод ?

    Хотя нет, видимо все же нейронка.
  11. Архив с проектом: HoughLines.rar
  12. Добавлю сюда, чтобы не терялось: http://cvrs.whu.edu.cn/projects/cannyLines/
  13. Работа с float изображением

    Тут горизонт не просматривается Но можно RANSAC-ом найти прямые, или тем-же Хафом, или LSD, но RANSAC скорее всего будет лучше работать. Кстати вот еще, из свежего: http://cvrs.whu.edu.cn/projects/cannyLines/
  14. Работа с float изображением

    Это проделывается с результатом сегментации. Ну если у вас есть уравнение прямой, и прямоугольник, думается не очень то сложно получить верхнюю половину и нижнюю.
  15. Работа с float изображением

    В контуре еще найти нужно правильный кусок. Можно попробовать так: применить морфологию (erode + dilate) это уберет мелкие детали, после размыть, Sobel, затем по порогу границу. Дальше собрать эти точки, и запихнуть в fitLine.
  16. Работа с float изображением

    Вероятно потому что при преобразовании во float вы делите все на 255 и переводите в интервал 0-1 ?
  17. ENet

    Я думаю, правильно будет обучить сеть заново, на полностью размеченной выборке, просто потому что она будет учитывать контекст. Можно конечно вначале запускать сегментацию небо/земля, а затем все остальное, но будет просто дольше, а результат это не факт что изменит в лучшую сторону.
  18. ENet

    Да здесь вначале разбивается на суперпиксели, затем graph cut. Ну если больше областей, тогда наверное сетка нужна, graph cut можно инициализировать результатами с сетки для уточнения границ областей, хотя это может быть тяжеловато для мобильного девайса.
  19. ENet

    Может здесь обычный graph cut пойдет, и не нужно городить сетку ?
  20. Вот нашел кусок одного проекта: import numpy as np import caffe import cv2 import scipy.io as sio caffe.set_mode_gpu() caffe.set_device(1) model = './model/det1.prototxt' weights = './model/det1.caffemodel' PNet = caffe.Net(model, weights, caffe.TEST) # create net and load weights print ("\n\n----------------------------------------") print ("------------- Network loaded -----------") print ("----------------------------------------\n") img = np.float32(cv2.imread( 'F:/ImagesForTest/test1.jpg' )) img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB) avg = np.array([127.5,127.5,127.5]) img = img - avg img = img*0.0078125; img = img.transpose((2,0,1)) img = img[None,:] # add singleton dimension PNet.blobs['data'].reshape(1,3,img.shape[2],img.shape[3]) out = PNet.forward_all( data = img ) #sh1=PNet.blobs['conv1'].data.shape #sh2=PNet.params['conv1'][0].data.shape #sh3=PNet.params['conv1'][1].data.shape #print PNet.params['PReLU1'][0].data.shape cv2.imshow('out',out['prob1'][0][1]) cv2.waitKey() Просто задаете какой блоб нужно прочитать ('prob1' в данном случае) и какой его слой.
  21. Начните с этого примера: https://github.com/BVLC/caffe/blob/master/examples/cpp_classification/classification.cpp там тоже изображения, но можно ведь просто подавать изображения с видео и классифицировать.
  22. Ну, я так полагаю что все что угодно, лишь бы в 3D массив ложилось. Там же датумы кладутся в базу, а каждый датум знает свои размеры (W,H,C). Другое дело как нейронке скармливать данные одного сета с разными размерами. Еще помнится там какая-то ерунда с выделением памяти была, что надо заранее готовить огромный кусок, (в LMDB есть константа по этому поводу) у меня база около 2GB была все поместилось. Но это уже только формирования LMDB ручками касается.
  23. Нет, там координаты. На входе картинки, на выходе координаты. Там просто две LMDB-хи в одной изображения, в дркгой координаты ландмарков, я задал блобы с плавающей точкой, поэтому можно пихать что угодно.
  24. Делал детектор ландмарков глаз, для Keras, выглядело как то так: EyeLandmarksKeras.py, я делал базу данных кофейно-совместимой, поэтому там caffe включен, думается что должно и без него работать.
×