Доска почета

  1. Smorodov

    Smorodov

    Главные администраторы


    • Кнопка "Нравится"

      8

    • Количество публикаций

      3 537


  2. mrgloom

    mrgloom

    Пользователи


    • Кнопка "Нравится"

      6

    • Количество публикаций

      2 168


  3. BeS

    BeS

    Пользователи


    • Кнопка "Нравится"

      4

    • Количество публикаций

      332


  4. maxfashko

    maxfashko

    Пользователи


    • Кнопка "Нравится"

      3

    • Количество публикаций

      69



Popular Content

Showing most liked content since 27.02.2017 во всех областях

  1. 2 likes
    Нашел хорошую либу (CPU) (headers only), здесь пишут что быстрее NPP-шной реализации. Взять можно здесь: http://www.gridcut.com/downloads.php . Бесплатна для некоммерческого использования. Проверил, примеры собираются без танцев, есть мультилейбл:
  2. 2 likes
    Добрый день. Наткнулся на интересный тренажер для БПЛА. Кто-то уже пробовал? https://github.com/Microsoft/AirSim По поводу генерирования датасета говориться следующее: С виду этот LogViewer не имеет ничего полезного для автоматического аннотирования сцены. И вообще не понятно, возможно ли вытащить аннотированые изображения из тренажера.
  3. 2 likes
    Нарушил многолетнее молчание и зафигачил новый пост на Хабру про последние достижения науки и техники в области Feature Matching'а: https://habrahabr.ru/post/323688/ Т.ч. кому интересна тема, вэлкам) Критика, пожелания, замечания приветствуются!
  4. 1 like
    Каждые N итераций, прогоняется тестовая выборка. Да вроде задается в solver.prototxt, но точно не скажу, давно не запускал caffe из командной строки. Обучал с основном через DIGITS.
  5. 1 like
    Просто оставлю это здесь, может конечно повторюсь, но все же. http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
  6. 1 like
    Еще одна сетка из последних (Mask R-CNN): https://arxiv.org/pdf/1703.06870.pdf Из поста google группы: "Facebook can do image segmentation which is essentially the ground truth now, using Mask R-CNN. And they can do it at 5 fps with code not optimised for speed. " Without tricks, Mask R-CNN outperforms all existing, single-model entries on every (COCO) task, including the COCO 2016 challenge winners."" Обещают исходники выложить.
  7. 1 like
    По сжатию: accuracy тоже падает? вот кстати такая штука от NVIDIA наверно тоже сжимает\квантизирует. https://developer.nvidia.com/tensorrt
  8. 1 like
    Переход на малобитную арифметику https://petewarden.com/2016/05/03/how-to-quantize-neural-networks-with-tensorflow/ Да хоть те же пресловутые GAN'ы...никто их не делает на caffe, т.к. извращение это...да и object detection там делается из кучи костылей...
  9. 1 like
    На любой чих вам придётся писать свой loss или свой layer и надо подумать на чем вы это сможете сделать. Тут есть неплохое сравнение http://cs231n.stanford.edu/slides/2016/winter1516_lecture12.pdf Caffe не нравится тем ,что python api без нормальной документации. Куча библиотек-зависимостей не весело деплоить и интегрировать в С++ проект. Не удобно править prototxt (6к строк для ResNet), можно дефайнить сеть в питоне только через дурацкие трюки. Так же говорят что в Caffe свертка не оптимальна по памяти. https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo Кто то сравнивал какой нибудь AlexNet на Caffe/Tensorflow по скорости? Тут не очень понятно т.к. есть только Caffe(native) https://github.com/soumith/convnet-benchmarks Мои результаты: https://github.com/mrgloom/kaggle-dogs-vs-cats-solution P.s. можете порыться тут https://github.com/mrgloom/Semantic-Segmentation-Evaluation
  10. 1 like
    Словами не передать, какие боль и страдания я испытвал каждый раз, сталкиваясь с этим фрейморком Серьезно, может он и был когда-то крут потому, что альтернатив особо не было, но при живом tensorflow/theano/caffe он нафиг не сдался. Куча каких-то сторонних модулей, раскиданых по всему github'у, полувымершее комьюнити...хз зачемим пользовться в 2017 году...pytorch еще может быть, но не чистый torch. Ну Lua ведь и задумывался как портабельный скриптовый язык...т.ч. в C/C++ код должен интегрироваться из коробки. Там вроде бы никакой магии нету в ENet, и все должно легко переписываться на любой уютненький фреймворк.
  11. 1 like
    http://simd.sourceforge.net/help/group__simd__overview.html Можете сравнить свой asm код с этой simd реализацией. По sobel: http://simd.sourceforge.net/help/group__sobel__filter.html
  12. 1 like
    С детектором движения всё намного сложнее. Вон в последней коллекции PETS2017 надо детектировать катера на воде. А там волны! Я говорю не о детекторе движения, а о детекторе объектов, не обязательно его делать на видео, можно на изображении. Если использовать суперпиксели, то можно делать детектор с шагом в суперпиксель. И размер объекта подбирать кратным суперпикселям. А обычно рамку сдвигают по одному пикселю, что очень медленно. В качестве примера прикрепил статью по поиску автомобилей на снимке. Возьмём другой пример: сегментацию на небо, здания, зелень, дорога. Типичная задача для камер, установленных в машине (навигация, приложения типа iOnRoad, всевозможная помощь водителю). Можно проводить сегментацию как в вашем примере, деля кадр на куски разного размера и формы. А дальше что? Как узнать, к чему относится тот или иной сегмент? Как обучить ту же нейросеть классифицировать сегменты по указанным выше типам? Я не знаю. Чаще всего нейросети подают кадр целиком и она классифицирует, можно сказать, попиксельно. Что накладно. А можно научить классифицировать суперпиксели. Это снизит размерность задачи в разы с одной стороны. А с другой повысится точность за счёт того, что границы суперпикселей часто совпадают с границами областей. Вот и применение, вот и постобработка. jiang2015.pdf
  13. 1 like
    Думается там просто отсечение по глубине для аннотации или цветовой палитры на все не хватает. Не вижу объективных проблем рендерить аннотацию.
  14. 1 like
    Так в итоге у нас всё равно скользящее окно? или мы ищем локальные максимумы типа http://stackoverflow.com/questions/3684484/peak-detection-in-a-2d-array Только у нас в 3D.
  15. 1 like
    VOTR имеет скрипт на питоне, правда там для трекинга одной цели, как я понимаю. Вот для нескольких целей: https://github.com/glisanti/CLEAR-MOT И чедендж: https://motchallenge.net
  16. 1 like
    Посмотрев на результат обработки дельфина пришел к выводу, что результаты работы примитивного градиентного фильтра типа Соболя. Обработал моей программой исходное изображение фильтром Соболя, результаты выкладываю: Исходное изображение Результат фильтра Соболя Дальше можно пропустить через пороговый фильтр, линии заменить одной толщиной по алгоритму Канни и получим результат французских ученных, ну если еще линии заменить синим цветом. del.svg - результат в .svg. Сегментация моей программой. Можно рассмотреть CoralDraw предварительно разгруппировав. Море (верхняя часть) выделяется одним большим сегментом, дельфин состоит из небольшого количества сегментов. Нужна вторая часть программы, которая бы комбинировала эти сегменты и сравнивала с базой данных, для автоматического определения объекта. Нужна информация именно на этот предмет. Суперпиксели, они не столько сжимают информацию, как моя программа и что с ними делать после их получения?
  17. 1 like
    Я говорил что метод тяжелый . У меня вообще прямолинейный реализован, тупо решает систему уравнений как есть. Есть разные оптимизации, но почти все будут требовать много ресурсов . Вот список: http://www.alphamatting.com/eval_25.php Все равно на CUDA будет лучше. Еще можете попробовать robust matting: main.cpp но он тоже не быстрый 8 сек для 500x500 на Core i-7-4790. Кстати, на нейронке тоже есть (и датасет автор обещает выслать ): http://www.cse.cuhk.edu.hk/leojia/projects/automatting/index.html
  18. 1 like
    Ну если так, то остается еще GabCut и Matting оба метода тяжелые, но часто дают неплохой результат. При крепил результат Matting, на входе trimap и изображение, на выходе маска. Тут правда и обычный порог хорошо справится, но другие пример искать долго А вот, кстати нашел: Есть довольно быстрые методы маттинга, в сети видел такие, но реалтайм не встречал, везде секунды и больше на кадр.
  19. 1 like
    Хм, мне тут сказали, что forward pass блокирует GPU (где найти подтверждение или опровержение?), т.е. второй поток будет ждать пока первый поток не сделает forward pass, но даже в таком случае выгода по идее есть, т.к. мы пока 1 поток работает загрузили батч со второго на GPU. А вот кстати по теме: https://habrahabr.ru/post/307140/
  20. 1 like
    Что то я сомневаюсь, что это невозможно на CPU, другой вопрос, что скорее это просто сделать скопировав сеть(но плохо по памяти), а если не копировать, то скорее всего что то надо лочить. А так самый простой вариант это отправлять на сеть изображения пачками(батчами), что на CPU, что на GPU, но тут есть вопрос про подгрузку данных, по идее этим должен заниматься 1 процесс в бэкграунде. Тут у меня есть код на питоне: https://github.com/mrgloom/kaggle-dogs-vs-cats-solution/blob/master/create_kaggle_submission_probability.py#L74 Но проблема в том, что я не заметил ускорения при процессинге батчами (возможно из-за вышеописанной проблемы про подгрузку в бэкграунде).