Перейти к содержимому
Compvision.ru

Smorodov

Главные администраторы
  • Количество публикаций

    3 873
  • Зарегистрирован

  • Посещение

  • Days Won

    346

Все публикации пользователя Smorodov

  1. Хорошая статейка по обучению с подкреплением: Deep Learning in a Nutshell: Reinforcement Learning
  2. WaveNet - генеративная модель звука от DeepMind: https://deepmind.com/blog/wavenet-generative-model-raw-audio/
  3. Ну тут если поменять размер входного слоя, то неизбежно меняется количество связей, а они извлекают первичные фичи. Соответственно, думается, что надо как-то масштабировать и фильтры следующего/следующих слоя/слоев, в соответствии с изменение масштаба изображения, чтобы набор откликов сохранился. Вероятно масштабирование здесь нужно умное, типа какого нибудь pool-а. И еще скорее всего сеть будет хорошо работать только на нескольких фиксированных масштабах, т.к. масштабировать маленькие фичи плавно не получится. Может быть можно часть фич масштабировать, ввести переходный слой-адаптер, заморозить все слои кроме переходного и обучить уже его.
  4. Как прикрутить OpenCV к билдеру?

    ДУмается может Вам репозоторий соорудить на GitHub, думается народ потянется, может кто чего добавит или улучшит.
  5. Как прикрутить OpenCV к билдеру?

    Да, я думаю актуален, народ частенько спрашивает об интеграции OpenCV и Builder. Думаю подавляющее большинство отчаялось
  6. Интерактивная демка ROC кривой: http://arogozhnikov.github.io/2015/10/05/roc-curve.html
  7. Ну так то да, умеет. Ну тогда все должно быть не сложно: Заправил бэтч данных -> net.backward() -> net.update(lr=0.1)
  8. Потестил в линуксе, работает как положено. Я собирал OpenCV сам, все стандартно: git clone -> cmake -> make -> sudo make install.
  9. cmake_minimum_required(VERSION 2.8) set (PROJ_NAME RectangleFinder) project(${PROJ_NAME}) set(CMAKE_BINARY_DIR ${CMAKE_SOURCE_DIR}/build) set(EXECUTABLE_OUTPUT_PATH ${CMAKE_BINARY_DIR}) set(LIBRARY_OUTPUT_PATH ${CMAKE_BINARY_DIR}) FIND_PACKAGE(OpenCV) set(folder_source main.cpp ) set(folder_header ) SOURCE_GROUP("Source Files" FILES ${folder_source}) SOURCE_GROUP("Header Files" FILES ${folder_header}) ADD_EXECUTABLE(${PROJ_NAME} ${folder_source} ${folder_header}) TARGET_LINK_LIBRARIES(${PROJ_NAME} ${OpenCV_LIBS} ) Я такой юзаю для быстрого создания проектов под VS.
  10. Может проще CNTK или TensorFlow использовать в таком случае? С caffe это как то трансректально выходит. Хотя, есть еще версия с динамическими слоями, там вроде как и пример, правда на питоне, есть: http://apollocaffe.com/
  11. Прикупил еще один GPU, gtx1070 и столкнулся со странным поведением DIGITS. Обе карты обе карты видятся на обеих все запускается без ошибок драйвер 367-й, cuda 8.0, cudnn-v5, ubuntu 14.04 LTS. Но на одной сеть учится, на другой нет. На gtx970 На gtx1070 Кто нибудь сталкивался с подобным ? UPD: Перестроил caffe со включенным NCCL вроде теперь учится. Но странно все это...
  12. Сборка OpenCV 2.4

    Ну тогда если только оптимизировать Ваши алгоритмы под распараллеливание. Но сдается мне что сильно не ускорится. Если процы не на 100% загружены. Интенсивная работа с диском может тоже быть источником тормозов.
  13. Сборка OpenCV 2.4

    А в опциях компилятора OpenMP разрешен ?
  14. Сборка OpenCV 2.4

    Error 95 error LNK1181: cannot open input file '..\..\lib\Release\opencv_calib3d2411.lib' Это явно не первая ошибка в списке. А вообще, включите OpenMP и хватит, можете его еще использовать в своей программе, это довольно просто, и может дать больший прирост производительности, так как функции OpenCV и так достаточно хорошо оптимизированы. Помнится там конфликт был между TBB и OpenMP, они по сути, одно и то же делают.
  15. Там, вероятно определен тип для работы с числами с плавающей точкой, что то типа RealNumber. И в разных вариантах он разный. Float хватает для большинства случаев.
  16. Интересные статьи и код на матлабе (на opencv перевести дело пары часов): http://perception.csl.illinois.edu/matrix-rank/tilt.html Запускаемые файлы hello_*.m. Здесь лекция на англ. http://videolectures.net/mlss2011_candes_lowrank/
  17. TILT: Transform Invariant Low-rank Textures (Must know!)

    Я уж точно не помню что и почему там делал. С вырезанием картинок там вообще какая то заморочка была, так тогда и не нашел проблему.
  18. DPM детектор (deformable parts based)

    В opencv contrib появился DPM детектор есть модели в каком то своем формате, opencv_extras модельки и тулза для конверта.
  19. Не, на расчет точности никак не влияет.
  20. Вроде все верно, да и по картинками похоже. Верных пикселей фона и объекта много больше чем ошибочных. Чистый фон еще может смещение давать, если там все тривиально, для чистоты эксперимента нужен реальный фон, который будет при работе программы, какой использован у вас я не знаю.
  21. TP - true positives - элементы классифицированные как объект и являющиеся объектом. FP - false positives - элементы классифицированные как объект, но не являющиеся им. TN - true negatives - элементы классифицированные как не объект и не являющиеся им. FN - false negatives - элементы классифицированные как не объект, но являющиеся им. P (positives) - все элементы, классифицированные как объект . N - (negatives) все элементы, классифицированные как не объект.
  22. Начать можно отсюда: https://en.wikipedia.org/wiki/F1_score И это пригодится: https://en.wikipedia.org/wiki/Precision_and_recall Именно accuracy=(TP+TN)/(P+N), но это не самая объективная метрика.
  23. Да, там все в одном файле, остальные проекты служебные. Сишных команд там мало, в основном OpenCV-шные, которые в шарповской обертке, по идее, не должны сильно отличаться.
  24. Набросал средствами OpenCV. Пришлось переименовать русские подпапки, но вроде учится, проверять лень, но по цифрам похоже. SimpleOCR_NN.rar
×