-
Количество публикаций
3 873 -
Зарегистрирован
-
Посещение
-
Days Won
346
Все публикации пользователя Smorodov
-
Хорошая статейка по обучению с подкреплением: Deep Learning in a Nutshell: Reinforcement Learning
-
- обучение с подкреплением
- reinforcement learning
- (и ещё %d)
-
WaveNet - генеративная модель звука от DeepMind: https://deepmind.com/blog/wavenet-generative-model-raw-audio/
-
- deepmind
- deep learning
- (и ещё %d)
-
Как адаптировать сеть под другой размер изображения?
Smorodov replied to mrgloom's topic in Вопросы по нейросетям и ИИ
Ну тут если поменять размер входного слоя, то неизбежно меняется количество связей, а они извлекают первичные фичи. Соответственно, думается, что надо как-то масштабировать и фильтры следующего/следующих слоя/слоев, в соответствии с изменение масштаба изображения, чтобы набор откликов сохранился. Вероятно масштабирование здесь нужно умное, типа какого нибудь pool-а. И еще скорее всего сеть будет хорошо работать только на нескольких фиксированных масштабах, т.к. масштабировать маленькие фичи плавно не получится. Может быть можно часть фич масштабировать, ввести переходный слой-адаптер, заморозить все слои кроме переходного и обучить уже его. -
ДУмается может Вам репозоторий соорудить на GitHub, думается народ потянется, может кто чего добавит или улучшит.
-
Да, я думаю актуален, народ частенько спрашивает об интеграции OpenCV и Builder. Думаю подавляющее большинство отчаялось
-
Интерактивная демка ROC кривой: http://arogozhnikov.github.io/2015/10/05/roc-curve.html
-
Caffe обучение на С++ в обход создания базы
Smorodov replied to mrgloom's topic in Вопросы по нейросетям и ИИ
Ну так то да, умеет. Ну тогда все должно быть не сложно: Заправил бэтч данных -> net.backward() -> net.update(lr=0.1) -
Потестил в линуксе, работает как положено. Я собирал OpenCV сам, все стандартно: git clone -> cmake -> make -> sudo make install.
-
cmake_minimum_required(VERSION 2.8) set (PROJ_NAME RectangleFinder) project(${PROJ_NAME}) set(CMAKE_BINARY_DIR ${CMAKE_SOURCE_DIR}/build) set(EXECUTABLE_OUTPUT_PATH ${CMAKE_BINARY_DIR}) set(LIBRARY_OUTPUT_PATH ${CMAKE_BINARY_DIR}) FIND_PACKAGE(OpenCV) set(folder_source main.cpp ) set(folder_header ) SOURCE_GROUP("Source Files" FILES ${folder_source}) SOURCE_GROUP("Header Files" FILES ${folder_header}) ADD_EXECUTABLE(${PROJ_NAME} ${folder_source} ${folder_header}) TARGET_LINK_LIBRARIES(${PROJ_NAME} ${OpenCV_LIBS} ) Я такой юзаю для быстрого создания проектов под VS.
-
Caffe обучение на С++ в обход создания базы
Smorodov replied to mrgloom's topic in Вопросы по нейросетям и ИИ
Может проще CNTK или TensorFlow использовать в таком случае? С caffe это как то трансректально выходит. Хотя, есть еще версия с динамическими слоями, там вроде как и пример, правда на питоне, есть: http://apollocaffe.com/ -
Прикупил еще один GPU, gtx1070 и столкнулся со странным поведением DIGITS. Обе карты обе карты видятся на обеих все запускается без ошибок драйвер 367-й, cuda 8.0, cudnn-v5, ubuntu 14.04 LTS. Но на одной сеть учится, на другой нет. На gtx970 На gtx1070 Кто нибудь сталкивался с подобным ? UPD: Перестроил caffe со включенным NCCL вроде теперь учится. Но странно все это...
-
Ну тогда если только оптимизировать Ваши алгоритмы под распараллеливание. Но сдается мне что сильно не ускорится. Если процы не на 100% загружены. Интенсивная работа с диском может тоже быть источником тормозов.
- 8 replies
-
- opencv 2.4
- tbb
-
(и ещё %d)
Теги:
-
А в опциях компилятора OpenMP разрешен ?
- 8 replies
-
- opencv 2.4
- tbb
-
(и ещё %d)
Теги:
-
Error 95 error LNK1181: cannot open input file '..\..\lib\Release\opencv_calib3d2411.lib' Это явно не первая ошибка в списке. А вообще, включите OpenMP и хватит, можете его еще использовать в своей программе, это довольно просто, и может дать больший прирост производительности, так как функции OpenCV и так достаточно хорошо оптимизированы. Помнится там конфликт был между TBB и OpenMP, они по сути, одно и то же делают.
- 8 replies
-
- opencv 2.4
- tbb
-
(и ещё %d)
Теги:
-
Там, вероятно определен тип для работы с числами с плавающей точкой, что то типа RealNumber. И в разных вариантах он разный. Float хватает для большинства случаев.
-
Интересные статьи и код на матлабе (на opencv перевести дело пары часов): http://perception.csl.illinois.edu/matrix-rank/tilt.html Запускаемые файлы hello_*.m. Здесь лекция на англ. http://videolectures.net/mlss2011_candes_lowrank/
-
TILT: Transform Invariant Low-rank Textures (Must know!)
Smorodov replied to Smorodov's topic in OpenCV
Я уж точно не помню что и почему там делал. С вырезанием картинок там вообще какая то заморочка была, так тогда и не нашел проблему. -
В opencv contrib появился DPM детектор есть модели в каком то своем формате, opencv_extras модельки и тулза для конверта.
- 2 replies
-
- deformable parts based
- dpm
- (и ещё %d)
-
Расчет accuracy обученной модели
Smorodov replied to maxfashko's topic in Вопросы по нейросетям и ИИ
Не, на расчет точности никак не влияет. -
Супер
-
Расчет accuracy обученной модели
Smorodov replied to maxfashko's topic in Вопросы по нейросетям и ИИ
Вроде все верно, да и по картинками похоже. Верных пикселей фона и объекта много больше чем ошибочных. Чистый фон еще может смещение давать, если там все тривиально, для чистоты эксперимента нужен реальный фон, который будет при работе программы, какой использован у вас я не знаю. -
Расчет accuracy обученной модели
Smorodov replied to maxfashko's topic in Вопросы по нейросетям и ИИ
TP - true positives - элементы классифицированные как объект и являющиеся объектом. FP - false positives - элементы классифицированные как объект, но не являющиеся им. TN - true negatives - элементы классифицированные как не объект и не являющиеся им. FN - false negatives - элементы классифицированные как не объект, но являющиеся им. P (positives) - все элементы, классифицированные как объект . N - (negatives) все элементы, классифицированные как не объект. -
Расчет accuracy обученной модели
Smorodov replied to maxfashko's topic in Вопросы по нейросетям и ИИ
Начать можно отсюда: https://en.wikipedia.org/wiki/F1_score И это пригодится: https://en.wikipedia.org/wiki/Precision_and_recall Именно accuracy=(TP+TN)/(P+N), но это не самая объективная метрика. -
Да, там все в одном файле, остальные проекты служебные. Сишных команд там мало, в основном OpenCV-шные, которые в шарповской обертке, по идее, не должны сильно отличаться.
-
Набросал средствами OpenCV. Пришлось переименовать русские подпапки, но вроде учится, проверять лень, но по цифрам похоже. SimpleOCR_NN.rar