Перейти к содержимому
Compvision.ru
mrgloom

Caffe насколько важно вычитать среднее изображение?

Recommended Posts

Насколько важно вычитать среднее изображение для предобработки или этим можно пренебречь? Или может есть что то более продвинутое типа whitening?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Зависит от сети, если везде понатыкаешь батч нормализаций, то можно и не использовать среднее...без них мат.ожидание лучще все же занулять.

А в чем проблема нормализовать картинки? Вроде бы дешевая операция, по сравнению с расчетом тысяч сверток...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
21 minutes ago, mrgloom said:

неохота таскать отдельно mean image файл.

Можно посчитать средний пиксель по mean-файлу и таскать за собой только 3 числа (собственно для ImageNet все так и делают), +/- тоже самое получится.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Так всё таки когда мы таскаем с собой mean image, то вычитается именно mean image целиком или всё равно оно превращается в 3 числа - средний цвет пикселя по каждому каналу?

Например

https://github.com/DeepScale/SqueezeNet/blob/master/SqueezeNet_v1.0/train_val.prototxt

transform_param {
crop_size: 227
mean_value: 104
mean_value: 117
mean_value: 123

}

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
On 6/20/2016 at 11:49 AM, mrgloom said:

Так всё таки когда мы таскаем с собой mean image, то вычитается именно mean image целиком или всё равно оно превращается в 3 числа - средний цвет пикселя по каждому каналу?

Например

https://github.com/DeepScale/SqueezeNet/blob/master/SqueezeNet_v1.0/train_val.prototxt

transform_param {
crop_size: 227
mean_value: 104
mean_value: 117
mean_value: 123

}

Зависит от того, как используете...если подаете на вход mean_file, то будет вычитаться файл, в вашем примере будет вычитаться средний пиксель. По большому счету там разница не критична.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

вот еще странный код

https://github.com/BVLC/caffe/blob/master/examples/cpp_classification/classification.cpp#L144

по сути по mean image считают среднее и вычитают, а не сам mean image.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Отвечая на свой вопрос, проверил на AlexNet.

Можно вычитать среднее изображение или пиксель (разница между подходами на деле минимальна), но с вычитанием явно быстрее сходится, насчёт максимальной достижимой accuracy не проверял.

Еще из AlexNet можно спокойно убрать LRN слои.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте учётную запись или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать учётную запись

Зарегистрируйтесь для создания учётной записи. Это просто!

Зарегистрировать учётную запись

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу

×