допустим есть сервис How-Old.net который определяет возраст по картинке, и есть пользовательский инпут, который может быть очень шумный, т.е.
на одну и ту же картинку разные пользователи могут дать разный ответ 30,32,34 и т.д., а кто то может пошутить и засабмитить 66.
так вот допустим у нас есть небольшая выборка по которой мы изначально обучили нашу модель, но она предиктит довольно плохо и мы хотим улучшить наши результаты используя такие вот шумные данные, т.е. дообучить нашу изначальную модель.
Как это можно сделать?
----
из того что нашел
Training Deep Neural Networks on Noisy Labels with Bootstrapping
http://arxiv.org/pdf/1412.6596v3.pdf
On the Robustness of ConvNets to Training on Noisy Labels
http://web.stanford.edu/~dzpenner/math/CNN.pdf