Acx7k 0 Report post Posted October 13, 2022 Здравствуйте, пробелам следующая есть несколько нейронок по предсказанию карты глубины из монокулярного изображения, на выходе получается относительная карта глубины (т.е. если допустим на первом изображении, на сцене есть только автомобиль и поле, то у автомобиля показатель глубины 0.8, на втором снимке добавится еще один автомобиль и показатель глубины первого будет уже не условные 0.8, а 0.6), вопрос как лучше высчитывать абсолютную глубину в таких случаях, когда есть несколько фото одной сцены с некоторыми изменениями или это может быть вообще видео. Пример нейронок: https://github.com/nianticlabs/monodepth2 https://github.com/zhyever/Monocular-Depth-Estimation-Toolbox Share this post Link to post Share on other sites
Smorodov 578 Report post Posted October 16, 2022 А зачем карту глубины? Если надо найти координату на дороге, или скорость, то дорога плоская, координата и направление камеры известны. Точнее получится просто использовать 2D рамку. 3D генерируемые координаты, от монокулярных сеток, весьма приблизительные, вычисления тяжелые. Ну если очень надо, можно использовать 3D на основе оптического потока, думаю оно точнее будет. Ну если очень-очень хочется нейронкой, просто вычисляйте скользящее среднее по кадрам глубины, и используйте его, там конечно нужна будет коррекция с учетом скорости удаления/приближения, но это вроде должно аналитически выводиться аналитически. Share this post Link to post Share on other sites