Search the Community
Showing results for tags 'rnn'.
Found 2 results
-
Всем привет, А может кто-то сталкивался с исчерпывающим описанием процесса обучения рекурентных сетей (конкретно интересует обучение LSTM'а)? Собственно имеются два вопроса по этому поводу: 1) PBTT подразумевает, что ошибка считается в виде суммы ошибок для всей цепочки LSTM'ов, и не понятно, откуда брать эталонный выход для промежуточных моментов времени, или все таки процесс тренировки там подразумевает, что в момент обуения мы полностью контролируем клеточное состояние в каждый момент времени? 2) Кто-нибудь расписывал руками производные для LSTM'а? А то chain rule расписывать там как-то совсем не радостно.
-
На днях был опубликован отладчик к библиотеке TensorFlow. Штука, по моему, довольно интересная например тем, что позволяет пошагово выполнять графы и на ходу визуализировать внутренности сеток. https://github.com/ericjang/tdb
-
- deep learning
- cnn
-
(and 1 more)
Tagged with: