Перейти к содержимому
Compvision.ru

Recommended Posts

тестировав этот пример на pycuda, наблюдается рост погрешности с ростом размера матрицы(что теоретически логично, т.к. складывается большее кол-во float'ов)

т.е. np.allclose(c_cpu, c_gpu.get()) выдаёт false.

хотя я не понял это ограничение

40 # define the (square) matrix size

41 # note that we'll only use *one* block of threads here

42 # as a consequence this number (squared) can't exceed max_threads,

43 # see http://documen.tician.de/pycuda/util.html#pycuda.tools.DeviceData

44 # for more information on how to get this number for your device

45 MATRIX_SIZE = 2

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте учётную запись или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать учётную запись

Зарегистрируйтесь для создания учётной записи. Это просто!

Зарегистрировать учётную запись

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу

×