Comments 5
Хотелось бы в статье видеть результат сравнения реализаций на CPU, CPU-multithreaded и OpenCL.
А квадратный корень почему для int считается?
Уже поправил) Сделаю сравнение работы на разных устройствах в следующей части.
Жду вторую часть, очень интересно и актуально. Интересны тесты на относительно больших объёмах данных. Хотя бы пару гигабайт чтобы вектора были. Маленькие объёмы очевидно будут быстрее на CPU, т.к. нет накладных расходов на передачу данных на GPU и обратно (я же правильно понял, что compute::vector это уже копирование в видеопамять? Или это копия в оперативной памяти и это удваивает требования к объёму оперативной памяти?). Интересно, на каких примерно объёмах вычислений GPU становится эффективнее.
Дело в том что в этой либе можно использовать так называемый хостовый вектор(в примерах из оригинальной доки они всегда используются), где будет хранится оригинал данных, но это не обязательно. Лично я использую его только чтоб использовать std::generate, но можно и переписать всё под себя для compute::vector, используя итераторы.
Смотрел я в сторону данной библиотеки пару лет назад, но остановился на чистом opencl. Вопрос то-то же, что и два года назад, что с развитием проекта, в репозитории github пару лет не обнавлялась основная кодовая база? Я конечно понимаю, что и opencl, если хочется кросплатформенности, дальше 1.2 лезть не следует, nvidia выше не поддерживает, но все-же проект развивается и даже новый стандарт вышел не так давно.
Only those users with full accounts are able to leave comments. Log in, please.