Комментарии / Профиль Des333 / Хабр

Директор по разработке ПО

Профиль Публикации 5 Комментарии 70 Закладки 1

Des333 23 сен 2014 в 22:53

Если не затруднит, не могли бы Вы написать более читаемый вариант этого блока.
Я понимаю, как это можно описать при помощи assign, но тот вариант, который приходит на ум мне, не кажется более читаемым.
Может быть, Вы имеете в виду что-то другое.

Посмотреть

Сумбурные размышления о будущем технологии FPGA

Des333 9 сен 2014 в 19:11

У меня реализация xcell.v занимает минимум 9 LUT'ов.
Не поделитесь своей? :)

Посмотреть

Сумбурные размышления о будущем технологии FPGA

Des333 9 сен 2014 в 18:42

В каком-то конкретном случае — да.
В общем случае — зависит от количества вычислительных блоков, которые удастся реализовать в ПЛИС; частоте, на которой это всё заработает; емкости ПЛИС; частоте процессора; количеству ядер; стоимости компонентов и т.д.

Не уверен, что можно реализовать эту задачу на FPGA так, чтобы по соотношению производительность/стоимость вышло выгоднее, чем на CPU. Но допускаю это.
Почти уверен, что на FPGA можно сделать реализацию с большей производительностью, чем на CPU.
Точно уверен в том, что реализация на FPGA будет интересней :)

P.S. Пора заводить хаб, посвященный FPGA :)

Посмотреть

Сумбурные размышления о будущем технологии FPGA

Des333 9 сен 2014 в 18:13

По поводу описанного проекта — совсем очевидное замечание, но всё же напишу.

Если есть задача увеличить количество клеток, то не обязательно использовать ПЛИС большей емкости.
Можно просто уменьшить количество параллельных вычислений.
В крайнем случае можно хранить всё значения в блочной памяти и использовать только один вычислительный блок, который будет последовательно вычислять все новые значения для всех клеток.

Естественно, делать все вычисления за такт станет не реально, но я не думаю, что для Вашего проекта цель — это 100 млн. обновлений в секунду.
Дальнейшее развитие мысли — обратное увеличение параллельности, с использованием N вычислительных блоков, где 1 < N << количества клеток.

Посмотреть

Сумбурные размышления о будущем технологии FPGA

Des333 9 сен 2014 в 17:09

Вы считаете, что любую функцию от 8 переменных можно реализовать при помощи трёх 4-входовых LUT'ов?

Посмотреть

Поднимаем SOC: ARM + FPGA

Des333 5 сен 2014 в 19:35

Так я же нисколько не против :)
Просто так исторически сложилось, что мы «сидим» на Altera, поэтому мне в руки попала эта платка.

Посмотреть

Поднимаем SOC: ARM + FPGA

Des333 5 сен 2014 в 14:21

Хочу пояснить, что доступ к памяти через отображение /dev/mem выбран для простоты примера.
В реальной жизни такая практика достаточно опасна и чревата ошибками.

Правильнее использовать техники типа Userspace I/O:

Спасибо nymitr за замечание.

Посмотреть

Поднимаем SOC: ARM + FPGA

Des333 5 сен 2014 в 13:56

Спасибо за тёплый прием!
Борода периодически отрастает, я её периодически сбриваю ))

Посмотреть

Поднимаем SOC: ARM + FPGA

Des333 5 сен 2014 в 13:55

Что разработчики вкладывали в название платы, точно сказать не могу — тут я только пользователь :)
Думаю, что это обозначает возможность оценить все плюсы/минусы работы с SoC такого формата.

По поводу отладки — nerudo ниже указал список того, что есть на плате.
Хочу добавить, что в таких SoC достаточно развитая система дебага и трасировки.
Кроме обычно «защелкивания» внутренностей FPGA при помощи SignalTap, в SoC одна из фич — Cross-trigger,
когда события/breakpoint'ы одного компонента могут использоваться для трассировки другого.

Сам я с этим на практике пока не работал. Но думаю, что поработаю, когда буду «разгонять» интерфейс.
Соответственно, в следующей статье упомяну.

Посмотреть

Поднимаем SOC: ARM + FPGA

Des333 5 сен 2014 в 13:34

Измерение скорости проводились с параметром COP, равным 0 (при записи) и 2 (при чтении). В этих режимах вывод в консоль не производится.

Посмотреть

1 2 3