amartology Jan 14 2020 at 10:24

Краткая история космических микропроцессоров, часть первая

29 min

40K

Circuit design*Manufacture and development of electronics*Popular scienceCPUAstronautics

+111

Comments 47

Pyhesty Jan 14 2020 at 12:43

Автор, ждем продолжения! ;)

towin Jan 14 2020 at 14:19

Статья с ценами на такие чипы

amartology Jan 14 2020 at 14:21

Цены похожи на правду, зато посыл «Let's take a look at the Rolls-Royce in the chip industry.» — не очень. Оно скорее БелАЗы, чем Роллс-Ройсы)

sintech Jan 15 2020 at 00:11

Иногда можно и за ~150$ купить: zx-pk.com/forum/viewtopic.php?f=4&t=15313

NetBUG Jan 14 2020 at 14:30

… сбой в ней возможен только при одновременном попадании в два инвертора, которое относительно легко предотвратить
Вероятно, не «предотвратить», а «снизить до минимума вероятность»

amartology Jan 14 2020 at 14:37

Тогда уже просто «снизить вероятность», потому что «минимум вероятности» — штука весьма эфемерная) Но в практическом смысле там именно что «предотвратить». Впрочем, это на самом деле не так важно, потому что справедливо только для режима хранения данных, а в режимах записи и чтения DICE-ячейка намного более уязвима.

sintech Jan 14 2020 at 19:52

Почему для радиационно стойких процессоров используют специальный сокет Rad-pak? Чем плохи обычные?

towin Jan 14 2020 at 20:04

Видимо этот корпус состоит из дополнительного экрана, поглощающего частично излучение. Внутри могут быть разные компоненты.

amartology Jan 14 2020 at 20:06

О, это тема ~~многолетних срачей~~ большого количества споров. Даже не знаю, с чего начать.
1) На фото не Rad-pak, а просто металлокерамический корпус. Rad-pak — это когда стенки и крышка корпуса сделаны в виде пирога из тяжелых металлов для снижения полной поглощенной дозы внутри корпуса (при этом обычно становится хуже с одиночными сбоями).
2) Сейчас микросхемы в обычных пластиковых корпусах вполне себе летают. В том числе со специально разработанными радстойкими чипами внутри.
3) Изначально смысл металлокерамики в том, что она надежнее. Например, в объеме пластика есть (и в процессе хранения набирается еще) вода, которая при термоциклировании с переходами через ноль по Цельсию имеет обыкновение разрушать корпус. Также старые пластики выделяют газ, что неприемлемо для ряда применений. А для BGA корпусов вместо шариков приходится делать пружинки, чтобы пройти тесты на вибростойкость.
4) Есть еще заморочки с несовместимостью современных пластиковых корпусов со свинцовым припоем, а бессвинцового припоя — с вакуумом. И так далее и тому подобное.

sintech Jan 15 2020 at 00:02

Спасибо за ответ, про корпуса в принципе понятно (Rad-pak это ведь больше именно про корпус?), но меня заинтересовал именно способ крепления. Зачем делают такую позолоченную квадратную рамку с дополнительными пластинами керамики на выводах? Эти выводы потом паяются на плату, или зажимаются в ответный разъем?

amartology Jan 15 2020 at 00:33

Вот такая штука впаивается на отладочную плату, а в нее вставляются чипы по очереди для тестов. После тестов у годных чипов рамка отрезается, и дальше они нормально впаиваются в «боевые» платы. Или рамка, если она полностью металлическая (и воротит все ноги между собой), нужна для защиты от электростатики при транспортировке, и срезается перед тестами (на рисунке сверху виден чип в контактирующем устройстве).

vau Jan 16 2020 at 22:46

4) Есть еще заморочки с несовместимостью современных пластиковых корпусов со свинцовым припоем

Вот это поворот. Подскажите, а где об этом можно почитать более подробно?

amartology Jan 16 2020 at 23:04

Например вот тут можно посмотреть на нюансы, возникающие при пайке свинцовым припоем BGA с бессвинцовыми шариками и то, что некоторые стандарты предполагают реболлинг таких корпусов перед применением.

vau Jan 17 2020 at 10:54

Спасибо, с этой публикацией я знаком. Видимо я воспринял Ваш комментарий уж слишком буквально.

VovanZ Jan 14 2020 at 21:09

Простите за глупый вопрос, но что мешает взять обычный процессор и засунуть его в свинцовую коробку?

amartology Jan 14 2020 at 21:22

Во-первых, свинцовая коробка — это очень тяжело, а значит, слишком дорого выводить на орбиту.
Во-вторых, защита из тяжёлых элементов, улучшая стойкость к полной дозе, может ухудшать показатели по одиночным сбоям, потому что атомы свинца могут вступать в ядерные реакции с прилетающими протонами и рождать вторичное излучение.
В-третьих, кроме радиационной стойкости у космических чипов другой температурный диапазон, другие требования к надёжности, к гарантиям долгосрочного производства и т.д. и т.п. Радиация — только вишенка на торте.

А вопрос не глупый ни разу. Нормальный и, более того, очень правильный вопрос. При проектировании спутников учитывается, сколько защиты даёт каждому конкретному чипу окружающая конструкция и, при необходимости, где-то стенки делаются толще или производится перекомпоновка, и даже пластинки из свинца бывают. Но это все только полной дозы касается, а основная проблема сейчас обычно не в ней.

gremlin244 Jan 16 2020 at 15:11

А у меня другой глупый вопрос. Если у старых процессоров нет таких проблем с одиночными сбоями, почему не накидать на аппарат дофига их. То есть грубо говоря брать количеством, а не качеством. Все же процессоры не как гантели весят. Хотя тут скорее уже к объему вопросы…

amartology Jan 16 2020 at 15:23

Во-первых, производительность многопроцессорной системы с ростом количества чипов растет гораздо слабее, чем линейно.
Во-вторых, на тысячу старых процессоров вместо одного нового надо в тысячу раз больше электричества.
В-третьих, в таких количествах старые процессоры весят таки как гантели. Старые БЦВМ легко весили по 100-200 кг при производительности на пару порядков меньше нынешних пятикилограммовых.

towin Jan 14 2020 at 21:33

А если электроника выключена, она тоже страдает от накопления дозы?
Нельзя ли положить на борт несколько запасных компьютеров и включать их по мере радиационного износа работающих?

amartology Jan 14 2020 at 21:38

Есть микросхемы, которые в выключенном состоянии страдают от полной дозы сильнее, чем во включенном.)
Зависимость дозовой деградации от электрического режима есть, но в выключенном состоянии доза все равно набирается. В принципе, отключение и нагрев могут дать какой-то полезный эффект, но брать на борт запасные компьютеры и не париться не выйдет, и это даже без учёта стоимости вывода дополнительной массы на орбиту.

hhba Jan 14 2020 at 22:53

Да, меня идея annealing-а на борту КА резервных комплектов (чего-либо, не только CPU) всегда интересовала. А если еще и УФ-источником определенной энергии обрабатывать, то наверное вообще шикарно жить можно (по крайней мере для некоторых марок флинтов это работает).

Buhram Jan 24 2020 at 01:20

А возможен ли отжиг отключенной микросхемы на борту КА? РИТЭГ ведь много тепла выделяет. По идее, если нагреть до температуры, при которой еще на начинается заметная диффузия примесей, можно будет «обнулить» накопленный в диэлектрике заряд.

amartology Jan 24 2020 at 09:56

Теоретически — да. На практике я его не видел, но это вполне может быть, что это только я не видел, а системщики в курсе) Но наверняка как минимум есть нюансы, потому что с моей колокольни такое решение выглядит сложно реализуемым.
Базовые соображения такие:
1) При температурах, «когда ещё нет диффузии примесей» у вас уже распаяется плата.
2) На самом деле отжиг очень ускоряется уже в диапазоне 85-125 градусов.
3) Но нагрев в сочетании с подачей питания — это ускоренное старение микросхемы. Собственно, испытания на него так и делают. Поэтому нагреватели должны быть полностью отключаемыми.
4) Если и делать что-то такое, то разумеется, это должны быть не теплопроводы, а нагревательные резисторы в нужных местах. Греют же на спутниках аккумуляторы, в конце концов. Хотя может я чего-то не знаю, и можно сделать компактные отключаемые теплопроводы. И поставить на спутник РИТЭГ, которого там обычно нет)
5) Как нагреть одну конкретную микросхему и не нагреть все остальное? Делать намного больше расстояния между элементами на плате? Более того, если греть на протяжении суток и недель, то во-первых, никакого электричества не хватит, а во-вторых, нагреется равномерно если не весь аппарат, то весь блок, в котором стоит нагреваемый девайс.
6) Отвод избыточного тепла в космосе — это довольно сложная штука, которую тоже придется решать.
7) Я смог найти историю о том, что у Galileo в 2003 году подачей постоянного напряжения грели светодиоды внутри сломавшегося плёночного магнитофона, на который были записаны данные, чтобы отмотать пленку назад и перечитать часть информации.

nerudo Jan 14 2020 at 22:44

А какова вообще будет интенсивность сбоев обычных незащищенных микросхем в открытом космосе? Ну то есть взяли айфон и полетели на марс — как часто будут случаться одиночные сбои и когда он совсем превратится в тыкву?

amartology Jan 14 2020 at 22:54

Десятки сбоев на мегабит в день (в Айфоне будет намного больше, там технология новее, чем у чипа на картинке). Плюс с какой-то разумной вероятностью произойдет катастрофический отказ (тиристорный эффект) — в произвольное время, эффект вероятностный.
По дозе стойкость разных микросхем внутри айфона может на три-четыре порядка различаться, какой-то из чипов наверняка не долетит.

nerudo Jan 14 2020 at 23:11

Я это к чему — может быть не стоит гнаться за высокой производительностью спец.компьютеров? Оставить все критические задачи управления, связь и т.п. на компьютере из 90гг, а данные обсчитывать (фото там пожать для передачи или еще чего) на обычном процессоре, запертом для солидности в свинцовую коробочку. Вычислять неколько раз, проверяя, что результаты сходятся.

amartology Jan 14 2020 at 23:17

Свинцовая коробка не помогает от одиночных отказов и стоит (на орбите( дороже, чем специальный процессор. Но вы полностью правы идейно: сейчас вскидкт к разделению на особо стойкие супервизоры и все остальное попроще и подешевле. Особенно в миссиях, где запускается не один уникальный аппарат, а группировка, в которой допустимы отказы.

hhba Jan 14 2020 at 23:20

И именно в этой идеологии делается HPSC, уже на уровне чиплета (ну и добавляем сюда потенциально бесконечное число оных).

hhba Jan 14 2020 at 22:55

Так вы почитайте другие статьи автора или иные источники. Вот на МКС например, да и вообще на НОО, может год(ы) отработать без сбоев. Выше — будет сбоить часто. Значимая частота и на трансатлантических рейсах отмечается, другое дело, что есть «значимая» в вашем случае. Тут надежнее всего оперировать не временем и частотой на одном девайсе, а интенсивностью отказов на выборке, скажем так — у миллиарда марсианских людей хотя бы раз в день оно точно будет (я сейчас про одиночные сбои говорю).

hhba Jan 14 2020 at 23:04

Спасибо автору, статья офигенная! Даже боюсь спросить, сколько времени ушло на сбор всех этих фактов. Кажется, что я очень много прочитал про ERC32, но увидел много нового тут.

И очередное упоминание проекта HPSC на Хабре))) Погрузился я как-то в этот проект в прошлом году, была даже мысль запилить здесь небольшой обзорчик (вдруг кому будет интересно), но все времени не было, а теперь уж и не буду пожалуй.

amartology Jan 14 2020 at 23:13

Даже боюсь спросить, сколько времени ушло на сбор всех этих фактов.

Я знал, где и что ищу, поэтому уложился в пару недель до каникул и сами каникулы. И потом ещё нещадно резал черновики, чтобы вместо статьи случайно не получилась книга. С другой стороны, я уже больше десяти лет каждодневно занимаюсь радстойкостью, и весомая часть времени и сил уходит на чтение литературы.

hhba Jan 14 2020 at 23:24

С другой стороны, я уже больше десяти лет каждодневно занимаюсь радстойкостью, и весомая часть времени и сил уходит на чтение литературы

А это как-то мало помогает по моему опыту. Я тоже много чего читаю в своей области, знаю и могу вспомнить по необходимости прочитанное in general, и иногда даже конкретные цифры. Но если нужно написать некий очерк, то нужно же все это снабдить точными ссылками, точными датами и точными цифрами, и времени на это нужен вагон — ну, да, за две-три недели, условно в 10-20% фокуса, можно уложиться.

amartology Jan 15 2020 at 13:37

снабдить точными ссылками, точными датами и точными цифрами

Кстати для меня важная мотивация писать статьи — возможность превратить собственное обрывочное знание in general в хорошо структурированное и как следует осознанное, а то бывает неприятно выяснить, что со своим in general на самом деле много лет играл в испорченный телефон, однажды переврав самому себе что-то мельком услышанное. А так я во-первых стал точно уверен в том, что понимаю, что говорю, а во-вторых — под рукой будет одно место, где можно посмотреть, если в будущем нужно будет самому себе что-то напомнить.

hhba Jan 15 2020 at 13:46

Так и есть, еще одно, пусть и косвенное, проявление правила «хочешь что-то понять — попытайся объяснить это другому». Ну и записывать свои мысли полезно всегда, память все-таки не резиновая.

v1000 Jan 14 2020 at 23:36

– ЦУП! У нас вышел из строя компьютер! Что делать??
– Играйте на запасном! Повторяю! Играйте на запасном!

Azya Jan 14 2020 at 23:49

1802 никому в команде разработчиков по-настоящему не нравился

Смотрю, вкусы разработчиков со временем не сильно меняются, я недавно практиковался с 1802 — зубодробительней набора инструкций еще поискать, даже 4-битный TMS1000 примерно того же времени создания показался мне более дружественным.

amartology Jan 15 2020 at 00:26

Практиковался с 1802? Я бы почитал про такое с удовольствием, из палеонтологического интереса)

Azya Jan 15 2020 at 09:03

Есть у меня хобби делать простенькие игры для разных древних железок, а на 1802 была одна из первых игровых приставок — RCA Studio II, вот с ней и игрался. Про нее, кстати, на Хабре есть палеонтологическая статья.

amartology Jan 15 2020 at 18:16

Спасибо большое, статья очень крутая. Но в ней, кстати, есть неточность по части радстойкости: космические 1802 были не только (и не столько) на технологии «кремний на сапфире», но и на объемной КМОП-технологии, и на GaAs. На Magsat и Galileo с вероятностью 99% были объемные чипы из первых серий.

155la3 Jan 16 2020 at 09:27

Маленькое уточнение, арсенид-галлиевая серия у «Микрона» была К6500, а не К5600.

amartology Jan 16 2020 at 09:30

Да, конечно 6500. Видимо, опечатался. Спасибо большое!

AVAF Jan 16 2020 at 11:33

Совершенно фантастическая по уровню написания и качеству материала статья!
Спасибо вам!

Sergery8205 Jan 16 2020 at 13:02

Достаточно подробный обзор. Спасибо! Для меня эта тема всегда была загадкой. А тут такое все по разложено.

neerps Apr 11 2020 at 17:52

Большое спасибо за подробный обзор!

В своё время узнал про Йиржи Гейзлера благодаря одному комментарию с заброшенной ветки формуа Altera. Там говорили про некий необычный стиль описания логики на VHDL по методу Jiri Gaisler. В сети, в целом, оказалось не так и много информации про этот стиль. В одной из презентаций говорится о том, что именно благодаря этому стилю на LEON потратили 2 человеко-года (2 man-years), а первый образец в железе вышел без багов. Выглядит впечатляюще. Однако я практически не встречал разработчиков, которые писали бы подобным образом. И это меня несколько удивляет. Как я понял, LEON'ы оказались весьма успешными. В то же время, один из методов разработки этого успешного продукта не получил распространения. Для себя я пока не нашел ответа, почему.

Brak0del Apr 18 2020 at 01:39

Спасибо за наводку!
Погуглил, интересный стиль. Некоторые такие элементы или ходы в описаниях встречал, но всё вместе не видел. Надо обдумать.

В то же время, один из методов разработки этого успешного продукта не получил распространения. Для себя я пока не нашел ответа, почему.

На форуме Xilinx есть обсуждение этого стиля, возможно одна из причин историческая — раньше синтезаторы не всегда хорошо оптимизировали такой код, а также имели проблемы с типом record.

Глянул также исходники от самого Jiri, где используется этот стиль. Для случаев с большими конечными автоматами и большим количеством переменных он кажется уже не таким и приятным, я бы даже сказал, громоздким, следить за изменением одной переменной по состояниям сложно. Возможно, это дело предпочтений и привычки.

neerps Apr 19 2020 at 18:29

На форуме Xilinx есть обсуждение этого стиля, возможно одна из причин историческая — раньше синтезаторы не всегда хорошо оптимизировали такой код, а также имели проблемы с типом record.

Спасибо, что нашли то обсуждение. Я как раз недавно пытался отыскать его снова, но не смог. Пользователь с ником 'mwaechter', он же 'Mathias Wächter', — это и есть тот человек, благодаря которому я узнал про этот стиль. К слову, Mathias оставил немало полезных комментариев по теме контроллеров аппаратных ядер PCIe в ПЛИС как на форумах Xilinx, так и на форумах Altera.
Действительно, у Jiri Gaisler мог быть более продвинутый синтезатор, у которого не было проблем с record. С другой стороны, тот же Mathias пишет, что они начали применять этот стиль с 2004 года. Прошло уже 16 лет. Впрочем, здесь я сравниваю разработчика ASIC и разработчика FPGA. У них могут быть совершенно разные инструменты синтеза.

Глянул также исходники от самого Jiri, где используется этот стиль. Для случаев с большими конечными автоматами и большим количеством переменных он кажется уже не таким и приятным, я бы даже сказал, громоздким, следить за изменением одной переменной по состояниям сложно. Возможно, это дело предпочтений и привычки.

Мне кажется, что некоторую роль играет то, как структурирован сам код. Я пробовал писать проект в подобном стиле и в целом доволен результатами. Проблемы были только во внешних интерфейсах. Нужно тщательно продумать, как группировать внешние сигналы в record, иначе получается неразбериха и туча портов. Но писать код было, на мой взгляд, намного легче. Если что-то изменялось прямо во время разработки, я легко мог внести изменения; тратил меньше действий на добавить/удалить сигнал, делал меньше ошибок, не получал случайных защёлок.

Brak0del Apr 19 2020 at 19:03

Вас понял, благодарю за интересную информацию, поэкспериментирую более детально с этими вещами.

Show the best of all time