Andrey2008 16 дек 2009 в 14:42

Параллельное программирование в черном ящике

4 мин

9.8K

Блог компании Intel

+15

Комментарии 47

xander_unlim 16 дек 2009 в 15:56

Спасибо за статью, прочитать было интересно, но сложно написано мне кажется.
Вот эсли бы визуализировать информацию!

-4

mikhanoid 16 дек 2009 в 15:59

Гы. То есть Вы сейчас написали: никто не понимает, как работают большие программы. Более того, никто не способен понять… А где ж тогда гарантии, что программы работают правильно? :)

НЛО прилетело и опубликовало эту надпись здесь

mikhanoid 17 дек 2009 в 08:12

То есть, вполне есть шанс, что я завтра установлю, скажем, Photoshop, а он вместо рисования рисунков начнёт музыку проигрывать? :) Я имею в виду ошибочность на уровне основной функциональности программы, а не мелких багов в интерфейсах.

mikhanoid 17 дек 2009 в 08:12

В интерфейсах пользователей.

tangro 16 дек 2009 в 16:44

Более того — а они и не работают правильно. В багтрекере любого более-менее большого проекта висят сотни (а то и тысячи!) незакрытых багов. Просто в большинстве своем на них напоролось мало людей и поэтому такая ситуация никого не шокирует. А то, на что напоролось много — быстренько фикситься хот-фиксами.

mikhanoid 17 дек 2009 в 08:10

Эмс. Баги это другое. Баг — это не крупная архитектурная ошибка, а мелочь какая-нибудь: забыли переменную обнулить или вместо == = поставили. И т.д. Человек же пишет о том, что люди пишущие программы об общей архитектуре представления не имеют. Возникает тогда вопрос: а как они вообще эти программы пишут?

И куда подевалось всеми расхваливаемое ООП? Куда подевались хорошо документированные интерфейсы и инварианты для модулей: мол ядро Linux'а — это то, что умеет делать fork, fork работает должен порождать процесс так-то и так-то, а детали реализации ядра Linux уже никому не нужны. Неужели в больших люди проектах не производят декомпозицию на модули?

jjlol 16 дек 2009 в 16:05

Блин, я ненавижу эти слова — «давным-давно никто не знает, как работают реальные программы». Это просто ппц.

tangro 16 дек 2009 в 16:48

Хм… А вы можете расписать как работает Ваша (или хоть какая) программа от интерфейса, до его обработчиков, алгоритмов обработки, вызовов функций библиотек, работу этих функций, функционал ядра операционки, драйверов, обрабатывающих запросы ядра, и конкретных железок, выполняющих ввод\вывод на устройства, в которых их прошивка осуществляет конечные действия (зажигает пиксели, передает байты в сеть)?

Не можете. Потому что Вам нафиг надо и степень Ваших интересо заканчивается где-то на третьем-четвертом элементе списка. Если Вы — системщик, то она начинается на третьем-четвером и заканчивается на шестом-седьмом, если специалист по hardaware — начинается на седьмом и т.д.

Так какое у Вас есть право сказать «я полность понимаю как работает моя программа»?

angry_elf 16 дек 2009 в 16:59

Это бред. Программист может и должен понимать свою программу до мест, где она контачит с чужими вещами — операционной системой, сетью (подразумевается, что на другом конце чужая программа), железом.

Когда каждый программист большого проекта знает только свой кусок, это неизбежно приведёт к тому, что куски начнут дублировать функционал (велосипедизм), конфликтовать друг с другом и т.п.

-2

3ym3 16 дек 2009 в 18:36

К сожалению, это реальность. Это я говорю как человек, работавший с несколькими крупными проектами возрастом более 10 лет.

angry_elf 16 дек 2009 в 18:39

Погодите. Я знаю, что бывают крупные проекты, о которых никто не знает, как оно работает. Я просто говорю, что существование таких проектов должно ограничиваться багфиксом. Пытаться добавить в них параллелизм методом чёрного ящика (т.е. не разбираясь в тонкостях внутренних механизмов) — бред. Не получится ничего. И никакие инструменты не помогут.

-2

Andrey2008 16 дек 2009 в 19:14

Я согласен, что бред. Но куда деваться, если сказали НАДО? Можно уволиться, но кому-то все равно придется это делать.

angry_elf 16 дек 2009 в 19:17

Сказали НАДО что? Взять и распараллелить отдельный образчик bloatware для достижения N% прироста производительности на многоядерной железке? Тут есть два выхода: отрабатывать зарплату (ну т.е. покупать кучи красивых инструментов, помогающих вытащить еще 1% скорости за счёт десятка новых багов) или переписывать всё по человечески. Мало ли что начальству надо? Может в следущий раз ему надо будет посмотреть, как я лечу из окна, не прыгать же мне?

-2

rachiu 16 дек 2009 в 17:29

Вы кажется подменяете одно понятие другим. Существует такая вещь, как модульность. И если вы параллелите модуль A, который вы разрабатываете, то вам не нужно знать более низкоуровневые модули B и C. Вы же не считаете, что если вы параллелите математический пакет, то вам нужно параллелить ядро операционки. При этом свой модуль вы должны понимать полностью.

Сама ваша статья очень интересная, поставил ей и вам плюсы, но при этом мне кажется, что вы путаете кислое с красным, когда аргументируете ваши соображения.

Andrey2008 16 дек 2009 в 19:19

И если вы параллелите модуль A, который вы разрабатываете, то вам не нужно знать более низкоуровневые модули B и C.

В идеальной программе – да. В реальной — нет. Устройство низкоуровневых модулей B и C может не рассчитано на параллельные вызовы. Достаточно наличие одной глобальной (общей) переменной в этих модулях и мы уже имеем дело с состоянием гонки.

CheatEx 16 дек 2009 в 17:28

ППЦ… но такова реальность :(

rachiu 16 дек 2009 в 17:30

Поверте, в каждом успешном проете есть люди, которые очень хорошо понимают структуру того, что делается. И если вы этого не понимаете, то это говорит о том, что вы скорее всего обычный разработчик, который выполняет задания более квалифицированного сотрудника, который как раз в этом разбирается.

CheatEx 16 дек 2009 в 17:52

Струтура того что делается и то как это делает есть разные вещи!

egy 16 дек 2009 в 18:47

> в каждом успешном проете есть люди

Речь идет не только об успешных проектах

Andrey2008 16 дек 2009 в 19:10

Но так оно и есть. И по меркам истории компьютеров именно давно. Еще Эдсгер Дейкстра писал о кризисе в программировании и что программы стали крайне сложными и недетерминированными. Например, в статье «Смиренный программист» 1972 года он пишет:

Во-первых, мы получили прерывания ввода/вывода, происходящие в непредсказуемые и невоспроизводимые моменты времени; в сравнении со старыми последовательными машинами, которые прикидывались полностью детерминированными автоматами, это разительное изменение, и преждевременная седина многих системных программистов служит свидетельством тому, что нам не стоит легкомысленно отзываться о логических проблемах, порожденных этой возможностью.

Так что вполне себе «давным-давно никто не знает, как работают реальные программы» :)

mikhanoid 17 дек 2009 в 08:15

Не так, IMHO. Давным-двано программы не работают в рамках детерминированной последовательной модели. Но это не означает, что «никто не знает». Существуют же модели, позволяющие описывать поведение прерываемых, параллельных процессов. И позволяющие добиваться вполне определённых свойств от системы: сети Петри, темпоральная логика, всё такое прочее. Да, к простой, последовательной машине Тьюринга это не сводится, ну и что? Сводится зато к другой машине с другими, но тоже с понятными свойствами. Надо просто немного think different.

-1

Andrey2008 17 дек 2009 в 13:17

Я думаю, я еще сделаю не один пост и мы не раз продолжим спор в этом ключе. :) Вы относитесь ко второй группе (теоретиков). А я скорее себя ставлю ближе к первой группе (практиков и реалистов). Это не хорошо и не плохо, просто у нас разная картина мира. :) Когда я услышал про модели описания параллельных процессов и сети петри, я был готов поспорить, что Вы работаете или как-то связаны с ИПС/ИММ/xxx РАН. Посмотрел профиль – и действительно ИММ УрО РАН. ;))) Только боже упаси не подумайте, что я не считаюсь с теоретическими аспектами. Только на практике это может выглядеть так. Приходит в компанию, занимающуюся аутсорсом, очередной проект, который нужно развивать. И НИКТО не знает, что там. И никакие модели тут не помогут. :)

angry_elf 16 дек 2009 в 16:54

Распараллеливать чёрный ящик — крайне неблагодарное занятие. Ни один дебаггер вам не сможет потом помочь отлаживать race conditions и случайные deadlock'и.

/me сторонник выкидывания мегабайтов старого трудноподдерживаемого кода и переписывания заново. Разумеется, если в этом действительно есть необходимость (не трогай работающую систему, да).

CheatEx 16 дек 2009 в 17:27

Вы когда-нибудь живого заказчика видели?

angry_elf 16 дек 2009 в 17:44

Нет, я их придумываю.

Вам не нравится, что я люблю писать с нуля? :)

У меня таких примеров тьма. Вот был заказчик, который хотел к битриксу прикрутить мааленький модуль. Сам битрикс в той ситуации заботился лишь за генерацию меню. Клиент был послан нафиг. Ну т.е. ему объяснили, что написать своё с помощью более другого фреймворка (фреймворк битрикс или cms — науке не известно. Известно только, что bloatware) будет стоить дешевле и закончится быстрее. Угадайте, что выбрал заказчик?

Вариант, когда меня берут в фирму поддерживать старый дремучий проект, в котором я буду заниматься маааленьким модулем и фиксом накопившихся за 100 лет багов, на которых взорвался мозг у нескольких поколений программистов, я рассматривать не буду. С такими ситуациями не знаком (и не познакомлюсь).

-1

DmitryO 16 дек 2009 в 18:42

Тем не менее вы представлете (гипотетически) такой проект, так ведь?

angry_elf 16 дек 2009 в 18:51

Да, такие проекты есть (даже не гипотетически). Только я писал уже выше,
habrahabr.ru/company/intel/blog/78350/#comment_2290463

-1

DmitryO 16 дек 2009 в 19:15

Ага, я понял. Просто хотел сказать, что всякое бывает. И теоретически иногда имеет смысл разбираться с кучей чужого кода. Я сам сторонник «переписывания», (даже если код — мой :). К сожалению, это не всегда возможно…

angry_elf 16 дек 2009 в 19:24

Да, я не исключаю возможности разбирательства в чужом коде. Я исключаю возможность наворотить реальных оптимизаций без внесения сложнонаходимых багов и при этом не разбираться в коде.

DmitryO 16 дек 2009 в 19:31

хорошая формулировка!

billyevans 16 дек 2009 в 17:28

Вроде в валгринде есть такая штука как отслеживание гонок и дедлоков, но мне как то не приходилось с его помощью этим заниматься. А вообще, конечно, нужно изначально это планировать параллельность.

angry_elf 16 дек 2009 в 17:50

Не допускать проблему проще, чем потом её решать, это очень старое правило. В случае чёрного ящика вариантов особенно нету. Есть хороший (третий вариант) — уволиться (крамола, да). Что бы я и сделал в подобной ситуации.

Andrey2008 16 дек 2009 в 19:29

Не так все плохо. Появляются соответствующие инструменты. И они уже умеют очень многое. Пожалуй, лучшим универсальным инструментом сейчас в этой области является динамический анализатор Intel Parallel Inspector. Развиваются альтернативные подходы, основанные на статическом анализе. Для OpenMP программ: Intel “Parallel Lint” и VivaMP. Для POSIX Threads можно взять PC-Lint.

angry_elf 16 дек 2009 в 19:34

Пеарстры! Пеарстры!

trevel 16 дек 2009 в 17:57

Что-то воды многовато. Как показывает практика, то большенство программистов даже не могут разобраться, в чем собственно заключается параллельность-асинхронность. Вот хороший цикл статей и обсуждений на эту тему параллельного программирования.
Инициативы Интела понятны, им же нужно оправдать выпуск многоядерных процов, поскольку наращивать частоту они уже не могут. А переходить на немейстримовые языки, которые хорошо параллелятся никто не спешит. Вот они решили сами вбросить, но пока их затея выглядет фантастической.

DmitryO 16 дек 2009 в 18:47

По сути вы правы, но откуда негативная коннотация? Да, частоту поднимать становится все сложнее. Житкий азот дорожает на глазах :). Многоядерные процессоры — неплохой выход. Это даже обсуждать странно, ведь если бы кто-то мог сделать 10Ггц процессор — он бы его уже сделал.

Какие языки использовать для написания софта под многоядерные процессоры? Да любые! Почему не спешать параллелить? Об этом, думаю, как раз и статья.

А насчет «решили сами вбросить» — я немного не понял.

trevel 16 дек 2009 в 19:03

Разговор о параллельном программировании ведется очень давно и языки существуют давно. Но проблемы то не решается. Пока все тянут. Но скоро выхода не останется. Сейчас стандарт 2 ядра, через 2 года будет 4, и чем дальше тем быстрее будут наращиватся ядра.

Интел просто подходит только со своей стороны. Но пока это выглядет утопично. И для черных ящиков поднять производительность линейно все одно не смогут. Поэтому выход будет один — переписать, это трудно признавать, но это так. А вот если переписывать, то зачем брать С++, если есть более удобные языки для распараллеливания.

>Почему не спешать параллелить?
В интерпрайзе все инертно и никто никуда не торопится(а это основной рынок). Ждут-надеются на еще один усовершатор от Интела. Но все одно его эффективность будет во много меньше, чем код написанный с учетом ассинхронности на языке типа Эрланга.
+ не Интелом единым

ryukzak 16 дек 2009 в 19:15

Насколько мне известно, даже если программа пишется изначально многопоточной, то рост производительности от количества ядер не линейный. И чем больше ядер, тем больше пологий будет график.

DmitryO 16 дек 2009 в 19:28

Начинаю понимать ;)

Тут ситуация такая: мы (ИНтел) пытаемся работать в нескольких направлениях. Если говорить о «более удобных» языках, то по возможности мы контактируем с разработчиками, участвуем в выработке стандартов и т.п.

Да, я слышал множетсво комментариев в духе «вы большие, напишите параллельный питон или C#, что вам стоит?». К сожалению, это выглядит утопично. Нельзя сделать сразу все и всем. С этой точки зрения политика разумного вмешательства (или невмешательства, — это уж как удобнее) выглядит логично.

С++ — отдельная тема. Это та область, которая близка к enterprise рынку, как вы правильно заметили. Но в то же время эта та область, в которой у интел есть опыт. Поэтому я с трудом представляю что в одном из инструментов Интел не будет поддержки C++.

А еще я очень надеюсь, что когда-нибудь появится поддержка других языков :))))

ryukzak 16 дек 2009 в 19:18

>> Какие языки использовать для написания софта под многоядерные процессоры? Да любые!
В принципе, вы правы. Но писать многопоточную программу на java и на Erlang — это тоже самое, что сверлить буравчиком или дрелью. А если к примеру взять пролог (с правильным рантаймом), то там программисту не надо даже думать о многопоточности. Всё и так распаралелится. Другое дело что пролог хорош только для определённых задач.

DmitryO 16 дек 2009 в 19:34

точно! Я как раз об этом только что написал отдельный комметарий :)

ryukzak 16 дек 2009 в 19:10

Увы, но не понял о чем пост. Рискну предположить, что он был о том, что есть инструменты, которые автоматически распаралелят старый код. И о том, какие категории людей как к этому относятся.

Можно его резюмировать в 2-3 предложения?

-1

angry_elf 16 дек 2009 в 19:40

«Мы интел, не забывайте о нас, люди. Особенно в такое жуткое для нас время, когда необходимость в x86 находится под таким большим вопросом. Мы наклепали для вас кучу тулзей, позволяющие запускать ваш код на фортране и коболе (ну ладно, на c++ тоже) на современных, многоядерных мало кому нужных монстрах!»

Пеар, в общем.

Andrey2008 16 дек 2009 в 22:53

На всякий случай обращу внимание, что я не работаю в компании Intel! И пиарить Intel мне смысла нет. :))

angry_elf 16 дек 2009 в 22:54

Каким образом вы тогда пишете в «Блог компании Intel Corporation»?

DmitryO 17 дек 2009 в 10:20

Да очень просто — у Андрея весьма солидный опыт в области параллельного программирования. Вот я его попросил написать несколько заметок в наш блог. Кстати, если есть желание присоединиться — пишите мне лично, обсудим ;)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий