VaiMR Jan 9 2012 at 00:20

Читайте код, с остальным справится компилятор

3 min

3.1K

Website development*

+48

112

Comments 112

gribozavr Jan 9 2012 at 00:28

Смотрите только не получите в результате равиоли-код.

+13

VaiMR Jan 9 2012 at 00:46

Конечно, надо знать меру. «Равиоли-код» часто появляется вследствие плохих названий методов. Когда они просто описывают содержимое, а не назначение и возможности.

AlexeyFrolov Jan 9 2012 at 15:59

а плохие названия методов зачастую являются следствием дырявой абстракции. Все от ситуации зависит, конечно…

solaris Jan 10 2012 at 01:24

А чем плох равиоли-код? Насколько я понимаю, это в принципе то, к чему мы стремимся при ОО-разработке: маленькие идеально инкапсулированные кусочки кода. Гугль говорит, что это антоним спегетти-кода, а Вики несколько туманно намекает на то же самое.
Что же за конфликт терминологий такой?

VolCh Jan 10 2012 at 01:37

Крайние случаи редко бывают оптимальными в реальном мире. В погоне за инкапсуляцией, слабой связанностью и прочими «паттернами» легко превратить код приложения в месиво классов и методов в одну строку, которые инвертят друг другу контроль, что-то слушают, о чем-то сообщают, чего-то ~~химичат~~ фабричат, но вот что конкретно происходит, когда нажимаешь кнопку ~~«Сделай мне...»~~ой, просто кнопку — не понять.

solaris Jan 10 2012 at 01:54

Благодарю. Что-то подобное я подозревал (и даже немножко нагуглил), просто не был уверен насчет верного названия сего безобразия. Действительно, все начинает сходиться на названиях методов/функций.

Flammar Nov 14 2012 at 12:54

Да, есть ещё и такой антипаттерн…

PQR Jan 9 2012 at 00:41

«Зачем ты выносишь, однократно используемый, код в функции?»
Раньше я тоже не любил выносить однократно используемый код в функции. Теперь стараюсь разделить логику работы на маленькие кусочки, каждый из которых оформляю отдельной функцией, так действительно удобнее читать! Если нужны подробности реализации, всегда можно провалиться в одну из функций и посмотреть детали.

+16

printf Jan 9 2012 at 01:11

Так ещё и тестировать удобнее.

Вообще разделение задачи на N подзадач — наше всё.

gaelpa Jan 9 2012 at 11:43

Я бы даже сказал, что «разделение задачи на N подзадач» — это и есть наша работа.

NikoM Jan 9 2012 at 12:28

принцип «Разделяй и властвуй»

stampoon Jan 9 2012 at 21:46

Во всем нужно знать меру. Можно так «доразбиваться», что код станет читаемым, как книга, но править его будет одно мучение. ;-)

GrigoryPerepechko Jan 9 2012 at 11:26

На самом деле раздражает когда простой функционал который в одном методе занял бы 50 строк побит на 10 функций просто потому что разработчик решил что поиск позиции разделителя это должен быть не string.IndexOf(SEPARATOR) а отдельная фукнция размером в одну строку, якобы это отдельный блок логики.

Много маленьких методов с именами по 30 символов довольно трудно поддерживать. Если что либо изменилось — будет куча работы по рефакторингу. История как с коментариями.

Возможно я говорю о крайней ситуации, но я достаточно много видел программистов думающих о какой-то мифической красоте и забывающих что всю эту красоту кода нужно поддерживать.

Лично я не выношу методы до 5 строк, либо до второго идентичного использования, либо до 3-4 неидентичного использования. Неидентичное использование подразумевает одинаковый код, но с чуть отличающейся логической функцией, что ознаачет что имплементация может поменяться и совпадает она временно\случайно.

VaiMR Jan 9 2012 at 11:42

Если сейчас код не будет вынесен, то совсем не факт, что его вынесут через пять лет, проще будет написать дубль. Я с такой ситуацией сталкиваюсь повсеместно. С разбиением надо знать меру. Код имеет тенденцию разрастаться, усложняться. Рефакторинг делать гораздо проще, если уже есть разбиение на методы, связность то ниже, нет необходимости вникать в хитросплетения логики внутри большого метода.

UFO just landed and posted this here

boolivar Jan 10 2012 at 16:17

Как приятно что вы тоже читали эту замечательную книгу :)

bormotov Jan 9 2012 at 18:17

красота, как уже заметили, у каждого своя.

Но есть вполне себе формальные критерии. Если SEPARATOR универсальный, и много где его ищут по разным случаям, действительно нет особого смысла выносить это в FindSeparator. Но если подумать чуть дальше, что делают найдя? Бьют по нему строку на две? На список по всем вхождениям? Вот такого рода методы — почему бы не сделать отдельно, и не назвать более внятно?

Количество строк и сколько раз используется, на мой вкус, не суть важно. Если это парсинг бинарного протокола, и только в одном месте деление потока на кадры по одному разделителю, я всё равно предпочту иметь отдельный метод который получает кадр данных, с названием типа getFrame или как-то так. И не важно, что реализация этого не будет меняться вообще, и разделители тоже. Важно, что читая тот код, где этот кадр данных получают, я прочту «получить кадр», и точно буду знать — мне тут вернут кадр данных.

ncix Jan 9 2012 at 22:39

Тут есть как обратная сторона такого рода: Вот разнесли вы один метод из 15 строк на три, которые вызывают друг друга по очереди, ОК все работает, все понятно. Затем, под какую-то другую задачу, другой разработчик ищет место, куда бы ему воткнуться в вашей логике, места подходящего не находит и модифицирует один или даже все три ваших новых метода, добавляя ветвление. Потом это повторяется еще несколько раз. В результате мы имеем пачку методов, выполняющих ряд похожих операций и связанных множеством перекрестных связей. И с каждой новой модификацией все менее понятно, откуда же этот клуб начинать разворачивать. В особенно запутанном случае в этом клубке возникают рекурсии и в конце концов он идет на помойку почти целиком.

Еще один минус — найти место для начала отладки. Согласитесь, проще воткнуть «бряк» в начале одного увесистого метода, чем во всех трёх маленьких методах, не зная наперёд где нам повезет.

Я конечно не призываю делать god-object'ы и god-методы, но во всяком рефакторинге нужна мера.

VaiMR Jan 9 2012 at 23:55

Дублирование кода — это очень плохая практика. Не надо ухудшать код правками. Используйте ревью. Практика, которую вы советуете приводит к методам в 2-4 тысячи строк, а то и больше (10 тыс. и это не предел). На любой вопрос, а как это работает, у более опытных разработчиков всегда готов ответ: «debug в руки и вперед!». Неоднократно с этим сталкивался. Прежде, чем вносить правку стоит подумать, а не писать кое-как.

ncix Jan 10 2012 at 00:01

Вы какой-то предельный случай сейчас приводите. В моей практике методов больше 2-3 экранов не было. Но выносить код в отдельный метод с заранее неясной целью — плохая практика. Знаете, лучше класс из 10 методов по 100 строк чем класс из 200 методов по 5 строк, хотя и то и другое плохо.
Но дробление на классы без веских на то оснований умножает сущности, что еще хуже.

VaiMR Jan 10 2012 at 00:08

Случай не предельный, а вполне обычный. Вам очень повезло, если не приходилось сидеть в дебаге по два дня в методе больше 2к строк. А уж если еще и рекурсию туда приплели, то можно вешаться.

ncix Jan 10 2012 at 00:10

Ну я надеюсь вы жестоко покарали написавших такое?

VaiMR Jan 10 2012 at 00:13

Нет возможности =) Давят авторитетом.

ncix Jan 10 2012 at 00:03

На счет дублирования люто с вами согласен. Код не должен повторяться в программе более 1-2 раз. Но выделять одноразово используемый код в метод только ради уменьшения методов — не есть хорошая практика.

VaiMR Jan 10 2012 at 00:12

Уменьшение методов — естественных эффект рефакторинга и тестирования. Код, которому больше 5-10 лет имеет тенденцию приобретать запахи. Это в самом начале кажется, что незачем разбивать метод из 10 строк на два, но через некоторое время он может серьезно разрастись, тогда его уже будет не понять.

Уменьшение методов ради уменьшения — бессмысленно, надо стараться улучшить читаемость кода, сделать его понятным и простым. Но в этом, я думаю, мы солидарны.

ncix Jan 10 2012 at 00:24

Согласен. Хороших код, тот который за эти 5 лет ни разу не дописывался но активно используется извне.

VolCh Jan 10 2012 at 01:41

Но не по причине, потому что все боятся туда лезть. Не по принципу «работает — не трогай». :)

the_ghost Jan 9 2012 at 01:12

Что такое «сложность кода более 5?» Что за попугаи?

VolCh Jan 9 2012 at 01:15

Строки?

VaiMR Jan 9 2012 at 01:21

На самом деле метрик много: cmcons.com/articles/CC_CQ/dev_metrics/mertics_part_1/. Я пользуюсь более простой оценкой, предложенной Макконелом, если я не ошибаюсь. Она заключается в подсчете количества существенных операций в участке кода. То есть если в методе два оператора присваивания, одно ветвление и цикл, то сложность будет порядка 4. Данная метрика отлично подходит для определения сложности понимания кода на отдельных его участках. Есть и более формальные способы оценки сложности, которые подходят для оценки ПО в целом или отдельных алгоритмов.

VaiMR Jan 9 2012 at 01:26

Цикломатическая сложность — очень подходит для оценки сложности чтения кода. Наверное этот топологический метод и имелся в виду.

romy4 Jan 9 2012 at 03:34

Сложность может быть хоть 125, но одна функция — это код, который можно описать, грубо, как транзакция.

VaiMR Jan 9 2012 at 11:53

Да, столкнулся я с такой ошибкой с транзакциями в старом коде. Где то их добавили, а где то забыли. Куда проще создать функцию вида:

void transactFunction() {
  try {
    transaction.start();
  
    someCodeFunction();

    transaction.commit();
  } catch(Exception ex) {
    transaction.rollback();
  }
}

Такой важный функционал достоин отдельной функции. А далее наследование, полиморфизм.

А функции-транзакции, если не имеют определенной синхронизации, не так уж тразнакционны.

MarcusAurelius Jan 9 2012 at 15:40

Если разбивать сложный алгоритм на функции, то для транзакций главное — открывать и закрывать их в одной и той же функции. Что верно и для других выделений ресурсов, как то открытие/закрытие файлов, создание/разрушение объектов, установка/снятие локов и т.д. Исключением может быть, разве что, не алгоритмическая, а полностью событийная модель приложения.

LAVir Jan 9 2012 at 01:34

и тут мне вспоминается Objective-C

printf Jan 9 2012 at 03:03

Да-да, Obj-C классно читается, почти литературный текст.

-1

elw00d Jan 9 2012 at 03:20

А мне наоборот кажется, что Objective C ужасен. Вырвиглазные скобочки, плюсики-минусики в объявлениях методов, единственное что хорошо — возможность использовать именованные параметры.

izen Jan 9 2012 at 04:23

вы видимо совсем не работали с этим языком ;)

-1

elw00d Jan 9 2012 at 04:54

Работал около полугода нонстоп (правда давно уже было это, около 2 лет назад, сейчас даже синтаксис подзабыл, но ощущения остались). И там, где можно было, я использовал С++ вместо Objective-C — писал нормальные классы, реализующие логику. А к Objective-C обращался только при необходимости вызвать NS-API или что-то сделать в UI-коде.

splatt Jan 9 2012 at 04:49

Согласен. На мой взгляд Objective-C один из самых удобочитаемых языков.

-1

diamant Jan 9 2012 at 05:15

Ещё есть AppleScript!
Вот где программа выглядит, как разговорная речь:
set theTextString to «Apple Computer»
set computerStringStart to offset of «Computer» in theTextString
display dialog computerStringStart --> покажет 7 — это позиция начала слова 'Computer' в строке «Apple Computer»

quantum Jan 9 2012 at 08:22

Хех, напомнило мой первый язык программирования. Скриптовый в программе Toolbook. Там тоже было что то вроде:

to handle button down
show button knopka
go to page 3

UFO just landed and posted this here

antoo Jan 9 2012 at 18:00

А еще есть Chef
Hello, world с Википедии:

 Hello World Souffle.
 
 Ingredients.
 72 g haricot beans
 101 eggs
 108 g lard
 111 cups oil
 32 zucchinis
 119 ml water
 114 g red salmon
 100 g dijon mustard
 33 potatoes
 
 Method.
 Put potatoes into the mixing bowl.
 Put dijon mustard into the mixing bowl.
 Put lard into the mixing bowl.
 Put red salmon into the mixing bowl.
 Put oil into the mixing bowl.
 Put water into the mixing bowl.
 Put zucchinis into the mixing bowl.
 Put oil into the mixing bowl.
 Put lard into the mixing bowl.
 Put lard into the mixing bowl.
 Put eggs into the mixing bowl.
 Put haricot beans into the mixing bowl.
 Liquefy contents of the mixing bowl.
 Pour contents of the mixing bowl into the baking dish.
 
 Serves 1.

commanderxo Jan 9 2012 at 01:37

Странно, что имя Мартина Фаулера упоминается три раза, а Стива Макконнелла только один, причём написано с двумя ошибками. Имел честь видеть Фаулера лично, он год назад читал шестичасовой доклад по Continuous Delivery на мюнхенской конференции OOP 2011. Излагает очень талантливо и знает о чём говорит, но боготворить его всё же не стоит. Основополагающим трудом по написанию кода считается именно Code Complete Стива Макконнелла. Причём это не только моё мнение, книга заняла первое место в голосовании по теме What is the single most influential book every programmer should read? на StackOverflow. Фаулер там на почётном седьмом месте и он в целом пишет не столько про код, сколько про процессы — начал с Agile Manifesto, потом перешёл к Continuous Integration, сейчас двигает Continuous Delivery. Для него читаемость кода лишь один из факторов улучшающих качество проекта, важный, но далеко не единственный. Вот у Стив действительно целая книжка про то как писать код, там страниц двадцать лишь про то как оформлять комментарии.

Ещё могу порекомендовать Clean Code Роберта Мартина, у него не только про читаемость, но и про то как писать код, на который не будет страшно взглянуть после нескольких лет непрерывных правок и багфиксов.

+17

VaiMR Jan 9 2012 at 01:54

Мартина как раз упомянул, отличная книга. Опечатку подправил, спасибо!

remal Jan 9 2012 at 01:42

Вместо такого ответа лучше бы просто сослались на «Совершенный код» Макконнелла. Полезнее было бы.

VaiMR Jan 9 2012 at 01:56

Всегда ссылаюсь, часто не срабатывает. В наших краях «непуганых программистов», не так уж и много авторитетов.

commanderxo Jan 9 2012 at 02:10

Это верно, но ссылаться всё же не помешает. Это я к тому что статья безусловно полезна, но думается в такого рода публикациях нужен в конце раздел с гиперссылками на «must read» книги, другие статьи и т.д.

Например, если «непуганому программисту» лень читать томик Макконнелла, то может он всё же решится по пути на работу прослушать подкаст "SOLID Principles with Uncle Bob" c Мартином в главной роли.

VaiMR Jan 9 2012 at 11:55

Да, думал, кидайте ссылки, добавим!

AlexanderByndyu Jan 11 2012 at 15:05

Я делал серию статей по поводу S.O.L.I.D. blog.byndyu.ru/2009/10/solid.html, написано по-русски с примерами из моих проектов.

VolCh Jan 9 2012 at 01:45

С именованием проблемы часто бывают даже когда по-русски пытаешься сформулировать, не говоря о последующем переводе на английский — или теряется важная часть описания UserRepository::getForCondition7() или $this->isAllowed(), или становится совершенно нечитаемый типа UserRepository::getActiveConfirmedWithFilledCountryOrPhoneNumber() или $this->isGreaterOrEqualThenMinimalAgeOrLessThenMinimalAgeAndHaveParentPermission(self::minimalAge). Или это нормальные имена? :)

commanderxo Jan 9 2012 at 01:57

Имена, по крайней мере public методов, должны иметь семантическое значение, а не рассказывать об особенностях реализации. Ведь реализация в любой момент может измениться и тогда придётся или переименовывать метод и перекомпилировать все использующие его модули, или же имя метода начинает лгать о его содержании.

Например getActiveConfirmedWithFilledCountryOrPhoneNumber может означать getActiveConfirmedAndValid, при том что понятие Valid сегодня действительно гласит «с заполненным кодом страны или телефонным номером», но завтра эта реализация имеет право поменяться.

VolCh Jan 9 2012 at 02:49

Так это семантика (для случая с репозиторием). Реализация может быть на SQL, NoSQL, на файлах, получаться с удаленного сервера по HTTP или ещё как. Собственно для того и введен класс UserRepository (вообще он не статический, а получает storage как параметр конструктора), чтобы не зависеть от реализации хранилища. А вот само условие прямиком из ТЗ, только с русского переведено и там таких ещё парочка без объяснения их назначения, не называть же их getSet_15_1, getSet_15_2 и т. п. по номера пунктов ТЗ.

С возрастом, да, неудачный пример, можно, что-то более семантическое придумать, типа isCanUsePaydFeatures, по крайней мере назначение ясно вроде бы.

Tibr Jan 9 2012 at 04:50

isCanUsePaydFeatures

Просто canUsePaydFeatures.

VolCh Jan 9 2012 at 04:57

Сколько не пытался запомнить английскую грамматику (и школа, и два института, и курсы, и сам по самоучителям) — не могу. Какие-то «мнемонические» правила выучил типа «булева проверка начинается с is» и всё. :(

Tibr Jan 9 2012 at 05:07

Занятно. А я в школе «занимался» французским, а в университете 4 курса английским (интенсивно только 1 курс, т.к догонял). Короче, тут модальный глагол, поэтому для вопросительного предложения не надо глагола связки (be).

Не совсем круто использовать только правила вида «булева проверка начинается с is». Бывают случаи когда, например, довольно намного лучше читается код с глаголами типа has, can. Больше даже что-то на ум не приходит, ну кроме to be. Может это и имеет смысл. Типа проверка состояния — is/was, возможность осуществления чего-либо — can, наличие свойства/объекта/особенности — has. Больше особо ничего и не надо :-)

VolCh Jan 9 2012 at 05:38

Может сравнение двух схожих (вроде как) языков помогло лучше запоминать. Не первый случай встречаю и именно с французским. Какие-то сопоставления общего и различий.

Со чтением проблем особых нет. И, в принципе, вспоминаю сейчас, что can/has встречал всегда без is, но вот как пишу про это забываю. В коде может глаз бы и резануло сразу, а в комментах как-то не заметно…

VaiMR Jan 9 2012 at 01:59

Стоит пересмотреть код. OR — означает, что функция делает как минимум две задачи, скорее всего одна из них решается не очень хорошо. Надо рассмотреть вариант создания двух функций, выполняющих одно действие, но на отлично. Сам убеждаюсь, что такие имена возникают из за ошибок декомпозиции. Для первой версии кода это не так страшно, но рефакторинг тут необходим.

VolCh Jan 9 2012 at 02:31

В случае с репозиторием всё название метода, по сути, SQL-условие (WHERE u.active AND u.confirmed AND (u.country IS NOT NULL OR u.phone_number IS NOT NULL) перенесенное практически прямо из ТЗ — нужен заказчику зачем-то (а зачем не говорит) список активных подтвержденных записей с заполненными страной или номером телефона. Можно было бы применить цепочку фильтров к полному набору записей, но зная особенности реализации (обертка для MySQL) как-то не тру получится тащить всю таблицу (очень большую, допустим) с сервера БД и фильтровать его локально.

VaiMR Jan 9 2012 at 11:59

В этом случае однозначно надо искать компромисс.

AlexanderYastrebov Jan 9 2012 at 18:15

Если заказчику нужен, тогда так и называйте (может стоит чуть сократить getActiveConfirmedWithCountryOrPhone) — по существу этот метод является частью публичного API, т.к. требования к нему предъявляются из вне.

Я бы попробовал добиться от заказчика назначения этого метода и переименовал бы его в соответствии с этим назначением.
Плюс у меня в голове автоматически всплывает warning: Не придется ли мне писать тысячу подобных методов на каждую прихоть заказчика? Может стоит сделать API для произвольного (или ограниченого) конструирования фильтров?

Еще вариант: например если заказчику действительно нужно несколько подобных методов, но, допустим, все записи должны быть активны и подтверждены, можно создать отдельный репозиторий, по типу ActiveUserRepository

AlexanderYastrebov Jan 9 2012 at 18:28

Или развести на два репозитория, а заказчику дать фасад к обоим только с теми методами, которые в ТЗ.

bormotov Jan 9 2012 at 18:27

+1 к тому, что при проектировании API нужно исходить из целей.

Ведь это самое «страна или номер телефона» что-то для заказчика значит, более прикладное. Вот этим самым и нужно называть. Они к таким критериям пришли, очевидно не просто так, но всё равно изначальная задача «проверить nnnnn» осталась, и наверняка она называется как-то ощутимо короче и понятнее.
А если вернуться к изначальной задаче, возможно вылезут другие критерии, может быть даже другое понимание как эту самую проверку осуществлять более правильно.

Попробуйте разговорить заказчика, в худшем случае — потратите немного времени на общение, в лучшем — API будет более простой, задача будет более понятна и решаться будет проще/полнее/итд.

AlexanderG Jan 9 2012 at 18:39

Как это описывал Макконнелл: используйте терминологию проблемной области вместо терминологии реализации.

mihaild Jan 9 2012 at 02:10

Это не имена, это реализация функций внутри имени)

VolCh Jan 9 2012 at 02:53

:) Так описывает, что метод делает, а не как он это делает (второй пример не удачный, согласен).

TheShock Jan 9 2012 at 03:15

Нет. Он описывает, как это делает:

getActiveConfirmedWithFilledCountryOrPhoneNumber: function () {
  $this
    ->getActive()
    ->where( 'confirmed', 1 )
    ->where( 'country', Db::NOT_NULL )
    ->where( 'phoneNumber', Db::NOT_NULL )
}

Вот. Название метода полностью повторяет его содержимое. И смысл?
Если это настраиваемые пользователем фильтры, то стоило их декомпозировать до такого состояния:

function getFilled (array $filled) {
   $this
      ->getActive()
      ->confirmed()
      ->whereFilled( $this->filterFilled($filled) );
}

В контроллере будет какой-то такой код:

function action_get_field (Request $request) {
   $this->render(
      $this->model->getFilled(
         $request->post('filled')
      )
   );
}

Практика показывает, что, в большинстве случаев, программист не может внятно назвать метод когда не понимает, что он делает (суть и дух приложения).

VolCh Jan 9 2012 at 03:48

Код немного не такой, фильтры не настраиваемый, все условия «захардкожены» в ТЗ и код контроллера вообще две строки (первую очень похожую на вашу первый код как раз вынес в метод репозитория, чтоб не завязываться на все эти цепочки where, характерные для SQL ORM в контроллере), но не сказал бы, что стало читабельней.

Действительно не понимаю суть и дух этих пунктов ТЗ (а так обычное приложение знакомств для фб/вк), нужно несколько списков с разными комбинаций условий и имя getFilled не подходит, поскольку все условия содержат «заполнены поля такие-то», и пренебречь Active и Confirmed тоже нельзя, не во всех условиях они есть (а где-то есть «Неактивные»). Ну не называть же мне их getList1, getList2 и т. п. из-за того, что в ТЗ на UI админки они фигурируют под «Список 1» (см. п. 15.1), «Список 2» (см. п. 15.2) и т. д.?

bormotov Jan 9 2012 at 18:32

а бывает ли getActiveConfirmed без всяких там?
если да — чем для заказчика отличаются ActiveConfirmed от ActiveConfirmedWith*?

Насколько я понял, есть несколько вариантов заполнения, и методы такого рода позволяют отобрать те или иные варианты. В одних случаях нужны активные и подтвержденные, в других нужно что бы была заполнена страна итд.

Но зачем всё это нужно? Сколько вообще таких случаев? В каких случаях какие сочетания проверяются?

VolCh Jan 10 2012 at 05:13

Вот такого не бывает.

Не раскрывает зачем. Соответствующая страница просто должна вывести список таких-то полей для учёток из админки под говорящими названиями «Список 1». Штук 5 таких страниц (и соответственно методов) с неясным назначением. Единственное, что роднит поля выбора и вывода, что всё относится к ПДн (ФИО, ДР, адреса, мыло, телефоны и т. п.), но посетители сами их указывают и дают согласие на обработку.

bormotov Jan 10 2012 at 10:57

если не раскрывает и повлиять на это нет возможности, значит это внешние требования, которые просто нужно выполнить.

В целом-же разговор идет о тех вещах, в которых у разработчика право голоса, как минимум.

Но на уровне менеджера проекта, таки есть смысл акцентировать на этих требованиях, что это увеличение рисков в плане поддержки и развития. Если у разработчика нет ясного понимания что и как должно происходить с точки зрения прикладной области, даже если не он её реализует — возрастает риск того, что вылезет нечто неожиданное.

VaiMR Jan 9 2012 at 12:02

Согласен. На основной из задач разработчика, является правильная, логичная и простая декомпозиция требований. А уже затем идет перенос компилируемую среду. Для кода, который пишется в спешке, его требования не понятны и пр, существует рефакторинг. Надо стараться его использовать.

Zorkus Jan 9 2012 at 03:56

Насчет «а остальное сделает компилятор» — это так-то верно, но вы поосторожнее с этим. Абстракции текут, знаете ли. Когда пишете код, и хотите чтобы он был производительным — полезно знать, как работает внутри компилятор. А то вот, как тут недавно писали, руби интерпретатор, например, оптимизирует строки, которые короче 23 байт ;)

VaiMR Jan 9 2012 at 12:05

С этим согласен, в java тоже есть такие оптимизации и в c++ их иногда приходится использовать, и в других языках они точно есть. Тут делается упор на читаемость кода. Нет необходимости компилировать код в уме или сидеть день с отладчиком, чтобы понять, что же он делает

-1

Piskov Jan 9 2012 at 03:57

Осторожно замечу, что парадигма меняется.
Я про async/await с методами в C#. Если в sequential коде вызов метода практически бесплатная операция, то аналогичное с async-методом, да который еще и что-то возвращает — очень и очень даже не бесплатная (только добавив async уже в 13 раз медленнее тупо зайти в пустой метод, что эквивалентно 40 итерациям в пустом цикле синхронного метода): обработка и делегирование исключений, чтобы await-вызов метода можно было просто обернуть в обычный try-catch, а не парсить aggregate exceptions с тасками, как раньше; continuations и много чего еще типа аллокаций в кучи и т. д. — достаточно глянуть на количество генерируемого IL-кода.

Так что, ребята, без фанатизма. Иногда ничего страшного не дробить метод, а сделать внутри него пару region, которые в свернутом виде будут на глаз эквивалентны двум сигнатурам.

Поэтому каждый раз когда в асинхронном коде (а под windows 8 его будут уже писать все, если кто-то еще не пользуется async_ctp) вы создаете кучу маленьких асинзронных методов, представьте, что вы, как минимум, добавляете по 40 итераций пустого цикла в каждый из них (не говоря уже о кучи других ранее упомянутых вещей).

Понятно, что и фреймворк умный, и иногда будет выполнять асинхронный метод синхронно, если уверен в этом + есть куски, где производительность не так важна и хороший код важнее (хотя, опять же, главная цель написать хороший продукт, а уже потом — красивый код).

Для тех, кто вообще не в теме, рекомендую: channel9.msdn.com/Events/BUILD/BUILD2011/TOOL-829T

Shaddix Jan 9 2012 at 07:37

вы создаете кучу маленьких асинзронных методов

Ну так асинхронные методы же явно помечать надо как async.
Я не думаю, что люди, которые в своём развитии дошли до осознания необходимости маленьких методов, будут делать каждый такой метод асинхронным :)

Piskov Jan 9 2012 at 07:54

Парадигму маленьких методов можно и вдолбить. В школе сказали, что квадрат гипотинузы равен сумме квадратов катетов и 99,9 % просто пользуются, не доходя (в этом случае в смысле «доказать») до этого самостоятельно. Так и тут, прочитает novice урывками статью и начнет слепо и безрассудно лепить везде. А потом узнает про модификатор async (опять же, невникая в детали) и точно также просто добавит везде в существующий код (в котором, как вы можете догадаться, все донельзя раздробленно). Вот и получится то, о чем пол-лекции разглагольствует парень на channel9.
Такое сплошь и рядом. Прекарсный пример куча тормозных приложений на сервелате, где недалекие разработчики применяют шейдер к бордеру, который оборачивают вокруг всего дерева контролов (и уводя тем самым процессор под 100 % только потому, что в текстовом поле будет мигать курсор).

VaiMR Jan 9 2012 at 12:12

Преждевременная оптимизация… Кто сказал, что в коде именно это его замедляет? Отчет профайлера по всему приложению?

Синхронизированные методы и пр, это отдельная история. Но единственное место, где приходилось укрупнять методы, разворачивать циклы и делать дополнительные оптимизации — это java ME. В других приложениях всегда есть более медленные участки (проблемы вида: все методы синхронизированы, все методы static и пр. — это прежде всего проблемы).

Вызов метода — наносекунды, кидание исключения — миллисекунды, обращение к бд и работа по сети — секунды.

Piskov Jan 9 2012 at 12:44

Кого «его» замедляет? По какому приложению? Мы с вами об одних вещах говорим? Видео смотрели? Task parallel library + async CTP знаете?

Я говорю о том, что вызов вот этого:
public static async Task SimpleMethod()
{
Console.WriteLine(«Hello»);
}
…в ≈13–14 раз медленнее, чем вызов вот этого:
public static void SimpleMethod()
{
Console.WriteLine(«Hello»);
}
…ибо в первом случае под катом и try/catch, и вызов методов специфических методов фреймворка, и т. д. И все становится еще сложнее, если мы возвращаем и принимаем параметры (см. видео).

Понятно, что в большинстве случаев эта разница будет незаметна, но предупрежден — значит вооружен. И к обсуждаемому типу фатального рефакторинга методов в будущем (т. е. уже сейчас) нужно подходить с осторожностью и без фанатизма.

VaiMR Jan 9 2012 at 12:56

Различные способы синхронизации должны использоваться разумно и в меру. Только там, где это действительно необходимо. Синхронизировать абсолютно все методы нет смысла. К тому же есть отличный инструмент декомпозиции — ООП, который позволяет группировать критичные участки кода и оптимизировать их отдельно. Видео посмотрел. Всегда делаю выбор в пользу понятности и простоты кода.

-1

Piskov Jan 9 2012 at 13:08

Вы не считаете async CTP упрощением? Код ведь теперь выглядит как обычный sequential. Не нужны никакие колбеки, event-based pattern (а-ля BackgroundWorker и т. д.) или begin/end. В большинстве случаев теперь не нужно думать о потоках, контекстах выполнения (а то ведь раньше не дай бог что-то ui-ное не из ui-потока обновишь), делегированию и обработке исключений и т. д.

Это не просто способ синхронизации — это координальное упрощение всей мультипоточности до той абстракции, что о потоках и их синхронизации просто теперь можешь не думать, а вызывать методы так, как будто они выполняются синхронно.

VaiMR Jan 9 2012 at 13:18

Согласен, куда же без упрощения. Использовать удобные языковые средства надо. В статье же говорится об общем улучшении читаемости кода.

-1

TheShock Jan 9 2012 at 14:11

Я говорю о том, что вызов вот этого:

public static async Task SimpleMethod()
{
Console.WriteLine(«Hello»);
}
…в ≈13–14 раз медленнее, чем вызов вот этого:
public static void SimpleMethod()
{
Console.WriteLine(«Hello»);
}

а во сколько раз отличаются эти варианты?

public static async Task SimpleMethod() {
    veryHardQueryToDatabase();
}
// vs
public static void SimpleMethod() {
    veryHardQueryToDatabase();
}

Piskov Jan 9 2012 at 14:53

Вы сейчас о киллограмах, а мы о метрах. Речь о том, что вызов кучки асинхронных методов вместо одного не то же самое, что вызов кучки синхронных вместо одного синхронного. В последнем случае на сегодняшний день один метод или несколько друг за другом — это практически одно и то же по затратам и времени (оптимизации, инлайн, предугадывание flow и т. д.),

kekekeks Jan 9 2012 at 12:27

continuations

А причём тут они вообще? Это же вроде как Mono-specific фича, реализующая дешёвые програмно-управляемые потоки (кстати, офигенная штука, надо будет как-нибудь статейку на эту тему написать).

Piskov Jan 9 2012 at 12:36

Тогда держите набор топиков для вас на ближайшую пару неделю: Task parallel library, async ctp.

Однако вкратце отвечу на ваш вопрос. Если раньше вы бы в UI-потоке написали такую строчку:
byte[] bigData = LongDownload(string address);
…то ваше приложение бы зависло на энное количество секунд, пока качается файл.

Однако теперь одно небольшое изменение + небольшие изменения в сам метод LongDownload и вот это:
byte[] bigData = await LongDownload(string address);
…не приведет к зависанию. Как спросите вы? Метод сразу сделает return и продолжит с той же строчки уже после завершения. Под капотом за вас пишется спагетти и Task.ContinueWith + куча обработок и делегирования ошибок (то, что до async_ctp приходилось писать руками).

kekekeks Jan 9 2012 at 12:49

async, если не ошибаюсь, есть обычный синтаксический сахар, да ещё и с не вполне очевидным поведением. Вы почитайте текст по ссылке, там тоже много интересного.

sparhawk Jan 9 2012 at 13:07

Вызов функций всегда затратен, если это не inline. В наследство к нашему проекту досталась кучка макросов, сделанный специально для замены вызовов функций (как бы inline). В наши времена это уже не важно, но по традиции все пользуются макросами.

Piskov Jan 9 2012 at 13:10

Ну тут уже серьезнее дела в виде перемещения со стека в кучу, аллокации на куче, напряги сборщика мусора и т. д. Отсюда и overhead по сравнению с обычными методами.

SuperKozel Jan 9 2012 at 09:20

Я воспринимаю такие вопросы как признание в плохом знание языка
Код становится проще семантически, а технически — сложнее.

RomAndry Jan 9 2012 at 11:23

Стараюсь соблюдать эти правила? особенно в логически-сложных участках кода.
Удобство в первую очередь — это чтение кода, когда строк не много и описано методами (функциями)
К такому коду возвращаться через время легко. Ну и не забывать все же документировать методы.
Ну и новым сотрудникам вникать проще, читая тонны кода сразу же — это стресс.
Второе удобство — это при юнит-тестировании.

dmitriid Jan 9 2012 at 11:48

> «Зачем ты выносишь, однократно используемый, код в функции?»

Глаза завернулись внутрь. Откуда в рунете такая любовь к запятым?

По существу статьи:

Если писать в функциональном стиле, то код более-менее приводится к нормальному виду: разбивается на логические блоки, небольшие, выполняющие только что-то одно функции и т.п.

Но не сразу, конечно :)

elDraco Jan 9 2012 at 12:00

Тут я думаю стоит учитывать зачем Вы открыли код.
Если Вы его «читаете», то Вы скорее всего новичок и Ваша задача быстро влиться в команду и быстро понять, что вообще тут происходит.
Если Вы его «исполняете», то Вы скорее всего ищете ошибки, потому что «читая» код Вы их не найдёте (читатель всегда доверяет писателю не так ли?).
Отсюда на мой взгляд простой вывод — надо соблюдать меру и учитывать, что код будет и «исполняться» и «читаться».
ЗЫ: а насчёт выделения разового кода в отдельную функцию, да просто потому что это отдельная логическая единица, если компилятор посчитает выделение неуместным заинлайнит не маленький в конце концов.

-1

dmitriid Jan 9 2012 at 12:22

> потому что «читая» код Вы их не найдёте (читатель всегда доверяет писателю не так ли?).

Неверно. Code Review — это главный способ нахождения ошибок (ссылку, увы, сейчас не найду, но, по-моему, об этом говорится тут: vimeo.com/9270320)

elDraco Jan 9 2012 at 13:34

По-моему мы по разному понимаем «читать»/«исполнять», для успешного Code Review имхо простого «чтения» не всегда достаточно.
На мой взгляд чтение не подразумевает полного изучения кода, ограничиваясь логическими блоками, то есть, грубо говоря, есть функция getCircleArea(double radius), тогда «читая» код Вы верите, что эта функция действительно возвращает площадь круга, а «исполняя» код мы должны удостовериться, что использованная формула нахождения площади правильная. Хотя я всё же погорячился пожалуй, логические ошибки проще искать на уровне «чтения», а ошибки уровня «исполнения» надо бы покрывать тестами.

VaiMR Jan 9 2012 at 13:41

Думаю, под «читать» имеется повседневная работа с кодом, под «исполнением» — поиск ошибки в конкретном участке (после чтения, конечно).
Ревью кода — это отдельная работа, со своей спецификой.

dmitriid Jan 9 2012 at 12:22

VaiMR Jan 9 2012 at 12:28

Ревью очень важно. Всегда стоит доверять не писателю, а коду. Считаю лишним заглядывать в тело функции, только потому что хочу ее использовать. А вот если она делает не то что я ожидал, то начинаю исследование. При не совсем ясном имени, сигнатуре, стараюсь делать рефакторинг.

Иногда такие неожиданности попадаются: две функции readFileAsString и readFileAsStream. По логике должны делать одно и то же, но возвращать результат в разных форматах. Логически ожидаю, что одна вызывает другую. Пишу код, а он не работает, заглядываю в реализацию. А там первая функция читает файл из BLOB БД, а вторая из ФС и, в некоторых случаях, делает запрос к удаленному серверу. Странно, но факт.

Volfram Jan 9 2012 at 12:50

Где-то на середине статьи стало понятно, что в конце будет упомянут Макконнелл.
Так и вышло.

VaiMR Jan 9 2012 at 12:57

Может еще кого-нибудь посоветуете почитать? Помимо упомянутых в статье?

Volfram Jan 9 2012 at 13:08

Нет, едва ли. У меня довольно скептическое отношение к литературе про «хороший стиль». Куда полезнее просто пытаться экспериментировать с архитектурно сложными проектами.
Наверное, из всего что видел, понравились только «Эффективное использование C++» Скотта Майерса, ввиду своей конкретики, прагматичности и отсутствия воды.

VaiMR Jan 9 2012 at 13:13

Очень стоящая книга. В статье старался избегать упоминания книг для конкретных языков. Год назад перешел с c++ на java. Все больше убеждаюсь, что хорошие практики можно примерять вне зависимости от языка.

VolCh Jan 9 2012 at 23:14

Мне очень понравилась «Эффективная работа с унаследованным кодом» Майкла Физерса — перекликается и с «Совершенным кодом», и с «Рефакторингом...», но с упором не на то, как сделать свой текущий код читаемым для других, а на то, как сделать чужой нечитаемый код читаемым для себя и других, не теряя при этом его функций, как документированных, так и нет.

dzigoro Jan 9 2012 at 13:32

Я поставил минус, потому что «вот опять».
Очередной разработчик, прочитав хорошие книжки, решает состряпать статью на полтора абзаца о том, что только что прочитал. Ну зачем? Везде, где вы спросите об искусстве программирования, вас ткнут в эти книги. И только читая их целиком, можно понять, что упомянутые тезисы действительно работают. Потому что авторы посвятили этому целые книги, потратили гораздо больше, чем пару часов на написание своего труда и имеют гораздо больший, чем несколько лет, опыт в разработке. Так зачем их в очередной раз пытаться пересказать на одной страничке?

Поделитесь лучше собственным опытом разработки чего-нибудь, укажите какие подводные камни посчастливилось повстречать, какие проблемы удалось решить. Принесет гораздо больше пользы.

VaiMR Jan 9 2012 at 13:38

Обязательно напишу что-нибудь более фундаментальное!
Многие программисты считают себя слишком крутыми, чтобы читать какие-нибудь книги. «Некогда думать — надо писать код.» Спорить с ними бессмысленно, а вот дать ссылку на краткое описание проблемы и мнение большего количества людей очень полезно. Может, это мотивирует прочесть полезную литературу.

Поставил плюс за понимание проблемы и альтернативное мнение.

AlexanderYastrebov Jan 9 2012 at 18:35

Правда многие разработчики никогда не спрашивают об искусстве программирования и вообще ничего не знают что оно существует. Автор дает им шанс узнать что такое искусство существует и вкратце говорит в чем его суть, дает ссылки где про это прочитать.

petropavel Jan 9 2012 at 13:44

а мне понравился этот момент:

Почти после каждой [моей] более-менее существенной правки, <...> Говорят, что код стал менее понятным, становится трудно найти нужную строку и пр.

На самом деле проблема кроется как в коде, так и в разработчике, который привык к коду.

Действительно. Где-же еще?

UFO just landed and posted this here

YaR_webdev Jan 10 2012 at 18:34

Я бы порекомендовал еще вот этот ресурс по теме: sourcemaking.com/refactoring

VaiMR Jan 10 2012 at 23:04

Да, спасибо. Неплохой ресурс.

Show the best of all time