psman 2 июл 2012 в 15:46

Триггеры — спасители

5 мин

102K

Веб-разработка*MySQL*SQL*

+30

183

Комментарии 183

shuslav 2 июл 2012 в 16:03

Почему бы тоже самое не реализовать в хранимых процедурах? Мне кажется реализация «логики» в триггерах не самое хорошее решение, хотя может в случае небольшой, по кол-ву таблиц БД, оно и имеет смысл.

psman 2 июл 2012 в 16:06

«Хранимки» удобная штука, НО не всегда можно через фреймворк работать с ними нормально с учетом AR или еще какой нибудь «прослойки».
Вообще если бы некоторые фреймворки умели разделять таблицы для чтения и таблицы(вью) для записи, то я был бы счастлив.

shaelf 2 июл 2012 в 21:26

Я когда-то тоже загонялся подобными счетчиками и пришел к выводу, что хранить этот счетчик в таблице с записью это не очень хорошая мысль. Гораздо проще запихнуть это поле куда нить в мемкеш или в редис (когда я думал об этом был 2007 год и об редиски я ничего не слышал). Если есть данные, то забираем, если нет, то считаем, записываем и показываем… Все просто и не ломает сущности записи всякой ненужной и постоянно изменяющейся метой.

psman 2 июл 2012 в 21:30

Есть один минус. «Холодный старт» мемкэша или редиса, или что угодно, что наши данные кэширует. Когда на ресурсе под 100 тыс статей а за них проголосовало около 50 тыс людей, то пересчет сумм голосов, показов, комментариев и т.п. становится ооочень проблематичным. Знаю пару сайтов таких, у них при каком либо сбое выработана целая стратегия включения всего.

dmitry_dvp 4 июл 2012 в 10:45

ну и выборки вида «самые комментируемые» становятся менее удобными

psman 4 июл 2012 в 11:54

Ну много кого полукилометровые джойны не останавливают. Причина одна: незнание инструментов и неумение ими пользоваться. Это как эникей, который отверткой и канцелярским ножом обжимает кабель.

morr 2 июл 2012 в 16:07

У триггеров есть огромный недостаток, с лихвой перекрывающий почти все их плюшки, — про триггеры со временем забываешь, их логики нет всегда перед глазами. Особенно плохо, когда триггерами делается что-то не совсем тривиальноею В перспективе это куча проблем на свою голову, особенно, когда в команду приходят новые люди.

А про инкремент счётчиков, хорошие ORM это умеют сами. ActiveRecord::CounterCache

psman 2 июл 2012 в 16:09

С перспективой проблем нет, так как завершаю любой проект клиенту выдается пакет документации + вики + комментарии в коде.

larikov 2 июл 2012 в 16:16

Вобщем «после меня, да гори оно все синим пламенем» :)

psman 2 июл 2012 в 16:20

Клиенту сделан сложный инструмент к которому прилагается ооочень подробная инструкция. Мне печально будет, если не читая документации будут на живую что либо ломать, но от дураков защиты нет.

psman 2 июл 2012 в 16:22

В принципе изготовители машин и т.п. тоже так делают. И есть автослесари которые кувалдой отворачивают гайки, а есть квалифицированные мастера, которые имеют и инструменты и знания и документацию читают :)

НЛО прилетело и опубликовало эту надпись здесь

psman 3 июл 2012 в 10:14

Прописывайте в договоре, что бы обязывать писать документацию. Порой только так что либо можно заставить делать доки. Хотя отсутствие их у самого разраба в процессе — это или бардак при разработке или уже «привычка» делать как получится. Если бардак, то порой заказчики виноваты в нем, если разрабы не заикнулись про ТЗ более менее полноценное, то это показатель, что НИ КТО не понимает что будет сделано.

m36 3 июл 2012 в 11:24

Еще, что хуже, они могут переопределять поведение операций. Жесткие баги получаются.

psman 3 июл 2012 в 12:50

Не страшнее чем простой код или хук в коде, или еще какие нить удобные варианты (валидация, пре и пост обработка данных)

m36 3 июл 2012 в 12:55

Я бы использовал хранимки. Они не страшнее. Суть в том, что тригеры могут неявно переопределить поведение операции. Вы что-то инсертите в таблицу, а инсерт не все поля вставляет. И еще много чего может делать.

Тригеры использую, если код легаси и если уже так повелось, что при меньших затратах, можно на них что-то сделать. Логирование или кеширование.

lair 2 июл 2012 в 16:13

Обычно в среднем проекте все что можно перенести на сторону sql сервера — переносим.

Поддерживать потом не устаете? Триггеры — это одна из наименее очевидных вещей в БД, особенно при отслеживании «что сломалось».

psman 2 июл 2012 в 16:17

3 привила:
1. написал — тестируй
2. не делать «на живую»
3. выносить в sql минимальную логику

Я сторонник того, что бы грамотно проектировать системы с учетом хотелок в будущем + всю логику делать максимально простой и минималистичной.

К тому же документацию ни кто не отменял.

lair 2 июл 2012 в 16:23

Третье правило противоречит подходу «все что можно перенести на сторону sql сервера — переносим».

К тому же документацию ни кто не отменял.

Документация устаревает мгновенно.

psman 2 июл 2012 в 16:27

Добавьте 4 правило, за невыполнение которого нужно бить по рукам:
4. Написал/изменил код — задокументируй. Если не задокументировано, то тестерам непонятно что тестить — отбирай печеньки у программиста. Не задокументировано тестировщиками — лишить печенек их.

Четкая структура и правила… и опять же рас%;;%во не имеет отношения к триггерам.

п.с. я не говорю про более сложные системы, которые можно написать вынеся и более сложную логику в БД (выполнение по расписанию, пересчет значений целых таблиц и т.п.)

retran 2 июл 2012 в 16:37

Ничего, что стоимость поддержки, версионирования и так далее такой документации чуть ли не выше стоимости разработки кода по ней? Особенно перед дедлайном.

Мы же не про интернет-магазины говорим, а про что-то большое и серьезное?

abyrvalg 2 июл 2012 в 16:43

Вообще, стоимость разработки _кода_ это чуть ли не самая мелкая статья затрат. Основной бюджет съедает покупка софта/железа и проектирование. На кодирование должно отводиться, если не ошибаюсь, не более 20% времени. К моменту начала кодирования должны быть проработаны и задокументированы все структуры, модули и API.

retran 2 июл 2012 в 16:45

К моменту начала кодирования должны быть проработаны и задокументированы все структуры, модули и API.

Не взлетит. К моменту начала кодирования и в его процессе требования стопицот раз поменяются/уточнятся.

abyrvalg 2 июл 2012 в 16:57

Да какие проблемы: за ваши деньги — любой каприз :)
А если серьёзно, то именно это и должно заставлять нормально документировать систему. Я лично не могу удержать все связи проекта в голове и никогда не дам гарантию, что изменив модуль А мы не поимеем проблемы в модуле Д, причём, опосредованно через модули Б и В. Нужна дока, обязательно.

lair 2 июл 2012 в 16:59

В том-то и дело, что дока не поможет, потому что никто не будет успевать ее обновлять.

Поэтому:
— изолированное тестирование
— функциональное тестирование
— отслеживание зависимостей с помощью специальных средств
— соблюдение контрактов и LSP

abyrvalg 2 июл 2012 в 17:14

С другой стороны, что такое тесты, как не формализованное описание требований из доки? Тесты же вы успеваете обновлять?

lair 2 июл 2012 в 17:16

Тесты описывают поведение на уровне контракта (если это unit-тесты) или бизнес-сценария (если функциональные). Это те места, которые меняются реже других.

И да, изменение тестов — это дешевле, чем изменение документации и тестов.

abyrvalg 2 июл 2012 в 17:25

Что в итоге отдаётся заказчику? Неужели набор тестов?
На счёт цены, конечно, соглашусь.

lair 2 июл 2012 в 17:30

Заказчику отдается система, очевидно.

abyrvalg 2 июл 2012 в 17:35

Поставим вопрос по другому: нужна ли заказчику система в виде чёрного ящика? Т.е. примет ли он её?

psman 2 июл 2012 в 17:38

Как не странно, но в 99% случаев «черный ящик» принимается (любая покупка ПО). Мало кто из заказчиков понимает вообще зачем им 3 копии по 1200 страниц некой документации + электронная вики.

lair 2 июл 2012 в 17:47

Зависит от условий контракта. Но в любом случае написать документацию на систему на момент ее сдачи проще, чем постоянно поддерживать актуальную документацию в процессе разработки.

psman 2 июл 2012 в 17:51

70% документации нужно и самим разрабам, остальное в процессе, так как описываются «детали».
Любое изменение в коде — это работа программиста за которую нужно платить:
1. нужна причина
2. нужно обоснование
3. почему начальный код написан не верно
4. нужно описание «как оно на самом деле должно быть»

т.е. переделки кода в любом случае проходят через ведущего разраба и тех. писателя

lair 2 июл 2012 в 17:59

Вы почему-то не замечаете разницы между документацией на код и документацией на задачу. Хотя это разные вещи.

psman 2 июл 2012 в 18:01

Я сливаю эти два понятия. Т.е. мыслю не листами бумаги, а перекрестными ссылками и метатегами.

lair 2 июл 2012 в 18:08

А зря. Это два совершенно разных массива информации (хотя они и связаны ссылками). Но порядок возникновения у них весьма конкретный.

psman 2 июл 2012 в 18:13

Можно тогда отделить еще и «технические» ТЗ и т.п. вещи, но порой смысла в этом нет.
У каждой фирмы свои методологии разработки.

psman 2 июл 2012 в 18:20

О, да, есть еще менеджер, который следит за сроками и затратами денег. Как раз он орет на ведущего разраба за переделки.

retran 2 июл 2012 в 16:59

Одно дело — документация верхнего уровня (ER, слои, инфраструктура). Она нужна, конечно. И меняется медленно.

Совсем другое дело — документировать каждый класс, функцию, триггер и так далее.

abyrvalg 2 июл 2012 в 17:13

Не, я совсем не призываю документировать всё подряд до самой мелочи. Сам в этом случае ограничиваюсь небольшим описанием подпрограммы и общими комментариями по коду, чтобы можно было понять суть, просто пролистывая его. Ну и в местах, где пришлось подумать, записываю причину выбора именно такого варианта, чтоб самому потом дважды не думать «зачем так, можно же по другому?»

psman 2 июл 2012 в 17:17

Расписывать все до мелочи — есть свой плюс:
Когда другой человек в него полезет, то ему будет понятно ВСЕ без чтения пары страниц документации.
Например в ходе работы в какой нить системой выяснилось, что контроллер глючит, если приходят пакеты не по 8 байт, а если первый байт равен 0, то что бы пакет был более 12 байт.
Это лучше написать в коде (в вики дубль), так как если что нужно поменять по мелочи, то лучше видеть эти данные, чем «лопатить» раздел «особенности».

retran 2 июл 2012 в 17:19

Вы считаете, что документация на протокол передачи данных (который, конечно же, должен быть полностью документирован) и документация на код — это одно и то же?

psman 2 июл 2012 в 17:24

Я считаю что нужно разумно подходить как к документированию, так и к коду.
Если целесообразно какие то комментарии выносить в код, то это делается.
Более полная инфа есть в документации, но не всегда целесообразно не потратить пару минут времени на пару строк в коде, а заставлять программиста, которому надо поменять пару строк кода, читать 100 страниц доков.
Есть информация, которая касается архитектуры приложения, а есть локальная.

psman 2 июл 2012 в 16:48

Да, от себя добавлю, что в идеале программисту на руки в тикет системе должно попадать нечто вроде:

protected function beforeDelete()
{

/*
ссылка на документацию что надо сделать
ссылка на описание нужных данных в БД
ответственный за подсистему из архитекторов
*/
}

lair 2 июл 2012 в 16:54

В идеале — да.

lair 2 июл 2012 в 16:55

Извините, оборвалось.

В идеале — да, должно. Но в реальности у вас нет столько проектировщиков, чтобы заниматься такой декомпоновкой.

psman 2 июл 2012 в 17:00

Печально.

lair 2 июл 2012 в 16:54

Поддержки и анализа у вас в статьях затрат, я смотрю, нет. Показательно.

К моменту начала кодирования должны быть проработаны и задокументированы все структуры, модули и API.

Waterfall? Очень круто, да, только в жизни я его последние десять лет не видел, ни один бизнес не соглашается так работать.

psman 2 июл 2012 в 16:59

А при чем тут бизнес?

У вас в фирме, допустим, есть несколько ведущих разрабов, архив, аналитиков. Они выдают шаблон приложения/системы.
Если говорить конкретно про организацию рабочего процесса, то есть системы позволяющие нагнать джуниоров/сеньеров как своих, так и фрилансеров и каждый получает свою минизадачу (видит только свою статью, только свои рабочие файлы и т.п.). В это же время есть оценка задачи по сложности и есть желаемые сроки выполнения ей + ее цена.

Каждый исполнитель-программист знает свою скорость в поинтах, сколько он может успеть сделать за месяц=сколько он может заработать.
Менеджер проекта понимает общую скорость работы, процент выполнения проекта, легко нанимает людей и подключает к процессу.
Программеры пишут код когда им хочется, а не с 9 до 18.
Профи программеры пишут код «запоями» и помногу, от этого имеют большую зарплату.

lair 2 июл 2012 в 17:01

Они выдают шаблон приложения/системы.

На основании чего?

psman 2 июл 2012 в 17:04

На основании всего (неправильный вопрос).
Есть хотелка клиента по системе, есть общая архитектура, есть проработанный план что и как будет делаться, есть документация — начинать делать основу уже можно: наметить модули, функционал, описать данные передаваемые и т.п…

lair 2 июл 2012 в 17:06

Чтобы был проработанный план, надо собрать требования. А собрать до начала разработки требования в таком объеме, чтобы можно было запроектировать все, включая API, не удается.

psman 2 июл 2012 в 17:12

Кому не удается?
Пока не готово ТЗ ни одной строки кода не появится.
Переписывать код в процессе по причине «а, я вот еще у конкурента подсмотрел» — это недоработка разработчиков системы на начальном этапе.
Если мы говорим про сложные системы, например учет энергопотребителей, платежные системы и т.п., но пока не будет все проработано до мелочей трогать код вообще не имеет смысла (только для организации тестов чего либо)

lair 2 июл 2012 в 17:13

Кому не удается?

Аналитикам/РП. Повторюсь, я вот за десять лет такого ни разу не видел.

То есть несомненно, «пока не готово ТЗ, ни одной строки кода». Но как только ТЗ попадет к разработчику, сразу выяснится, что в нем есть миллион и одна ошибка.

psman 2 июл 2012 в 17:19

У Вас ТЗ — это просто куча текста или собраный прототип или что?

retran 2 июл 2012 в 17:20

Текст + набор диаграмм.

psman 2 июл 2012 в 17:25

А прототипы системы собираете?? UML?

retran 2 июл 2012 в 17:32

UML — по необходимости.
Прототипы — смотря что под ними понимать.

lair 2 июл 2012 в 17:22

Требования — это совокупность текста и картинок в первую очередь.

psman 2 июл 2012 в 17:31

Главное не забыть еще раздел с общим текстом «нафига оно нам нужно». По практике иногда выходит так, что заказчику после прочтения данного раздела показывается более простое элегантное решение, чем он напридумывал. Часто предварительное ТЗ представляет собой нечто весьма забавное, как копипаст из умных статей собранный в одном месте.

retran 2 июл 2012 в 17:32

Вот тут соглашусь.

lair 2 июл 2012 в 17:35

Вообще-то, это первый и основной раздел требований, business objective.

psman 2 июл 2012 в 17:39

Заказчики разные, и требования «хочу что бы было все зае%;№» — порой встречаются (хорошо, что все рже и реже). :)

lair 2 июл 2012 в 16:40

Написал/изменил код — задокументируй.

«Не взлетит». В том смысле, что никто не будет выполнять. У Хамбла/Фарли это описано в Continuous Delivery. Лучшая документация — это сам код.

Если не задокументировано, то тестерам непонятно что тестить — отбирай печеньки у программиста.

А это банально неверно, потому что тестировщики тестируют по бизнес-кейсам, а не по программистской документации.

SSSurkv 2 июл 2012 в 16:48

Лучшая документация — это сам код.
и
тестировщики тестируют по бизнес-кейсам
=
если тестировщики тестируют не по программерской документации то для них всё ж таки придётся писать отдельное описание кейсов для тестирования и «лучшая документация — это сам код» никак не прокатит.

retran 2 июл 2012 в 16:50

А что ВНЕЗАПНО пишут аналитики?

lair 2 июл 2012 в 16:52

для них всё ж таки придётся писать отдельное описание кейсов для тестирования

Не так. Тесткейсы тестировщики пишут сами. По требованиям. Которые пишут аналитики.

psman 2 июл 2012 в 18:49

Не задокументировал = задача не выполнена = на заплачено.

lair 2 июл 2012 в 19:03

Осталось найти людей, которые будут работать на таких условиях.

retran 2 июл 2012 в 19:04

Легко… Только они это… Триггеры по 1000 строк писать будут.

psman 2 июл 2012 в 19:08

Ммммм, ну да, проще найти 10 говнокодеров, которые нагадили и забыли. :)
Профи нужны.
И опять же повторюсь, документированием занимается тех. писатель по факту принятия кода (в паре с разрабом), код пишут кодеры. Кодет не модет получить задачу без формулирования её разрабом, он де принимает код (если нужно, то отправляет на тестирование) и тех. писатель тут же вносит правки в документацию.
Ни кто не насилует бедных кодеров.

psman 2 июл 2012 в 16:29

Если уровень программиста и умение его читать доки позволяют, то можно в sql вынести все, но, что бы быть готовным к обслуживанию «эникеем» или «веб-мастером» делаются минимальные задачи. В принципе это не значит, что программист поддержки достаточно профессионален что бы читать чужой код и понимать его смысл.

retran 2 июл 2012 в 16:38

Поделитесь, пожалуйста, как вы версионируете код триггеров и хранимок.

SSSurkv 2 июл 2012 в 16:49

точно также как текстовые файлы с кодом на C++ или Java.

retran 2 июл 2012 в 16:51

И никогда никаких проблем с обновлением боевых баз?

psman 2 июл 2012 в 16:53

А вот тут давайте подветку сделаем «а как Вы обновляете боевые базы?»

retran 2 июл 2012 в 16:53

Давайте ;) Я внимательно слушаю ;)

SSSurkv 2 июл 2012 в 17:10

так к вам вопрос-то. В C++/Java текст программ компилируется в бинарный код и выкладывается в определённое место как часть продукта или готовый продукт.

С базами данных у вас не так?

retran 2 июл 2012 в 17:13

Я раньше его задал ;)

Ок. Давайте подробнее. Вот у вас есть некий продукт/система. На продакшене. Работающая.
И тут появляется некий ченджреквест затрагивающий структуру базы.

От бинарного кода это отличается тем, что в бинарном коде на продакшене нет никаких данных, которые нужно сохранить.

psman 2 июл 2012 в 17:14

С базами, особенно боевыми, есть ряд проблем. Особенно когда нельзя взять и остановить БД на время.
Было пара таких систем, там любые не типовые операции с БД превращались в написание кучи кода. Но триггеры там не главное.

retran 2 июл 2012 в 17:16

Т. е. обновляете некими ручными скриптами? Триггеры — одна из частей проблемы.

psman 2 июл 2012 в 17:21

Всегда есть некая очередность действий.
Ситуации разные бывают.
бывает так, что данных море и они быстро пишутся, но мало читаются, тогда ода схема подходит обновления, если наоборот, то другая.

retran 2 июл 2012 в 17:32

Т. е. единого пайплайна обновления нет? Так?

SSSurkv 2 июл 2012 в 17:37

разумеется при простых данных обновляется одним махом. При сложных всё сложнее.

psman 2 июл 2012 в 17:42

Изменение боевых баз — это нетипичная ситуация. В идеале такое должно быть раз в жизни и то не у каждого. Если добавляется пару полей, то это одно, если переделывается ряд таблиц, связей и помимо БД переписан код и т.п., то, согласитесь, ни о каких плановых «как два пальца» речи не идет. Особенно если в БД уже под 90 терабайт данных которые дергаются на чтение по 500 запросов в секунду и серверов более 1-го (хотя бы)

retran 2 июл 2012 в 17:46

Изменение боевых баз — это нетипичная ситуация.

А вот это неправда. В типичном энтерпрайзе базы меняются регулярно.

lair 2 июл 2012 в 17:47

Изменение боевых баз — это нетипичная ситуация.

Что ж я эту ситуацию-то вижу так часто, и по ней даже книжки написаны?

psman 2 июл 2012 в 17:53

Часто меняете архитектуру приложения?? Я обычно это дела, когда или был факап с начальной структурой или когда проект развился и нужно бОльшее. В любом случае переделка архитектуры на боевых серверах — это нетипичная ситуация.
Книг про то как создать стартап тоже море, но самих стартапов как то мало и они умирают.

lair 2 июл 2012 в 18:00

А не надо путать архитектуру приложения и боевые БД. Можно годами не менять архитектуру, но БД будет меняться еженедельно, а можно годами не трогать БД, но архитектура за это время изменится радикально.

SSSurkv 2 июл 2012 в 18:08

всякое бывает. Бывает что новая версия выходит раз в квартал и каждый раз структура данных немного меняется. На сотнях гигабайт это означает запуск целого набора скриптов которые перекладывают данные в течении нескольких часов.

И это средствами SQL т.е. внутри сервера т.е. с очень высокой производительностью. В случае ORM или подобных решений это было бы просто невозможно.

psman 2 июл 2012 в 18:11

А еще больше геморроя, когда мало того, что данные переконвертироваться будут сутками, так еще и новые данные потерять нельзя и запросы надо обрабатывать.
Порой трогать структуру БД все равно что в рейд массив ребилдить.

lair 2 июл 2012 в 18:13

В случае ORM или подобных решений это было бы просто невозможно.

А при чем тут вообще ORM?

SSSurkv 2 июл 2012 в 18:16

orm это часто встречающийся пример когда отбрасывают всё что есть бд (триггеры, нормализация, аутентификация) и городят собственное с точно такими же функциями.

lair 2 июл 2012 в 18:20

Вы, видимо, плохо себе представляете, что вообще такое ORM, и какие у него функции.

ORM никак не противоречит ни нормализации, ни аутентификации, ни триггером.

lair 2 июл 2012 в 17:14

С БД, очевидно, не так, потому что БД содержит данные, которые необходимо сохранить.

(в отличие от программного кода, который можно просто заменить)

SSSurkv 2 июл 2012 в 17:31

в любой системе есть данные которые необходимо сохранять при обновлении системы.

lair 2 июл 2012 в 17:34

В бинарном коде, о котором вы спрашиваете выше, их нет.

SSSurkv 2 июл 2012 в 17:36

ну так в тексте триггера тоже данных нет. Это просто код который выполняется при определённых условиях. Равно как и скрипт на PHP или скомпилированный C#.

lair 2 июл 2012 в 17:49

Но триггер привязан к БД, в которой эти данные есть. Обновить триггер, не обновляя БД — можно, но в реальности эта задача всегда оказывается не такой тривиальной, как кажется.

psman 2 июл 2012 в 17:54

Еще больше проблем когда нудна определенная последовательность обновления структуры таблиц и триггеров. В принципе как и кода.
Триггеры — это точно такой же код.

SSSurkv 2 июл 2012 в 18:18

код тоже привязан к данным. Нельзя же взять и поменять (в простейшем случае) имя таблицы с orders на workorders но оставить без изменений код. Равно как и наоборот нельзя.

lair 2 июл 2012 в 18:20

Имя таблицы — не данные.

psman 2 июл 2012 в 18:22

Имя таблицы — это такие же данные. Код привязан к этим данным.

lair 2 июл 2012 в 18:26

Имя таблицы — не данные, а структура. Тот же код. Данные — это то, что в ней лежит (и необходимо сохранить для работы пользователей).

psman 2 июл 2012 в 18:30

Да́нные (калька от англ. data) — представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.

Имя таблицы — это данные о том как именуется данная группа данных о неких объектах.

Так же как структура таблицы — это тоже данные.

lair 2 июл 2012 в 18:32

Мы с вами говорим о разных «данных». Я — о тех (и только о тех), которые интересуют бизнес и нужны для достижения бизнес-цели.

SSSurkv 2 июл 2012 в 18:33

тогда какие проблемы? Лежат данные и пусть лежат. Чё их менять-то?

8)

Если поменялись безнес-правила, например раньше поле ИНН было обязательным а стало обязательным — вот тут при обновлении может понадобиться изощрённая логика.

Хоть в триггере это делай, хоть в процедуре, хоть в коде на Ruby.

lair 2 июл 2012 в 18:38

Задача в том, чтобы при изменении структуры/бизнес-логики в БД данные, с которыми работают пользователи, не продолбались.

И это не всегда тривиально.

psman 2 июл 2012 в 18:39

Хоть «девочкам из бухгалтерии» инструкцию пиши.

psman 2 июл 2012 в 16:51

Есть как дампы БД, так и версии в вики.
К сожалению чего либо вроде GitSQL пока не найдено.

retran 2 июл 2012 в 16:52

И как вы ваши дампы деплоите?

larikov 2 июл 2012 в 16:15

> Обычно в среднем проекте все что можно перенести на сторону sql сервера — переносим.

Ужас какой. И никаких проблем еще не было?
А если нужно сменить тип базы данных?

-1

psman 2 июл 2012 в 16:19

Что на что меняем? А если меняем, то сначала меняем, а потом разгребаем что вышло или читаем документацию, думаем, меняем на тестовой машине, проверяем/тестируем, переносим на продакшен.
Невнимательность и криворукость может быть везде. Не в триггерах дело.

abyrvalg 2 июл 2012 в 16:34

Если нужно сменить тип БД, значит у проектировщиков надо отобрать их зарплату, ибо раньше думать надо было. А использовать любую из более-менее продвинутых СУБД просто как хранилище — это совсем не комильфо. В этом случае всё что надо, это mysql 3.23

psman 2 июл 2012 в 16:38

Тогда уж «все что нужно, это sqllite или data.txt» :)
Мне кажется, что многие боятся триггеров, хранимок или вьюх по-тому, что мало с ними работали и в голове нет «чеклиста» с пунктом «глянь триггеры, вьюхи, хранимки». Когда доделываешь 10-20 проект в котором что хранимки, что триггеры бывают по 1000 строк, то к этому момент времени и ответственности больше и опыта и понимания, что даже конфиг nginx может быть сооовсем непростым.

retran 2 июл 2012 в 16:42

что триггеры бывают по 1000 строк

Это феерично. Не знаю даже что написать. К Макконнелу — лечится!

abyrvalg 2 июл 2012 в 16:47

ОМГ… Выкиньте вы эти триггеры на 1000 строк. У вас там что, лапша из

if product_id = 1 then discount_pcnt = 5
if product_id = 2 then discount_pcnt = 3
...
if product_id = 100500 then discount_pcnt = 10

?

Переведите в нормальный вид, пожалуйста…

abyrvalg 2 июл 2012 в 16:48

Извиняюсь, промазал.

VolCh 2 июл 2012 в 18:58

Лично я их ~~боюсь~~ избегаю потому что нет удобных инструментов разработки, тестирования, отладки, версионирования и т. п.

psman 2 июл 2012 в 19:02

С версионностью — костыли в виде вики.
Для разработки есть инструментарий достаточно удобный, тестировать/отладка — не проблема вообще при мелких тригерах (счетчики, изменение данных по мелочи). При больших триггерах помогают схемы на листах бумаги «где что меняется». При сложных структурах получаются более сложные схемы, но не сложнее чем разработка архитектуры приложения.

Тут как и программирование на ассемблере. Ради производительности приходится напрягать голову, но, поверьте, затраты окупаются.

retran 2 июл 2012 в 19:06

Тут как и программирование на ассемблере. Ради производительности приходится напрягать голову, но, поверьте, затраты окупаются.

Охохохо… Вот, например, задача о том, как эффективно раскидать значения по регистрам/хипу/стеку — NP-полная. Современный компилятор ее решает заведомо лучше.

Это, конечно, не в тему статьи, а так — про мифы и неверные аналогии.

-1

tchaynik 2 июл 2012 в 16:36

Может и стореды тогда не использовать — вдруг новый тип базы не будет их поддерживать.?

abyrvalg 2 июл 2012 в 16:28

Никогда не делайте логику на триггерах, кроме каких-нибудь совсем элементарных вещей. Замучаетесь потом проблемы разгребать. Была у меня одна немаленькая система, целиком построенная на триггерах. Это адЪ. Особенно весело ловить ошибку «таблица мутировала», когда она возникает в результате цепочки из нескольких триггеров, которые «вызывают» друг друга.
Да, это всё решаемо, но поверьте вышеотписавшимся — не пихайте бизнес-логику в триггеры.

psman 2 июл 2012 в 16:30

В чем проектировалась БД и как отслеживали причину сбоя?

abyrvalg 2 июл 2012 в 16:36

На все типовые операции у меня были полуавтоматические тесты с очень подробным логгированием. Так что отследить ошибку было довольно просто. Другое дело, что раздражало это всё очень.

psman 2 июл 2012 в 16:39

Нормальная практика автотестов. А раздражение от сбоев — это особенности профессии.

abyrvalg 2 июл 2012 в 17:23

Как раз нет. Раздражение было именно из-за архитектуры системы.

psman 2 июл 2012 в 17:26

Не проработанная архитектура которая кучу раз переписывалась?

abyrvalg 2 июл 2012 в 17:32

Я согласен с некоторыми Вашими высказываниями в комментариях, но по теме топика мы не сойдёмся никогда. И именно потому, что архитектура, целиком построенная на триггерах, не может быть стройной. Просто в силу природы триггеров. Да, она может быть рабочей, но только ценой большой черезжопицы. По-моему, Ваши триггеры по 1000 строк это доказывают.

-1

SSSurkv 2 июл 2012 в 17:34

а десяток модулей по 1000 строк использующий ORM и выполняющий точно такую же функцию что доказывает?

abyrvalg 2 июл 2012 в 17:38

Не могу ответить,.т.к. не люблю ОРМ

psman 2 июл 2012 в 17:36

Целиком строить на триггерах так же глупо как и целиком строить на коде.
К сожалению пример с 1000 строками малость сбил с правильных мыслей, но поверьте мне, все 1000 строк триггера или хранимки придуманы и написаны не одним человеком, а группой специалистов которые разобрали все плюсы и минусы и понимают всю долю ответственности за свое решение.

SSSurkv 2 июл 2012 в 16:37

статья хорошая, примеры наглядные но можно бы рассмотреть более однозначную задачу. Например историю изменений — поменял кто-то данные и триггер сам вставил в таблицу пометку кто и когда правил. Это будет делаться независимо ни от внешних программ, что недостижимо другими средствами.

Тут многие считают что десяток таблиц в запросе это архисложно, но тысячи строк кода с использование ORM это почему-то лучше — заминусуют.

lair 2 июл 2012 в 17:31

Например историю изменений — поменял кто-то данные и триггер сам вставил в таблицу пометку кто и когда правил.

Мне вот всегда было интересно: а откуда триггер возьмет информацию о том, кто правил?

SSSurkv 2 июл 2012 в 17:33

SQL-сервер это такая штука в которой очень-очень много всего есть.

lair 2 июл 2012 в 17:45

SQL-сервер это такая штука в которой очень-очень много всего есть.

Я в курсе. Но информации о том, какой именно пользователь работает в приложении (независимо от внешних программ, как вы сам написали), в нем нет.

SSSurkv 2 июл 2012 в 18:03

есть.

Но можно этим не пользоваться а городить собственную подсистему аутентификации и работать всем юзерам из-под админского логина.

Дурное дело нехитрое.

lair 2 июл 2012 в 18:10

Не из-под админского, а из-под серверного.

А вы как предлагаете? Заводить в SQL пользователя на каждого пользователя системы? А если их двадцать миллионов? И при этом как — для каждого пользователя строить свое подключение к БД на основании его данных? И как? Пароль для подключения откуда возьмем? У пользователя спросим? Или будем доменный эккаунт имперсонировать на сервере?

Это все хорошо работает, пока у вас двухзвенка с толстым клиентом. Но вот стоит начать работать с трехзвенкой или вебом, как все это рушится к чертовой матери.

SSSurkv 2 июл 2012 в 18:23

А почему нет? Где тогда хранить эти двадцать миллионов пользователей? В текстовом файле?

SQL-сервер предоставляет кучу средств для всего. Можно конечно это всё выбросить и написать собственные костыли. Но зачем тогда SQL-сервер?

-1

abyrvalg 2 июл 2012 в 18:29

Вообще, создание сессии в СУБД — это довольно накладная операция. В случае с вебом стопицот пользователей и постоянный переконнект дадут слишком большую нагрузку. Здесь действительно дешевле держать пул соединений от одного «системного» пользователя и иметь свой слой аутентификации/авторизации.

lair 2 июл 2012 в 18:30

А почему нет?

Например, потому что некоторые SQL-сервера начинают падать тысячах так на пятнадцати-двадцати пользователей.

Где тогда хранить эти двадцать миллионов пользователей?

Например, в AD. Или в таблице.

SQL-сервер предоставляет кучу средств для всего.

Надо только очень хорошо осознавать границы их применимости.

Вы попробуйте ответить на вопросы в комменте выше.

SSSurkv 2 июл 2012 в 18:38

отвечаю, хехе

— если даже SQL-сервер падает на 15 тысячах пользователей и другое вполне себе упадёт

— современные SQL-сервера вполне себе интегрируются с Active Directory и аутентифицируют с её помощью (а если пользователей хранить в таблице то никаких проблем брать из этой таблицы пользователя триггером, т.е. про недоступность логина это лукавство)

— по границам применимости — именно! За Oracle платят сотни тысяч не потому что он такой красивый а потому что использование его возможностей значительно сокращает сроки разработки и удешевляет поддержку.

-1

lair 2 июл 2012 в 18:44

если даже SQL-сервер падает на 15 тысячах пользователей и другое вполне себе упадёт

Удивительно, но не падает. Вот удивительно. Но не падает.

современные SQL-сервера вполне себе интегрируются с Active Directory и аутентифицируют с её помощью

Угу. Только если вы так захотите работать с каждым пользователем индивидуально, вам придется для любой трехзвенки (и для веба как частного случая) настраивать делегацию, и я вас уверяю, это редкостный геморрой и работать это будет только в сильно ограниченных условиях. У нас сейчас сделано именно так, и поэтому я хорошо знаю, о чем говорю.

Вы не ответили на вопрос, что делать с подключениями в БД. Да, в условиях трехзвенки.

SSSurkv 2 июл 2012 в 18:52

я считаю что ответил

lair 2 июл 2012 в 19:05

Простите, я, наверное, слепой, но не вижу вашего ответа.

На всякий случай, повторю вопросы:
— что вы собираетесь делать для каждого пользователя — создавать новое подключение по его личным данным для соединения?
— как вы собираетесь аутентифицировать пользователя на сервере БД — передавать пароль или имперсонировать доменную запись?
— если второе, то как вы будете решать проблемы с делегацией (в особенности для веб-сценариев)?

SSSurkv 2 июл 2012 в 19:09

http://habrahabr.ru/post/146717/#comment_4950583

рекурсия

lair 2 июл 2012 в 19:12

Там нет конкретного прямого ответа ни на один из вопросов.

Уже или признайтесь, что вы этого в таких масштабах не делали, или расскажите, как делали.

psman 2 июл 2012 в 17:34

Если возможно, то из вставляемых данных. Части в запросе есть Id пользователя совершающего действие: пользователь создал запись в блоге, добавил картинку, написал комментарий и т.п.

lair 2 июл 2012 в 17:50

А если невозможно (данные не содержат прямого указания на пользователя)?

psman 2 июл 2012 в 17:55

Ну я не могу заставить sql прочитать сессию, по ней сделать запрос на них пользователя и сохранить его в лог… или могу :)

lair 2 июл 2012 в 18:00

Не можете.

Отсюда мораль: нельзя сделать историю изменению только на стороне сервера БД, не меняя код приложения.

abyrvalg 2 июл 2012 в 18:01

Вот, например, что знает о пользователе оракл: docs.oracle.com/cd/E14072_01/server.112/e10820/dynviews_3016.htm

OSUSER 		VARCHAR2(30) 	Operating system client user name
PROCESS 	VARCHAR2(24) 	Operating system client process ID
MACHINE 	VARCHAR2(64) 	Operating system machine name
PORT 		NUMBER 		Client port number
TERMINAL 	VARCHAR2(30) 	Operating system terminal name
PROGRAM 	VARCHAR2(48) 	Operating system program name
TYPE 		VARCHAR2(10) 	Session type

psman 2 июл 2012 в 18:06

Если к ораклу обращается один и тот же демон, то пользы от этих данных почти ни каких.

lair 2 июл 2012 в 18:11

Это оракл знает о том, кто к нему обращается. Теперь представьте, что к нему обращается веб-сервер. Много пользы вам от этих переменных будет?

abyrvalg 2 июл 2012 в 18:25

От этих — нисколько. Я всё-таки повторю вопрос, который задал ниже: «На уровне приложения он же как-то аутентифицируется?» Что-то же мы знаем об этом пользователе, хоть ИПшку? Не важно на каком уровне: БД или приложения.
Если знаем, и всё ещё продолжаем говорить на примере оракла, то в нём есть очень удобная вещь: контексты (типа переменных окружения), которые вполне позволяют обойтись одним кодом для различных вариантов подключения.

lair 2 июл 2012 в 18:32

Не важно на каком уровне: БД или приложения.

Важно. Потому что если мы знаем это только на уровне приложения, логировать в БД мы это не можем.

Если знаем, и всё ещё продолжаем говорить на примере оракла, то в нём есть очень удобная вещь: контексты (типа переменных окружения)

Да они много где есть, только их должно заполнять приложение. Что возвращает нас к тому, что приложение должно предпринять некоторые действия для того, чтобы работал якобы универсальный код на стороне БД.

abyrvalg 2 июл 2012 в 18:50

Ну конечно должно! Про универсальность я имел в виду именно то, что написал: «один [субдшный] код для различных вариантов подключения». Варианты подключения: толстый клиент, внутриСУБДшные процессы, веб. В случае с вебом, естественно, сервер приложений должен предоставить базе некоторую свою информацию.

Если же речь про то, что всё это не надёжно, сервер приложений можно поломать, сессию можно увести, так ведь и пароль честного субдшного пользователя можно подсмотреть…

PS: Перечитал ветку, напоминает разговор после 150 коньяка: все всё понимают, со всем согласны, но продолжают спорить, потому что «хорошо сидим».

lair 2 июл 2012 в 19:10

Так вот, топикстартер утверждал, что «это будет делаться независимо ни от внешних программ».

Я, как бы, часто слышу такую аргументацию за подход с триггерами для логирования, но в реальности еще ни разу это не работало.

abyrvalg 2 июл 2012 в 17:40

Кто, когда, откуда и чем: это СУБД знает отлично.

lair 2 июл 2012 в 17:50

Это в том случае, если у вас пользователь напрямую в БД обращается. А если туда лезет appserver/webserver/вебсервис/нужное вписать — БД про пользователя больше ничего и не знает.

abyrvalg 2 июл 2012 в 18:04

На уровне приложения он же как-то аутентифицируется? Или я уже туплю и не понял сути разговора?

lair 2 июл 2012 в 18:12

На уровне приложения он (пользователь) аутентифицируется. Но это информация приложения, ее нельзя прозрачно и независимо от приложения получить на сервере БД и записать в лог доступа.

abyrvalg 2 июл 2012 в 18:32

Приложение обязано сообщить эту информацию СУБД перед началом своих тёмных делишек.

lair 2 июл 2012 в 18:33

После этого утверждения фраза о том, что «Это будет делаться независимо ни от внешних программ» можно выкинуть в утиль. О чем, собственно, изначально и был спор.

abyrvalg 2 июл 2012 в 19:06

Есть АПИ, есть определённые предварительные процедуры, которые должен выполнить клиент (не важно какой). Без этого он не получит своих долгожданных данных. Вопрос про аутентичность самого клиента, я надеюсь, в рамках этой ветки не рассматривается.

lair 2 июл 2012 в 19:11

Если клиент должен что-то сделать, то уже нет никакой независимости от клиента. Я именно это пытаюсь продемонстрировать.

vitalets 2 июл 2012 в 16:40

Недавно хотел сделать что-то подобное на триггерах, правда на innodb.
Но потом отказался, когда выяснилось, что в mysql триггеры на каскадном удалении не срабатывают.
Сделал на хранимках.

edogs 2 июл 2012 в 18:32

Триггеры в таком применении, для улучшения производительности плохи тем, что срабатывают каждый раз, особенно если речь об myisam, где лочится таблица, а не строка.
Обычно для решения этой же проблемы делаем
или а) по крону апдейтим счетчики в основной таблице, по крону, а не по триггерам, т.к. крон проще контроллировать и запускать раз на 10 комментариев например, а не на каждый.
или б) для счетчиков выделяется полностью отдельная таблица, занимающая мало места, только ид*нум_комментс*_нум_виевз, без всяких текстовых и прочих лишних полей.
или в) комментарии из таблицы комментариев пишутся так же в таблицу без комментариев такой же структуры. одним запросом больше при записи, но зато кол-во комментариев выгребать в случае чего намного быстрее и проще можно.

psman 2 июл 2012 в 18:47

Раз в минуту запускать крон — это не проблема.
Проблема в том, что опять же, мы выполняем хз какой код (чаще всего интерпретируемый), делаем выборки, прокачиваем данные из БД в приложение (слава богу если там их немного и сеть/число коннектов позволяет), вычисляем суммы или апдейтим данные… опять же ждать минуту пока данные обновятся — не всегда приемлемо.
Отдельные таблицы — это далее получаем доп запросы или джойны. Чем больше данных, и чем меньше память сервера тем больше желание сделать все более быстрее.
Тип таблицы — это «дело наживное». Какой быстрее работает, такой и будет.
Лишние запросы — это ЛИШНИЕ запросы. В случае с посещаемостью небольшой проблем не вижу, в случае с высокими нагрузками можно и на счет кэширующих систем холивор развести.

-1

edogs 2 июл 2012 в 19:12

прокачиваем данные из БД в приложение

Не обязательно. Даже если забыть о хранимках, то update select никто не отменял.

Отдельные таблицы — это далее получаем доп запросы или джойны. Чем больше данных, и чем меньше память сервера тем больше желание сделать все более быстрее.

Именно — быстрее.
Если Вы выносите кол-во комментов и просмотров (часто обновляющуюся информацию) из таблицы новостей (редко обновляющуяся информация), то таблица новостей (огромного размера) перестает у Вас дергаться с дикой частотой (особенно если Вы просмотры логируете), а дергаться начинает мелкая таблица (со страшной скоростью, в меру ее размера), как следствие ускоряется и апдейт и сортировка и выборка… особенно по кол-ву комментариев/просмотров.

Тип таблицы — это «дело наживное». Какой быстрее работает, такой и будет.

Разница в типах локов таблиц это наживное дело?

Лишние запросы — это ЛИШНИЕ запросы.

А быстрые запросы — это БЫСТРЫЕ запросы. Вчера были маленькие но по 2, а сегодня большие но по 5:)

в случае с высокими нагрузками можно и на счет кэширующих систем холивор развести.

То о чем мы говорим, это не кэширование. Тут нет редких выборок и дублирования данных и нет ситуации когда все дружно начинают лезть в кэш, в общем как раз нет типичных проблем кэширования. Просто часто обновляемые данные выносятся в отдельный блок для более быстрой с ними работы, по сути все не статические данные хранятся в отдельной таблице, это скорее можно сравнить не с кэшированием, а с простановкой индексов если уж на то пошло.

-1

psman 2 июл 2012 в 21:27

Если Вы выносите кол-во комментов и просмотров (часто обновляющуюся информацию) из таблицы новостей (редко обновляющуяся информация), то таблица новостей

А зачем мне дергать таблицу отдельную без самих новостей? статистику и в гугле/метрике посмотрю, апачтоп, на худой конец.

На одной чаше весов дергать 2 таблицы при показе статьи/ленты статей, на другой дергать всего 1 таблицу… хм… если вывод статей в приоритете, то второй вариант. Если нам надо часто считать статистику, то первый.

Просто часто обновляемые данные выносятся в отдельный блок для более быстрой с ними работы
Если статистику выбираем часто, то да, соглашусь.
Речь идет о том, что мы должны быстро отдавать контент с максимальной скоростью… да и в принципе триггеры — это удобно и меня использование их не парит более чем пара строк на каком нить языке. Если я могу сделать так, что при отключении света у меня аварийная подсветка загоралась, я сделаю это. Бегать в темноте за свечками или хранить по фонарику в каждой комнате — это не для меня.

-1

edogs 2 июл 2012 в 22:14

статистику и в гугле/метрике посмотрю,

То есть Вам нравится идея еще более кардинального выноса статистики:) Вы не согласны только с половинчатым решением?:)

На одной чаше весов дергать 2 таблицы при показе статьи/ленты статей, на другой дергать всего 1 таблицу… хм… если вывод статей в приоритете, то второй вариант. Если нам надо часто считать статистику, то первый.

Но плечи у этих весов разные.

Речь идет о том, что мы должны быстро отдавать контент с максимальной скоростью…

Именно поэтому и предлагаем как альтернативу — работу с небольшими объемами данными для скорости.

-1

psman 2 июл 2012 в 23:45

Нужно отдавать страницу С рейтингом и числом комментариев. В данном случае одна таблица целесообразнее.

-1

psman 2 июл 2012 в 19:14

Разница в типах локов таблиц это наживное дело?
Как надо так и делается. Разные типы таблиц имеют разные плюсы и минусы.

-1

yorick_kiev_ua 2 июл 2012 в 23:13

OMG! Про то как это поддерживать уже озеро слёз налили выше. Я добавлю еще: а какая прелесть это отлаживать!.. Неведомая лажа из-за того, что что-то кто-то изменил и ВНЕЗАПНО сработал забытый триггер, который вызывает хранимку, побочным эффектом которой запуск другого триггера и так дальше по цепочке подарит самые незабываемые впечатления любому разработчику.

>>все что можно перенести на сторону sql сервера — переносим.

А уж как подходит SQL для бизнес логики — это сказка.

Брррр…

-2

psman 2 июл 2012 в 23:49

Внезапно тригеры не возникают. Всего 3 события + не стоит городить много тригеров, а лучше объединять. Ну и на все есть инструментарий по проектированию, документация, блок-схемы. Согласен, что когда триггеров много, то если сразу лезть в код, то можно схватить проблем.

yorick_kiev_ua 3 июл 2012 в 00:43

>>Согласен, что когда триггеров много, то если сразу лезть в код, то можно схватить проблем.

Угу. О чём и речь. «Не лезь в код, можно схватить проблем» — прекрасная характеристика подобного подхода.

-1

psman 3 июл 2012 в 00:47

Речь о том, что если показали как молотков гвоздь забить, то всю жизнь и забивают, а о том, что есть шурупы, клей и т.п. не в курсе или боятся использовать «а вдруг я пальцы склею».

-1

lair 3 июл 2012 в 10:35

не стоит городить много тригеров, а лучше объединять

Вообще, это нарушение SRP. Когда каждый триггер отвечает за одну прикладную функцию, в случае чего хотя бы понятно (а) где искать (б) что отключать с минимальными последствиями.

psman 3 июл 2012 в 12:49

Лучше 1 триггер на одно событие, по опыту, чем 100 триггеров на одно и тоже событие и получить еще и проблемы с последовательностью выполнения их.

-1

lair 3 июл 2012 в 12:53

Во-первых, они должны быть независимы от последовательности выполнения, иначе вы замучаетесь их отлаживать.

Во-вторых, нарушение SRP чревато большими проблемами. И это вы говорили о правильной архитектуре и проекте?

psman 3 июл 2012 в 12:59

Я может вас не так понял, но я имел в виду то, что, если взять мой пример, увеличение счетчика комментариев и добавление записи в ленту новостей лучше разместить в одном триггере. Поддержка чуть ухудшается, то если городить нечто новое, то лучше проверить это вынеся в отдельный триггер. Пока не будет идеального инструмента по отслеживания всех триггеров, группировки их и т.п. не читая документацию поддерживать что либо сложно в любом случае.

-1

lair 3 июл 2012 в 13:44

если взять мой пример, увеличение счетчика комментариев и добавление записи в ленту новостей лучше разместить в одном триггере

SRP плачет.

Пока не будет идеального инструмента по отслеживания всех триггеров, группировки их и т.п. не читая документацию поддерживать что либо сложно в любом случае.

Вот именно поэтому и стараются всю логику переносить в сторону платформ, где такие инструменты есть.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Триггеры — спасители

Комментарии 183

Публикации

Истории