SSul Dec 13 2018 at 10:27

Рождественская история

12 min

6.6K

SimbirSoft corporate blogSQL*Microsoft SQL Server*

+28

Comments 23

periskop Dec 13 2018 at 11:34

Вы молодцы.

Я думаю, не стоит объяснять, что режим simple используется только в разработке, на тестовых серверах и его использование в продакшене — недопустимо. Вообще никак.

А вот тут я бы не был столько категоричным, все зависит от обстоятельств.

UFO just landed and posted this here

SSul Dec 13 2018 at 11:41

В принципе да, согласны — есть кейсы, когда это нормально, но в контексте нашего случая, когда система работает в OLTP режиме — это не вариант.

periskop Dec 13 2018 at 11:45

В такой формулировке согласен полностью.

periskop Dec 13 2018 at 11:45

Еще вопросы, если не возражаете.

А по другим клиентам настроили мониторинг бэкапов?
Какие именно рекомендации по обслуживанию БД были выданы?
Удалось ли выяснить, почему падала виртуалка?
Что бы за гипервизор? Что использовалось в качестве хранилища?

SSul Dec 13 2018 at 11:53

Да, первым делом проверили бэкапы и настроили мониторинг для всех self-hosted клиентов. Для тех же, кого хостим сами — всё было настроено изначально.

periskop Dec 13 2018 at 11:58

Я добавил еще вопросов. Было бы интересно получить ответы.

SSul Dec 13 2018 at 13:25

А по другим клиентам настроили мониторинг бэкапов?
— Ответили выше.
Какие именно рекомендации по обслуживанию БД были выданы?
— Перевести модель восстановления БД в режим full, мониторить состояние бэкапов, выполнять бэкапы с проверкой CHECKSUM и проверять бэкапы после создания RESTORE VERIFYONLY. Также, рекомендовали регулярно проводить восстановление из бэкапов на специальном стенде.
Удалось ли выяснить, почему падала виртуалка?
— Нет, наверняка выяснить не удалось, т.к. доступа к хостовой машине и логам не было, но сложилось впечатление, что в поврежденных секторах диска были не только файлы бд, но и какие-то системные, что и приводило к крашу.
Что бы за гипервизор? Что использовалось в качестве хранилища?
— Это выяснить не удалось, т.к. между IT службой клиники и нашей командой был заказчик в качестве посредника, и не вся информация до нас доходила.

periskop Dec 13 2018 at 14:17

Спасибо! А с индексами как? Руками, Ola Hallengren или еще что-то?

SSul Dec 13 2018 at 14:46

По ситуации: Ola Hallengren отличное и очень гибкое решение, его можно рекомендовать почти всегда, хотя зачастую хватает стандартных тасок rebuild/reorganize для maintenance plan.

little-brother Dec 13 2018 at 11:48

Где хранить файлы конечно тема спорная. Но в данном случае хранение в базе мне видится излишним: если аудио-записи и генерируемые документы (их вообще можно не хранить, а генерировать по запросу) хранились бы как отдельные файлы в файловой системе, то сама база была бы значительно меньше, как и вероятность сбоя (транзакции по обновлению информации по работам минимальны). Создание бэкапа базы было бы простым и быстрым.
А так по сути сами придумали проблему, сами решили.

P.S. Возможно для хранения в базе были какие весомые причины, напр. требования заказчиков.

periskop Dec 13 2018 at 11:54

Если хранить не в БД, будут дополнительные костыли. Но вообще есть такая вещь как FILESTREAM.

UFO just landed and posted this here

little-brother Dec 13 2018 at 12:03

Если в имени файла задавать дату-время, то вопроса о том, когда-какой файл был создан и к какому бекапу он относится, не будет.

SSul Dec 13 2018 at 12:03

Всё верно, на это были требования. Сейчас в БД лежат только документы, аудио хранятся в файловой системе. Но тут скорее проблема не в этом, а промах в администрировании: если бы всё было настроено правильно, не важно какой был бы размер БД и что в ней хранилось.

Kriminalist Dec 13 2018 at 12:51

Я так понял, что клиника данные пациентов в открытом виде хранит, без шифрования?

SSul Dec 13 2018 at 13:26

Открытого доступа к данным нет, аудио файлы на диске зашифрованы. На уровне БД настройки шифрования в разных клиниках различаются, как писали в статье, обеспечение сохранности данных — это зона ответственности клиники.

molec Dec 13 2018 at 13:01

Ух. Если честно, я бы очень не хотел, чтобы аудио файл моих разговоров с врачом бесконтрольно вместе с его расшифровкой летал между кабинетом, клиникой и Вами. Я надеюсь, что данные обрабатываются максимально неперсонализированно, но вероятность проблем с конфиденциальностью сильно больше, чем если бы всего этого не было.

Зачем вообще хранятся историчные аудио, если уже есть их расшифровка? Производятся ли какие-то шаги, чтобы снизить возможный урон? Алгоритм разбора настолько тяжелый, что его совсем нереально запускать на АРМ врача?

SSul Dec 13 2018 at 14:14

Старые аудио удаляются в соответствии в data retention policy.
Сложность расшифровки связана со спецификой и сложностью распознавания медицинской терминологии и для клиники экономически выгоднее отдать транскрибирование на аутсорс, чем делать это своими силами. Это позволяет экономить приличные суммы ежегодно.

Naves Dec 13 2018 at 13:31

Непонятно, почему сразу после выявления ошибок DBCC не скопировали файлы базы. При их копировании сразу бы обнаружили аппаратные проблемы. Пытаться чинить с помощью DBCC базу на поврежденном диске — прямой путь окончательно убить базу. Если нет места, купить в магазине 4тб диск и подключить его куда угодно…

SSul Dec 13 2018 at 14:03

В момент выявления ошибок не было мыслей куда-то копировать файлы, т.к. ещё не было догадок про аппаратные проблемы и мы даже предположить не могли, что могут отсутствовать бэкапы на лайв системе.

Naves Dec 13 2018 at 14:46

<ворчание mode=on>Привыкли уже все работать на виртуалках, отвыкли как ломаются базы при аппаратных проблемах дисков или памяти, или как безвозвратно бьется лог-файл при отключении питания (когда отключают сам бесперебойник), что база не работает уже ни в каком из режимов suspect.
Оставлю ссылку на всякий случай dba.stackexchange.com/a/29758

UFO just landed and posted this here