dpp Apr 12 2008 at 23:56

Кэширование в Django

5 min

28K

Django*

+33

Comments 51

crash Apr 13 2008 at 00:04

При включенном кэшировании всего сайта часто бывает полезно поставить CACHE_MIDDLEWARE_ANONYMOUS_ONLY = True
чтобы включить полный кэш для анонимов, а для остальных использовать блочное/per-view кэширование.

dpp Apr 13 2008 at 00:27

А если у меня нет регистрации и пользователе-зависимой информации? Но, к примеру, блоки рандомно меняются. Мне все-таки кажется что кешировать все подряд не стоит - лучше кешировать то, что действительно нужно.

crash Apr 13 2008 at 00:29

Ну _если_ включено для всего сайта, то тогда это уже обдумано :)

dpp Apr 13 2008 at 00:31

:)
мне просто интересно когда это может быть надо. разве что если на серваке куча сайтов и один из них совсем не меняется...

dpp Apr 13 2008 at 00:24

Как и обещал - статья про кэширование в Django.
Странно у меня получается - делал блог чтоб писать о JavaScript, а пишу, в основном, о Django. Наверное потому, что блог делал на нем и нахожусь под впечатлением. Вот что значит грамотная архитектура!

alrond Apr 13 2008 at 01:25

Еще интересное - это кэширование view-ов и sql запросов, если они не в темплейтах вызываются.
Плюс обновление кэша по сигналам ;)

dpp Apr 13 2008 at 02:12

Про кэширование view-ов я вроде написал вкратце.
Для кэширования sql запросов можно воспользоваться "кэшированием данных":

from blog.models import Article
from django.core.cache import cache
articles=list(Article.objects.all())
cache.set('articles',articles)
articles_cached=cache.get('articles')
print articles_cached

проверил только что - вроде все работает.

На счет обновления кэша по сигналам - действительно я об этом не упомянул. Мне пока хватило инвалидации по таймауту и очистки кэша скриптом генерации public-версии (при изменениях в коде: рестарт апаче, сжатие js и css, пр.).
Но в перспективе - действительно надо :)

dpp Apr 13 2008 at 02:21

UPD: articles_cached[0].get_absolute_url()
тоже работает. так что он подымает полноценный объект.
кодит объекты перед укладкой в кэш он при помощи cPickle/pickle

dpp Apr 13 2008 at 03:03

Еще подумал: хорошо бы для кэширования запросов избавиться от явного использования API кэша.
Вот за пять минут накидал: chachedQuery.py
Хранит в кеше результаты запроса. Ключем является построенный sql запрос, вытаскиваемый из ихнего sql-построителя.
Пример там же.

dpp Apr 13 2008 at 03:05

зы: не забудьте сменить на девелоперской версии строку CACHE_BACKEND = 'dummy:///' на что-нить другое.
я минут 15 тупил че не работает... ;)

dpp Apr 13 2008 at 03:10

очепятался: cachedQuery.py

Svetlyak Apr 13 2008 at 11:31

Да да, напишите про инвалидацию по сигналу. А то ведь комменты к посту в блоге тоже хочется кэшировать, но из надо как раз по добавлении нового коммента инвалидировать.

А на счет подключения разных конфигов, девелоперского и продакшн, я делаю проще. Просто from site_cfg import * в самом конце settings.py.

При этом site_cfg на каждой машинке свой и может переопределять любые опции из settings.py. Таким образом и конфиги разные, и пароль от базы данных в репозитории хранить не надо, что немаловажно если репозиторий публичный.

dpp Apr 13 2008 at 12:32

про инвалидацию:
я пока не нашел полностью устраивающего меня универсального решения. как найду - отпишусь.

на счет site_cfg:
а мне синковать (sync) удобнее, когда на всех машинах одно и тоже.

DevEx Apr 13 2008 at 09:59

спасибо за статью!
пишите ещё у вас это хорошо получается :)

alprk Apr 13 2008 at 10:26

Отличная статья, спасибо, ждем еще :)

glader Apr 13 2008 at 11:14

Спасибо за статью :)
Есть еще вариант, похожий на {% cache 500 sidebar %} - кэширование шаблонных тегов как функций. ИМХО это выглядит более логично.

dpp Apr 13 2008 at 13:17

может быть. но, по-моему, в кэш лучше положить отрендереный кусок нежели дамп объекта который будет каждый раз подыматься, по нему будешь бежать и вставлять куски маркапа... зачем? по мне код и так получается чистый и красивый - не надо бегать по всем пакам templatetags и смотреть не закэшировано ли где чего.

glader Apr 13 2008 at 13:27

Идея в том, что основные тормоза порождает обращение к БД, рендеринг шаблона - мелочи. Поэтому как раз аккуратнее - указать, что кэшируются тяжелые функции, а не весь подряд шаблон.

Kirax Apr 13 2008 at 17:20

Бывает так конечно, но мягко говоря - не всегда.

glader Apr 13 2008 at 17:41

Поделись своим опытом плз. Что у тебя бывает тормознее, чем обращение к БД и прочим внешним ресурсам? Неужели работа самого фреймворка?

Kirax Apr 13 2008 at 19:20

Если база небольшая и правильно оптимизированная, то mysql отрабатывает за 0.001 секунд на простых выборках. А например фреймворки на пхп обычно генерят страницу в лучшем случае за 0.05 на том же железе. Особенно в пхп тормозят темплейтные движки (не считая Blitz, который на C). Насчет питона не знаю, не замерял пока, но даже если он быстрее пхп в разы, разница остается.

Кстати, а как Джанго обрабатывает темплейты? Кэшируется ли где-то результат их парсинга?

glader Apr 13 2008 at 21:16

А, ты про пхп-шные фреймворки... Сорри, про них ничего не знаю. Пj нашим наблюдениям работы с Джангой, кэшировать работу питонских скриптов надо только с самом конце, когда все остальное уже оптимизировано вусмерть :)

glader Apr 13 2008 at 13:28

И кстати еще аргумент: шаблоны и кэширование данных - настолько разные вещи, что лучше их не перемешивать.

dpp Apr 13 2008 at 15:34

да, Вы правы. только прейдется "бегать по всем пакам templatetags и смотреть не закэшировано ли где чего"...

glader Apr 13 2008 at 16:22

Сорри, не понял, зачем "бегать по всем папкам templatetags"? При написании каждого тега можно решить, надо его кэшировать, или нет.

dpp Apr 13 2008 at 17:11

Я говорю с точки зрения поддержки. Например есть сайт, написанный другим человеком несколько месяцев назад. Моей целью является писать так, чтобы разабраться было как можно проще. Просмотрев шаблоны, благодаря наследованию и тегам джанги понять что откуда растет очень просто.

Наверное, кешированию не место в шаблонах. но за джанговцами вроде небыло замещено архитектурных просчетов. зачем они тогда его сделали в виде тега? ведь перемешивание MVC они предусмотрительно запретили... надо почитать дискуссии по этой фишке. ее ведь только что добавили в svnку

glader Apr 13 2008 at 17:42

Точно также можно сказать "бегать по всем шаблонами смотреть не закэшировано ли где чего" :). Потому что кэширование может быть применено не только в базовом шаблоне, но и в потомках.

dpp Apr 13 2008 at 18:53

угу :) но по-моему шаблоны нагляднее. хотя если версаешь не ты сам...

UFO just landed and posted this here

Davert Apr 13 2008 at 12:18

Что-то мне принцип не нравиться, так как параметры кеширования загоняются в сам шаблон. Если нужно поменять таймаут нужно лазить по всем шаблонам где используется данный фрагмент и его менять. Как-то нелогично получается. Да и засорять код всякими cache_ не считаю красивым, имхо удобнее выкинуть это в конфигурационные файлы.

crash Apr 13 2008 at 12:43

Дак некто ж не мешает написать свой CONTEXT_PROCESSOR который будет загонять в переменные нужные времена.

Davert Apr 13 2008 at 12:54

Всё равно оно как-то непрозрачно, а написание отдельного костыля для вполне обыденной задачи тоже как-то не впечатляет. Я сужу только по этой статье, так что если я не прав - не пинайте сильно. Но всё равно, я за отделение конфигурации и кода, и всё-таки было бы лучше если бы фреймворк сам умел это делать.

dpp Apr 13 2008 at 13:13

как описать в настройках что хочешь закэшировать кусок шаблона?
лично у меня никаких идей. ориентироваться на имя блока? а если с параметрами? а если надо хранить несколько версий основываясь на контексте вызова?

Davert Apr 13 2008 at 21:54

Ну я ничего действительно универсального предложить не могу. Действительно подход указывания в шаблоне настроек кеша самый гибкий. Но тут ниже уже говорили, что верстальщикам такая радость не нужна.
Мне действительно кажеться логичнее задавать настройки кеша по имени фрагмента шаблона. Учитывая, что в Джанге есть их наследование, то "хранить несколько версий основываясь на контексте вызова". С параметрами система может кешировать и сама, искусственного интеллекта, чтоб создавать разные кеши под разные параметры не нужно.

UFO just landed and posted this here

dpp Apr 13 2008 at 13:11

на счет таймаута согласен. вот хак - перекрыл стандартный тег cache чтоб он понимал, что если ему не дали таймаута первым параметром его надо взять из settings.py

кстати, чтобы не "лазить по всем шаблонам где используется данный фрагмент" нужно использовать наследование и определять блок один раз.

а на счет "засорения всякими cache_" - не согласен. по-моему там им самое место - сразу видишь что и где кэшируется. да и как описать в настройках что хочешь закэшировать кусок шаблона?

glader Apr 13 2008 at 16:24

"по-моему там им самое место - сразу видишь что и где кэшируется."
Насколько я помню идеологию Джанги, шаблоны делают верстальщики. То есть те, кто не заморачивается за программную часть сайта. Поэтому думать про кэширование - не их компетенция.

dpp Apr 13 2008 at 17:12

действительно, как подумал что это попадется одному знакомому верстальщику - сразу захотелось спрятать кэширование куда-нить подальше... :))

dmmd Apr 13 2008 at 14:36

Что-то я не очень понимаю.



<code>

{% block content %}

	{{ tag.title }}

	{{ tag.text }}

	{% cache 500 article_list tag.id page %}

		{{ block.super }}

	{% endcache %}

{% endblock %}

</code>

Откуда именно здесь появляется список статей? Где именно написан код для доставания его из базы?

dpp Apr 13 2008 at 15:31

Нда, замороченый пример получился.
Ключевая строка - {{ block.super }}. Т.к. список статей и список статей имеющих определенный тег по шаблонам не отличаются я понаследовался от списка статей. Шаблон списка статей (из предыдущей статьи, этому будет равен {{ block.super }}):
{% for article in article_list %}
    «a href="{% url article_view article.id %}"»
    {{ article.title }}
    «/a»
{% endfor %}
Тут тега нет т.к. список статей это основные данные отображения. Но по ленивой природе запросов в бд в django запрос в базу не идет.

Если упростить, то отображения для них будут такими:
@render_to('blog/index.htm')
def index(request):
    article_list=Article.objects.filter(public=True)
    return {
        'article_list': article_list,
    }

@render_to('blog/tag_index.htm')
def tag(request, tag_slug):
    tag=get_object_or_404(Tag, slug=tag_slug)
    article_list=Article.objects.filter(tags=tag, public=True)
    return {
        'tag': tag,
        'article_list': article_list,
    }

dmmd Apr 18 2008 at 19:33

Значит, я правильно понимаю, что фактически исполнение кода article_list=Article.objects.filter(tags=tag, public=True) происходит только когда в шаблоне происходит {% for article in article_list %}?

dpp Apr 18 2008 at 22:44

да. article_list это объект типа QuerySet. запрос в базу отрпавляется при первом обращении к данным (в частности, при итерировании).

dmmd Apr 19 2008 at 12:18

Ага, вот мы и подобрались к тому, о чем моя заметка. ;-) Что, если article_list - не QuerySet, а результат нескольких запросов, да еще и обработанных программой? Автоматически ленивая загрузка тут может не получиться. И именно в таком случае и пригождается возможность подготовить операцию, не выполняя ее.
Ленивая загрузка коллекций у меня тоже есть, но не всегда удается обойтись автоматикой.

dpp Apr 24 2008 at 01:25

тут примерчик явного кэширования запроса. если совсем немного доточить, то можно хранить что угодно.

на самом деле решение предложенного вами примера не очень корректено. article_list - это основные и единственные данные страницы. если нельзя кэшировать всю страницу, то можно вынести их в тег и кэшировать его (при помощи cache_page). получится неленивая загрузка, но код будет выполняться только если данных нет в кэше.

Kirax Apr 13 2008 at 14:56

Спасибо, интересно. Мне только непонятно зачем нужны таймауты. Как по мне, гораздо логичнее сделать таймаут бесконечным и инвалидировать кэш программно при фактическом изменении данных. Возможно ли это в Django?

dpp Apr 13 2008 at 15:39

Согласен. Это просто самое простое решение. В джанге есть сигналы. Можно повесить событие например на сохранение объекта. и в этом событии инвалидировать кэш связанный с сохраненным объектом. вот только если объект встречается во многих местах, то найти и инвалидировать все его кэши не такая тривиальная задача.

Kirax Apr 13 2008 at 16:52

Радует что есть такое. Буду курить доку. :) Вообще я только начал изучать питон и джанго и не могу нарадоваться какой это офигенный фреймворк. В нем есть всё что я долго и безуспешно искал во фреймворках на пхп. Причем на пхп вся эта красота врядли возможна в принципе.

dpp Apr 13 2008 at 17:14

Говорят можно операторы перегрузить... Сам еще не смотрел, но это решило бы много проблем.

Kirax Apr 13 2008 at 17:29

Да.. Осталось добавить настоящую объектность (классы, функции итд как объекты), указание имен параметров при вызове функций, подключения модуля как неймспейс, итераторы, декораторы, генераторы и всё остальное... И получится Питон. :)

Davert Apr 13 2008 at 21:56

Имхо, это ещё тот пример где фреймворки на РНР выглядят достойно :)

umonkey Apr 13 2008 at 19:15

Вот это, по-моему, самое интересное: как привязать используемые объекты к элементам кэша и инвалидировать только то, что действительно изменилось.

Show the best of all time