Pull to refresh
0

Теоретико-информационный подход к анализу воронки продаж в контекстной рекламе

Reading time 10 min
Views 6.2K
По сути этот пост – продолжение статьи о методах кластеризации ключевых фраз в оптимизаторах: зачем нужны оптимизаторы конверсии в контекстной рекламе и почему качество их работы снижается, если они имеют дело с ключевыми фразами, по которым собрано недостаточно статистики (об этом в первых двух частях статьи). Как вариант решения проблемы отсутствия или недостатка данных для прогнозирования конверсии мы рассматривали классический и альтернативные методы пулинга — наращивания статистики по фразе за счет заимствования статистики по другим фразам.

В этом посте старший продакт менеджер Calltouch Федор Иванов расскажет о важности другого подхода к прогнозированию конверсии по ключевым фразам — анализе микроконверсий как ключевых метрик, влияющих на итоговую конверсию на сайте (которую мы будем называть макроконверсией). 

Что нам могут дать микроконверсии?


В повседневной практике мы часто сталкиваемся с понятием «конверсия». Под этим термином мы понимаем некоторое целевое действие, совершенное пользователем на сайте. Примерами таких целевых действий могут быть транзакция, телефонный звонок, отправка заявки, регистрация на сайте и т. д. Какое действие считать конверсионным – это в первую очередь выбор рекламодателя, который он делает исходя из специфики бизнеса, функционала сайта и т. д.

Интуитивно понятно, что конверсия обладает некоторой ценностью, а потому чем больше конверсий происходит на сайте в единицу времени – тем больше выгоды (прямой или косвенной) получает рекламодатель. В этой связи коэффициент конверсии можно рассматривать как долю тех посетителей сайта, которые в конечном счете совершили конверсию, а CPA – как среднюю цену привлечения одного «конверсионного» посетителя.

Итак, данная модель представляет из себя простейшую воронку продаж: на вход в нее попадает вся аудитория сайта, а на выходе – та ее часть, которая совершила конверсию (макро).

Однако в процессе своей «жизни» на сайте посетители могут совершать те или иные действия, которые так или иначе позволяют оценить их лояльность и готовность совершить целевое действие на сайте. Примерами таких действий могут быть:

  • Просмотр не менее 5 страниц сайта
  • Переход в раздел «корзина»
  • Просмотр контактной информации
  • Подписка на рассылку

Такие действия называются «микроконверсиями». Если подытожить, то микроконверсии – это промежуточные действия пользователя на сайте, которые в определенной степени отражают его меру вовлеченности и заинтересованности в предлагаемых товарах и услугах. Если система аналитики, настроена таким образом, что указанные действия отслеживаются, то мы можем значительно обогатить нашу исходную воронку продаж:

При этом очевидно, что статистика по микроконверсиям может копиться в несколько раз быстрее, чем статистика по основным макроконверсиям. Например, пользователей, которые просматривают 5 страниц сайта, значительно больше чем тех, кто приобретает товар. Этот факт позволит существенно ускорить сбор статистики, необходимой для запуска оптимизатора.

С другой стороны анализ микроконверсий позволит отследить слабые места в воронке продаж, что упростит аналитику сайта. Например, если из 1000 посетителей сайта 200 перешли в раздел «корзина», а из «корзины» только 10 оформили заказ, то разумно будет предположить, что форма, где пользователю предлагается оформить заказ, нуждается в переработке и улучшении.

Тем не менее, когда мы приводили определение микроконверсии, мы не зря упомянули, что показатель той или иной микроконверсии «в определенной степени» отражает лояльность пользователя и его готовность совершить макроконверсию. Например, если в качестве микроконверсии выбрана цель «длина пользовательской сессии не менее 10 минут», то высокий коэффициент конверсии в эту цель не обязательно означает высокую конверсионность сайта в целом.

Поэтому важным является вопрос анализа влияния той или иной микроконверсии на макроконверсию. В следующем разделе мы подробно обсудим существующие подходы к такому анализу.

Методы оценки влияния микроконверсий


Самым простым методом оценки влияния одной величины на другую (в нашем случае – микроконверсии по заданной цели на макроконверсию) является корреляционный анализ. Данный подход разработан в одном из разделов математической статистики, науки, которая оперирует со случайными величинами.

Случайной величиной называется событие, которое происходит с определенной вероятностью, которая подчиняется некоторому закону распределения. Поэтому мы абстрагируемся от понятия конверсии и микроконверсии, а будем говорить о случайных величинах $CV_{macro}$ – количества макроконверсий и $CV_i$ — количества микроконверсий по некоторой цели $i$. Значения данных показателей, которые мы наблюдает в любых разрезах (по сайту, по отдельной рекламной кампании и даже по отдельному кейворду) называются реализациями (значениями) данной случайной величины.

Коэффициент корреляции $r$ (линейной корреляции Пирсона) позволяет оценить взаимосвязь случайных величин $CV_{macro}$ и $CV_i$ по их наблюдаемым N значениям (конкретным реализациям). Данная величина принимает значение от -1 до 1. Чем ближе значение $r$ к единице (или к -1), тем более «связаны» (напрямую или в обратной зависимости) случайные величины. Иначе говоря, тем более точно мы можем «угадывать» значение $CV_{macro}$, имея информацию о $CV_i$. В первом случае зависимость прямая:$CV_{macro}\sim CV_i$, а во втором – обратная:$CV_{macro}\sim-CV_i$.

В нашей интерпретации это означает, что если $r→1$, то чем больше произошло микроконверсий $CV_i$, тем больше следует ожидать макроконверсий $CV_{macro}$. Если же $r→-1$, то чем больше произошло микроконверсий $CV_i$, тем меньше следует ожидать макроконверсий $CV_{macro}$.

Примером коррелирующих напрямую случайных величин являются количество пользователей, совершивших покупку и количество пользователей, положивших товар в корзину. Примером обратно коррелирующих случайных величин является количество транзакций и количество отказов.

Коэффициент корреляции позволяет достаточно точно спрогнозировать поведение одной случайной величины относительно другой, однако существует ряд ограничений. Во-первых, объемы выборок (наблюдаемых значений) должны быть достаточно велики (несколько десятков наблюдений), что автоматически не позволит выявить влияние одной величины на другую на микроуровне (например, на уровне ключевой фразы). Кроме того, формулы вычисления корреляции точны только тогда, когда распределения для $CV_{macro}$ и $CV_i$ являются гауссовыми (нормальными). Помимо этого, при расчете коэффициента $r$ используются только наблюдаемые значения, при сглаживании которых (например, пулингом) нарастает систематическая ошибка.

Кроме того, интересен факт, что отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи. Например, зависимость может иметь сложный нелинейный характер, который корреляция не выявляет. То есть широко распространенное мнение, что нулевая корреляция означает независимость событий, является неправильным. Наглядной демонстрацией вышесказанного является следующая картинка:



Над рисунком указан коэффициент корреляции двух случайных величин, а на самом рисунке нанесены значения данных величин. Легко заметить, что корреляция хорошо «предсказывает» только линейную зависимость, не детектируя при этом никакие другие.

Нами был предложен альтернативный подход к анализу микроконверсий, основанный на принципах и фундаментальных понятиях теории информации, который позволяет существенно упростить поиск взаимосвязей между конверсиями разных уровней даже в том случае, если эта зависимость имеет сложный, нелинейный характер.

Что такое взаимная информация?


Взаимная информация – одно из базовых понятий общей теории информации. Определяется она следующим образом: Взаимная информация — статистическая функция двух случайных величин, описывающая количество информации, содержащееся в одной случайной величине относительно другой.

Таким образом, зная распределения двух случайных величин, мы можем вычислить насколько они взаимосвязаны между собой (при любой форме зависимости) с точки зрения того, сколько информации об одном событии (например, макроконверсии) говорит наступление (или не наступление) другого события (например, микроконверсии по некоторой цели).

Общая формула для расчета взаимной информации $I(A;B)$ между случайными величинами $A$ и $В$ следующая:

$I(A;B)=H(A)+H(B)-H(A;B)$

, где $H(A),H(B)$– энтропии величин $A$ и$B$, а $H(A;B)$ – условная энтропия события $A$ при наступлении события $B$. Чуть позже мы рассмотрим способы вычисления каждой из величин, входящих в формулу, но прежде обсудим основные свойства взаимной информации.

• Она симметрична: $I(A;B)=I(B;A)$
• Она ограничена: $0≤I(A;B)≤min⁡[H(A),H(B)]$
• Она равна энтропии, если события связаны любой функциональной зависимостью

Наличие всех указанных выше свойств позволяет считать взаимную информацию хорошим аналогом корреляции при расчете взаимосвязи между событиями. В частности, последнее свойство позволит обнаружить зависимость произвольной природы, но к сожалению установление ее формы является отдельной и достаточно нетривиальной задачей.

Взаимная информация как метрика зависимости событий


Все свойства, которые мы рассмотрели выше, указывают на то, что взаимная информация может быть рассмотрена в качестве метрики между событиями (конверсиями и микроконверсиями). Однако на практике удобно пользоваться нормализованной взаимной информацией:

$I_d(A,B)=1-\frac{I(A;B)}{min⁡[H(A),H(B)]}$

В этом случае $0≤I_d(A,B)≤1$. Причем чем меньше взаимосвязаны величины, тем ближе значение метрики к 1, и наоборот – чем больше наступление одного события говорит о другом, тем ближе метрика к 0. Формулы такого вида часто используются в задачах машинного обучения для отбора значимых признаков (что способствует снижению размерности задачи). Кроме того, подобный подход активно используется в задачах классификации и кластеризации. Мы же предлагаем использовать его для оценки влияния микроконверсии на формирование итоговой конверсии (макро).

Моделирование случайных величин


Так как взаимная информация может быть рассчитана только для случайных величин с заданными функциями распределений, прежде всего необходимо выбрать распределения для $CV_{macro}$ и $CV_i$. В связи с тем, что конверсии (и микроконверсии) происходят независимо друг от друга с некоторыми вероятностями (вероятностями конверсии и микроконверсии) $CR$ и $CR_i$, то лучше всего поведение таких величин описывается при помощи биномиального закона распределения, а именно:

$CV_{macro}\in\{0,1\},\:\: p(1)=CR,\:\: p(0)=1-CR,$

$CV_i\in\{0,1\},\:\: p(1)=CR_i,\:\: p(0)=1-CR_i,$


где под $p(1)$ и $p(0)$ мы понимаем вероятность того, что конверсия (микроконверсия) произошла и вероятность противоположного события соответственно. Такая модель помимо своей простоты удобна тем, что при недостаточном объеме статистических данных, необходимых для расчета $p(1)$ и $p(0)$, данные величины могут быть рассчитаны при помощи метода пулинга (см. ppcworld). Помимо этого, для биномиально распределенной случайной величины $A$ достаточно просто рассчитывается $H(A)$:

$H(A)=-p(0)*log_2⁡p(0)-p(1)*log_2⁡p(1).$

А значит:

$H(CV_{macro} )=-CR*log_2⁡CR-(1-CR)*log_2⁡(1-CR),$


$H(CV_i )=-CR_i*log_2⁡CR_i-(1-CR_i )*log_2⁡(1-CR_i).$

Наибольшую сложность в расчете взаимной информации между конверсией и микроконверсией вызывает расчет условной энтропии, данной проблеме мы посвятим следующий раздел данной статьи.

Расчет условной энтропии


Условная энтропия между случайными величинами $CV_{macro}$ и $CV_i$ может быть рассчитана по формуле:

$H(CV_i,CV_{macro})=–(p(00)*log_2p(0|0)+p(01)*log_2p(0|1)+\\ +p(10)*log_2p(1|0)+p(11)*log_2p(1|1)) $


где:
  • $p(00)$– вероятность того, что клик не привел ни к микро, ни к макроконверсии
  • $p(01)$ — вероятность того, что клик привел к макроконверсии, но при этом не было микроконверсии
  • $p(10)$ — вероятность того, что клик привел к микроконверсии, но при этом не было макроконверсии
  • $p(11)$ — вероятность того, что клик приведет как к микро, так к макроконверсии
  • $p(0|0)=Pr⁡(CV_i=0 | CV_{macro}=0)$– вероятность отсутствия микроконверсии, при условии что макроконверсии не было
  • $p(0|1)=Pr⁡(CV_i=0 | CV_{macro}=1)$– вероятность отсутствия микроконверсии, при условии что произошла макроконверсия
  • $p(1|0)=Pr⁡(CV_i=1 | CV_{macro}=0)$– вероятность микроконверсии, если макроконверсии не было
  • $p(1|1)=Pr⁡(CV_i=1| CV_{macro}=1)$– вероятность микроконверсии, при условии того, что произошла макроконверсия

Исходя из определения условной вероятности, мы можем рассчитать:

$p(0|0)=Pr⁡(CV_i=0 | CV=0)=\frac{p(00)}{1-CR}$

$p(0|1)=Pr⁡(CV_i=0 | CV=1)=\frac{p(01)}{CR}$

$p(1|0)=Pr⁡(CV_i=1 | CV=0)=\frac{p(10)}{1-CR}$

$p(1|1)=Pr⁡(CV_i=1 | CV=1)=\frac{p(11)}{CR}$

Таким образом, необходимо вычислить только $p(00),\:p(01),\:p(10),\:p(11)$.

По определению:

$p(00)=\frac{количество\:кликов\: без\: макроконверсий\: и\: i\: микроконверсии}{общее\: количество\: кликов}$

$p(01)=\frac{количество\: кликов\: без\: макроконверсий\: и\: i\: микроконверсии}{общее\: количество\: кликов}$

$p(10)=\frac{количество\: кликов\: без\: макроконверсий\: и\: i\: микроконверсии}{общее\: количество\: кликов}$

$p(11)=\frac{количество\: кликов\: без\: макроконверсий\: и\: i\: микроконверсии}{общее\: количество\: кликов}$



Расчет данных четырех вероятностей требует накопления следующей статистики: для каждого клика, который мы пронумеруем некоторым clickID, требуется составить вектор-индикатор того, привела ли пользовательская сессия, инициированная этим кликом к микроконверсии по цели и к макроконверсии на сайте:

$clickID→(id(CV_1 ),id(CV_2 ),…,id(CV_k ),id(CV_{macro} ))$

где $id(CV_i )=0$ если конверсии по цели i не было, $id(CV_i )=1$ если была конверсия по цели i.
Если дополнительно мы добавим в статистику keywordID, bannerID, campaignID, мы сможем рассчитать влияние микроконверсий на конверсию для каждого кейворда, баннера, кампании. Если окажется, что собственной статистики для расчета недостаточно, то она всегда может быть «унаследована» с более высокого уровня при помощи метода пулинга. Таким образом, окончательно имеем:

Агрегированная таким образом статистика позволит рассчитать как числители, так и знаменатели в $p(00),\:p(01),\:p(10),\:p(11)$, что в конечном счете сделает возможным вычисление условной энтропии между конверсией и каждой микроконверсией, а значит задача по расчету влияния микроконверсий на итоговую конверсию на сайте полностью решена.

Кроме того, суммируя данные на уровнях кейворда, баннера, кампании, мы сможем рассчитать зависимости между конверсиями и микроконверсиями не только на уровне сайта в целом, но и на более низких уровнях, что значительно повысит эффект от оптимизации.

В следующей главе мы рассмотрим вопрос того, как на основании полученных данных оценить вес микроконверсии, и как использовать данную информацию для оптимизации.

Оценка весов микроконверсий и оптимизация ставок


Для оценки влияния микроконверсии по некоторой цели на общую конверсию на сайте удобно пользоваться нормированной формулой весов:

$ Impact(CV_i,CV_{macro} )=\frac{1-I_d(CV_i,CV_{macro} )}{\sum\limits_{j=1}^k(1-I_d (CV_j,CV_{macro} ))}$

В данном случае суммарное влияние микроконверсий по всем выбранным целям на итоговую конверсию на сайте равно 1.

Если мы вычислили коэффициент влияния (вес) по всем переходам на сайт, то выбрав цели с наибольшим влиянием, мы можем оптимизировать (например, методами A/Б тестирования) те участки сайта, где происходит сбор данных микроконверсий для повышения общей конверсии.

Если же перед нами стоит цель оптимизации ставок для контекстной рекламы, то необходимо рассчитать $Impact$ на уровне каждого кейворда $X$ (именно для них оптимизатор конверсий рассчитывает и отправляет оптимальные ставки):

$ Impact_{keyword_X}(CV_i,CV_{macro} )= \frac {1-I_d(CV_i(keyword_X),CV_{macro}(keyword_X))} {\sum\limits_{j=1}^k(1-I_d (CV_j(keyword_X ),CV_{macro}(keyword_X )))} $

Очевидно, что ставка по ключевой фразе (кейворду X) $Bid$– это некоторая функция $f$, которая зависит от статистики $ST$ (в первую очередь от коэффициента макроконверсии $CR$) и от KPI, которые установлены в качестве целевых:

$Bid=f(CR(ST),KPI,ST).$

Тогда для оптимизации с учетом микроконверсий мы можем воспользоваться обобщением последней формулы:

$Bid(keyword_X)=\omega\sum\limits_{i=1}^kImpact_{keyword_X}(CV_i,CV_{macro} )f(CR_i(ST),KPI,ST)+\\ +(1-\omega)f(CR(ST),KPI,ST),$

где параметр $0≤\omega≤1$ является некоторой монотонно убывающей функцией от количества кликов и макроконверсий по кейворду: чем больше кликов и макроконверсий, тем меньше величина $\omega$ (тем меньше нам требуется знаний о поведении микроконверсий для расчета ставок).

Таким образом, информация о микроконверсиях является особенно ценной в случае малого объема статистики по кейворду.

Кейс по оптимизации


Описанные в данной работы алгоритмы являются неотъемлемой частью оптимизатора конверсий Calltouch. Оптимизация с учетом микроконверсий оказывается особенно эффективной в том случае, если количество конверсий, которое оптимизатор старается максимизировать в рамках установленных KPI, невелико. Это имеет место быть либо для небольших рекламных аккаунтов, либо в случае выбора специфического типа конверсии. Если рассматривать оптимизацию по звонкам (именно на таком типе оптимизации специализируется сервис Calltouch), то специфическим типом конверсии является тегированный звонок. Система позволяет тегировать звонки как вручную, так и с использованием инструмента автоматического тегирования Calltouch Predict.
В данном разделе мы приведем результаты совместного с агентством «Ашманов и Партнеры» кейса по оптимизации контекста для компании BIIKS (Бурение скважин). Целью тестирования являлось увеличение числа прослушанных целевых звонков в рамках текущего CPA.

Результаты тестирования:


Стоимость конверсии: подключая рекламные кампании к Оптимизатору Calltouch, клиент рассчитывал сохранить текущую стоимость конверсии, при этом получить максимум звонков. За первые 4 недели теста были достигнуты следующие результаты:

Коэффициент конверсии: на рекламных кампаниях, подключенных к Оптимизатору Calltouch, коэффициент конверсии за период теста вырос на 55 %.

Количество конверсий: количество конверсий в период теста значительно выросло: прирост при использовании Оптимизатора составил 91%


Заключение


В работе рассмотрен новый подход к анализу микроконверсий и их влиянию на основную конверсию на сайте. Данный подход базируется на принципах теории информации. Для его реализации достаточно выбрать определенные цели, которые будут отслеживаться системой аналитики, и выбрать среди них основную (конверсию) и накопить статистику по переходам на сайт хотя бы за 30 дней. Предложенная в статье методика может быть использована как для выявления «слабых» мест на сайте, так и для оптимизации ставок в контекстной рекламе.
Tags:
Hubs:
+1
Comments 0
Comments Leave a comment

Articles

Information

Website
calltouch.ru
Registered
Employees
101–200 employees
Location
Россия