snikolenko Jul 16 2014 at 19:52

Вероятностные модели: LDA, часть 2

6 min

23K

Surfingbird corporate blogMathematics*

+23

Comments 7

hombre Jul 16 2014 at 23:41

Спасибо, интересное изложение «крупными мазками».

я бы добавил ещё мазок про то, что такое «сопряжённым априорным распределением», что апостериорное распределение принадлежит тому же классу, что и априорное распределение, т.е. после ~~всех махинаций~~ оценки модели, мы находим оценки искомых параметров, через новые параметры, при этом и априорное и апостериорные распределения оказываются, что принадлежать одному и тому же классу (впрочем у вас лучше получается объяснять)

snikolenko Jul 16 2014 at 23:54

Да, про сопряжённые априорные из этого текста не должно было быть понятно. :)
Про них надо отдельно говорить при случае, начиная с монетки.

zz_wolf Jul 17 2014 at 13:12

Шикарно — спасибо!

iHun Dec 16 2014 at 08:48

Спасибо за ваши статьи! Лучшие материалы по данной теме на русском языке.
Подскажите пожалуйста, как можно решить вопрос о количестве тем? Насколько я знаю, MALLET определяет оптимальное количество тем ещё на этапе конструирования модели, но я использую gensim. Да и вообще интересно, какие варианты существуют?

snikolenko Dec 16 2014 at 10:04

Лично я обычно на глаз подбираю. :)

Вообще существует отдельное большое направление, связанное с непараметрическими байесовскими методами. Ключевые слова — Dirichlet processes, например, Chinese restaurant process. Там получается модель (в том числе и LDA получается), которая сама подбирает число тем. Надо будет как-нибудь реализовать и попробовать это физически.

iHun Dec 16 2014 at 14:59

Это называется «экспертная оценка») Но для диплома мне надо что-нибудь более убедительное)
Как я понял, два других метода — это перплексия и на основе расстояния Кульбака — Лейблера. На второе мне не хватает памяти, так что займусь первым, тем более что в gensim для этого есть инструменты.

snikolenko Dec 16 2014 at 15:45

perplexity с ростом числа тем будет, скорее всего, монотонно меняться, это же как правдоподобие фактически

тут нужен метод model selection вроде BIC/AIC скорее