Comments 3
UFO just landed and posted this here
В целом, это все как раз о том, как из «сырого» сделать «образцовый», если я правильно понял, вы предлагаете сравнить, как будет работать LDA на изначально «образцовом» и на прошедшем предобработку датасете — сложно сказать. Я думаю, что 20 newsgroups dataset, переведенный на русский тоже потребует похожей предобработки, возможно в упрощенной форме, а так, на нем скорее всего будут более хорошие результаты — тексты из ВК уж очень разнородные + в 20 newsgroups letters побольше данных(18к текстов VS 4к).
0
А какое у вас конечное применение?
0
Sign up to leave a comment.
Запускаем LDA в реальном мире. Подробное руководство