Pull to refresh

Comments 3

UFO just landed and posted this here
В целом, это все как раз о том, как из «сырого» сделать «образцовый», если я правильно понял, вы предлагаете сравнить, как будет работать LDA на изначально «образцовом» и на прошедшем предобработку датасете — сложно сказать. Я думаю, что 20 newsgroups dataset, переведенный на русский тоже потребует похожей предобработки, возможно в упрощенной форме, а так, на нем скорее всего будут более хорошие результаты — тексты из ВК уж очень разнородные + в 20 newsgroups letters побольше данных(18к текстов VS 4к).
Sign up to leave a comment.

Articles