Pull to refresh
5
0
Васичкин Евгений @livid_hour

User

Send message
От вас да — только написание алгоритма и запуск программы, но ведь статьи до вас кто-то рубрицировал, те же самые журналисты в вашем случае. Я говорю о том, что мне было интересно, как поведет себя модель, обученная на смешанных и относительно непредсказуемых данных (я не знаю всех алгоритмов, которые использует гугл для оценки релевантности выдачи и ранжирования, могу догадываться о некоторых).
Для обучения модели я выбрал два наиболее часто используемых подхода — Метод опорных векторов и Наивный Байесовский алгоритм классификации (два опять же для сравнения)
В в планах также применить нейронные сети
Если у вас была цель сделать качественную выборку большого объема, плюс сделать это быстро и просто — вы выбрали наиболее правильный вариант)
Мне не удалось в полной мере отразить свою задумку в статье, но подход у меня был скорее исследовательский, чем направленный на извлечение практической пользы
Я хотел бы сделать нечто универсальное, дабы минимизировать участие человека в составлении выборки
А о каком виде разметки идет речь? Ключевые слова являются ссылками на другие ресурсы, или же это встраиваемая в сайт разметка, которую тот же гугл предлагает в целях «правильной интерпретации информации»?

Information

Rating
Does not participate
Registered
Activity