m1rko Apr 2 2019 at 21:12

Word2vec в картинках

14 min

133K

Machine learning*

Translation

+43

Comments 16

Stas911 Apr 2 2019 at 21:57

Использовал подобный подход для дотачивания резюме под описание вакансии, когда это еще не было мейнстримом

SerafimArts Apr 2 2019 at 22:23

На эту тему, к слову, встречал очень крутой доклад от Яндекса: www.youtube.com/watch?v=U0LOSHY7U5Q

Там тоже, к слову, Gensim использовался в качестве примера.

Vinchi Apr 3 2019 at 05:08

Где можно найти эмбеддинги для русского языка?

superstarstas306 Apr 3 2019 at 10:36

В библиотеке bpemb есть готовые эмбеддинги для русского языка. Но это не совсем типичные эмбеддинги, потому что там не только слава, но и части слов (n-gram'ы)

Ockonal Apr 3 2019 at 11:04

rusvectores.org/ru/models

iroln Apr 4 2019 at 12:56

Например, на сайте fastText:
https://fasttext.cc/docs/en/crawl-vectors.html

А также здесь:
http://docs.deeppavlov.ai/en/master/intro/pretrained_vectors.html

QtRoS Apr 18 2019 at 22:53

Уже ответили на вопрос выше, но ещё как вариант у Гуглового BERT есть мультиязыковая модель, считается более актуальной моделью за счёт обучения на предложениях, а не словах.

superstarstas306 Apr 3 2019 at 10:34

Классная статья, спасибо!
На кэгле как раз начался новый конкурс по NLP, так что чтиво очень пригодилось, чтобы лучше понимать, что вообще происходит

VMAtm Apr 3 2019 at 11:54

> входное слово nor

Кажется, что вместо `nor` должно стоять `not`

Спасибо за статью

spyphy Apr 3 2019 at 16:21

коэффициент Отиаи (геометрический коэффициент)

Почему б не сказать просто «косинус угла между векторами»? Зачем такие странные названия.

Stas911 Apr 4 2019 at 06:19

да даже cosine similarity и то более понятно

Indermove Apr 3 2019 at 20:29

Спасибо за перевод и работу над ним! Как раз искал простой материал по этой теме.

enrupt Nov 22 2021 at 00:55

>>Уверен, что большинство из вас догадались, что здесь должен быть «автобус»

Что могло быть очевиднее!

alekz1903 Mar 13 2022 at 17:19

Не понимаю, каким образом происходит корректировка вектора эмбеддинга и контекстных векторов на последнем этапе обучения

freeExec Sep 7 2022 at 09:10

По аналогии как и в обычных нейронных сетях. Ведь скалярное произведение векторов полный аналог слоя нейронов. Т.е. мы ошибку распределяем по компонентам вектера, чем больше было их произведение, чем сильнее их меняем.

Askalite Jul 30 2023 at 04:28

a1*b1+a2*b2=x

x_new=x+e

a1_new=(x+e-a2*b2)/b1;

da1=a1_new-a1

w=speed [0;1] w->0

a1+=da1*w

Show the best of all time