Pull to refresh

Comments 25

Спасибо за интересную статью, я давно искал возможность выразить благодарность за Яндекс.Переводчик! Опытным путём выяснено, что на английском переводе (самом употребимом) он работает лучше гугловского.
И ещё (извините за оффтоп), давно хотел высказать претензию в адрес языковых механизмов Яндекса — они работают странновато. Вот например, слово «флэшка» Яндекс помечает как ошибочное, а «флешка» — как правильное. Ну не странно ли, учитывая явно слышимое Э и иностранное происхождение слова? И таких слов много, а потом на Яндекс ссылаются те, кто учит нас правописанию. Но хуже всего то, что простой пользователь никак не может на это повлиять, поскольку в языковых «кишках» Яндекса не предусмотрена обратная связь (в Переводчике хоть есть кнопка «Сообщить об ошибке», а в спеллчекере нет ничего подобного). Передайте тем, от кого это зависит, что это надо исправлять.
Ну не странно ли, учитывая явно слышимое Э и иностранное происхождение слова?

Иностранные слова со звуком [э] очень часто заимствуются в русский с буквой «е» в написании: «претензия», «секс», «бутерброд». «э» пишется чаще либо в начале слова («эхо»), либо в сочетаниях с гласными («маэстро»), либо для устранения неоднозначности («мэтр»/«метр»). Впрочем, исключений в обе стороны тонны и правописание конкретно «флешки» обсуждаемо. Поиск говорит о трёхкратном превосходстве варианта «флешка» (81 млн результатов против 27 млн у «флэшка»).

Так же поиск покажет гору результатов „в опреоле” и ссылаться на частотность в поисковых системах попросту неверно.

Ссылаться нужно на правила и на языковую традицию заимствования слов. А так происходит всё в точности как вы описали, флешка, а не флэшка, блогер, а не блоггер, трафик, а не траффик, оффициальный оффис, в конце концов. Да и оффсайт — это что-то выключенное.
Тут надо быть немного осторожнее с утверждениями, потому что ещё в XVIII-XIX вв. свежевошедшие в язык слова «офици[н]альный», «офис» и другие писались и так, и сяк, в том числе и с двумя «ф» :) Поэтому если говорить о традиции, то там всё немного сложно.
В чём конкретно мне нужно быть осторожнее с утверждениями из актуальной редакции русского языка? :)
Вы упомянули языковую традицию заимствования. Так вот она не такая уж и традиция, как мы видим :) И вполне себе плавает.
А, ну то есть вам не по сути темы беседы общаться, а меня за слова к ответу притягивать.

Всего хорошего.
флешка, а не флэшка, блогер, а не блоггер, трафик, а не траффик, оффициальный оффис, в конце концов
Ваши примеры — это примеры «ползучести» языковой нормы. Тогда уж надо выбирать, за что мы ратуем — за устоявшиеся правила или за то, что первична разговорная практика, а правила уже следом. И если за второе, то на этом пути мы можем зайти слишком далеко — вон уже сейчас начинают писать «жек», полностью забывая, что это бывшая аббревиатура.
Выбирают пусть лингвисты, а не каменты на хабре. Есть норма — норма фиксируется в словарях и правилах, по словарям и правилам работает публичный протокол (язык).

Иначе это бессмысленный трёп, мол, законодательство не устраивает, давайте нарушать, в XVI веке это можно было. И вообще, HTTP/1.1 уже не торт, вот в HTTP/0.9 такого не было как сейчас, ух.
Google Bing — это сильно! Надеюсь, это не прогноз :)
Wtf? И вроде не первое апреля было… Шутники, блин. )
image
Зачем ты замазал аватар? И так понятно, что там Монтгомери.
) Изначально это был скриншот для другого сайта…
По моему, в поле ввода и вывода текста много лишних иконок, у Гугла, например, меньше.
А еще неудобно когда внутри границ поля активно только 40%. Границы ведь не просто так придумали.

Забавный лимит в 10000, наверное просто совпадение что он в 2 раза больше чем у конкурентов :)
UFO just landed and posted this here
Когда нужно перевести +100500 текстов, лучше это автоматизировать.
Например, вот крутая библиотека github.com/soimort/translate-shell, которая в том числе поддерживает Яндекс.Переводчик.
А расскажите, пожалуйста, почему почти все онлайн-переводчики делают вот так? Это же явно не просто совпадение.
Нейросети умеют придумывать новые слова. Об этом есть хорошая статья.

В свою очередь приставка «re» часто означает означает «пере» (например «replay» это «переиграть»), а «dux» это «вождь». Вот нейросеть и решает, что «redux» это «перевождь».

К слову, «to redux» автоматические переводчики переводят более достойно :)
Яндекс или Гугл, это дело вкуса. Что подняло мою англоязычную переписку на новую высоту — так это Reverso Context. Всем рекомендую.
Какую конкретно модель использовали нейросети?
Использовали ли при обучении перевод русский-русский для дообучения редким словам?
Используете ли властелин колец?
Хорошие вопросы! Мы используем вариант Трансформера, но начинаем экспериментировать с другими архитекрурами.

Для перевода редких слов мы пока не пробовали перевод русский-русский, но звучит интересно. Правда, я не знаю, откуда берутся данные русский-русский.

И про Властелина Колец, это вполне возможно, что в наших обучающих данных находятся отрывки этого произведения опуликованные в интернете.
Была статья гугла.
Там было сделано следующее:
кодер(русский) ---------------------------------------------------декодер(русский)
— — — ----универсальное представление — ----- — -----
кодер(английский)------------------------------------------------декодер(английский)
кодер(испанский)-------------------------------------------------декодер(испанский)

Т.е. универсальное представление кто то назвал кольцом всевластия(или властелинном колец)

При этом обучать можно не только на парах разных языков, но и на передаче в кодер и декодер одного и того же предложения на русском и отдельно текстов на английском.

Вроде для сносного перевода пары языков достаточно сотни переведенных предложений и огромных корпусов каждого из языков.

Добрый день! Это проблема на Маркете. Она не связана с Яндекс.Переводчиком. Мы уже знаем о ней и скоро исправим.
яндекс говорит что 書籍子ども означает «книги для детей»,
а бинг утверждает что оно означает "книги детей",
в тоже самое время фраза "книги детей" — яндекс переводит как 児童書,
что в свою очередь bing переводит как «книги для детей». Так кто прав?
Гугл в свою очередь умудряется показать 3 разных варианта просто сменой первой буквы на заглавную…

Сделайте пожалуйста кнопочку под переводом на примере как у bing «поиск этого перевода в yandex»? Было бы Здорово.
Sign up to leave a comment.