Articles / Bookmarks / Profile of Junkers / Habr

Али Абдуллаев @Junkers

Пользователь

Profile Publications 1Comments 7Bookmarks 5

murat_apishev Nov 13 2023 at 10:56

«ИИ без границ»: как научить Transformer обрабатывать длинные тексты

Hard

12 min

7.3K

Machine learning*Artificial IntelligenceNatural Language Processing*

Review

Разносторонний системный рассказ о том, какими способами можно научить модель работать с длинными последовательностями. Для специалистов, занимающихся обучением LLM, и всех, кто хочет разобраться в теме.

+30

murat_apishev Dec 12 2023 at 16:25

О методах позиционного кодирования в Transformer

Hard

10 min

Machine learning*Artificial IntelligenceNatural Language Processing*

Review

✏️ Technotext 2023

Обзор методов кодирования позиций токенов в нейросетевых моделях Transformer с упором на обработку длинных текстов. Для тех, кто учит и использует LLM, и для всех интересующихся.

+24

ru_vds May 1 2023 at 16:25

Алгоритмы балансировки нагрузок

Medium

8 min

31K

Algorithms*Server optimization*Server Administration*RUVDS.com corporate blog

Tutorial

Translation

Рано или поздно веб-приложения перерастают среду одного сервера. Компаниям требуется увеличить или их доступность, или масштабируемость, или и то, и другое. Чтобы сделать это, они развёртывают своё приложение на нескольких серверах и ставят перед ним балансировщик нагрузок для распределения входящих запросов. Чтобы справляться с нагрузками, большим компаниям могут потребоваться тысячи серверов, на которых запущено веб-приложение.

В этом посте мы рассмотрим способы, которыми один балансировщик нагрузок может распределять HTTP-запросы на множество серверов. Мы начнём снизу и проделаем весь путь вверх до современных алгоритмов балансировки нагрузок.

Читать дальше →

+105

olegchir May 8 2018 at 14:42

Ваши A/B-тесты сломаны

18 min

19K

IT systems testing*JUG Ru Group corporate blogWeb services testing*Mobile applications testing*Conferences

После того, как вы проверили, что функциональность реализована нормально, она выкатывается в эксперимент, чтобы узнать, нравится ли новая версия пользователям.

Замечали, что обычно люди, ответственные за эксперименты, в итоге говорят, что данных недостаточно для решения? Часто это действительно так, но нередко всё дело в поломках системы экспериментов и учёта пользовательской статистики.

В этой статье мы рассмотрим типичные поломки, которые там встречаются, и у вас появится возможность, вернувшись на рабочее место, немножко побыть data scientist'ами и найти ошибки у себя в компании. Какие-то из них там наверняка есть.

В основе материала — расшифровка доклада Романа Поборчего с нашей декабрьской конференции Heisenbug 2017 Moscow.

Читать дальше →

+50

saluev Dec 18 2018 at 17:26

Исправляем опечатки в поисковых запросах

14 min

18K

Search engines*Programming*Algorithms*Mathematics*Joom corporate blog

Наверное, любой сервис, на котором вообще есть поиск, рано или поздно приходит к потребности научиться исправлять ошибки в пользовательских запросах. Errare humanum est; пользователи постоянно опечатываются и ошибаются, и качество поиска от этого неизбежно страдает — а с ним и пользовательский опыт.

При этом каждый сервис обладает своей спецификой, своим лексиконом, которым должен уметь оперировать исправитель опечаток, что в значительной мере затрудняет применение уже существующих решений. Например, такие запросы пришлось научиться править нашему опечаточнику:

Может показаться, что мы отказали пользователю в его мечте о вертикальной реальности, но на самом деле буква К просто стоит на клавиатуре рядом с буквой У.

В этой статье мы разберём один из классических подходов к исправлению опечаток, от построения модели до написания кода на Python и Go. И в качестве бонуса — видео с моего доклада «”Очки верткальной реальности”: исправляем опечатки в поисковых запросах» на Highload++.

+20