lieroz 23 дек 2020 в 15:17

Опыт использования gRPC в Почте Mail.ru

8 мин

8.8K

Блог компании VKВысокая производительность*C++*Сетевые технологии*Отладка*

+42

Комментарии 19

k-morozov 23 дек 2020 в 16:18

Писал чат на С++. использовал асио. потом решил переписать на gRPC. Но столкнулся с проблемой — как делать рассылку новых сообщений другим клиентам. Как понял — gRPC хорошо подходит для запрос-ответ. В моей же ситуации выход был только создавать stream или опрашивать сервер. Что дает существенную доп нагрузку. В итоге оставил асио.
p.s. В документации есть примеры, которые построены на тегах по адресу объектов (например встречается delete this) — пугающая игра с ручной управлением памятью.
https://github.com/grpc/grpc/blob/master/examples/cpp/helloworld/greeter_async_server.cc

lieroz 23 дек 2020 в 18:06

gRPC это действительно история больше про запрос-ответ, поэтому для чата он не подойдет. По поводу асинхронного кода в примере — согласен, я попытался сделать свою обертку над этим АПИ: gist.github.com/lieroz/6ab0b844eb659cd8d202783f467c4e3d, но это не решило проблему с потоками.

hell0w0rd 24 дек 2020 в 16:33

но ведь в gRPC есть несколько типов стримов на любой вкус: client to server, server to client, bidirectional. gRPC вполне подходит для чатиков, если учитывать проблемы, которые есть в любом протоколе.
P.S. вот пример https://github.com/dialogs/api-schema

Boniface 23 дек 2020 в 20:37

На что планируете переходить с grpc?

lieroz 23 дек 2020 в 21:17

Пока не уверены, думали заиспользовать наш обычный подход с использованием boost::asio, устанавливать tcp соединение и не рвать его. Но хочется попробовать ещё мультиплексирование и попользоваться библиотекой в других сервисах, с другим профилем нагрузки.

Shinbolat 24 дек 2020 в 12:18

Создаётся впечатление что исправляли проблему около полугода.

lieroz 24 дек 2020 в 12:53

Да, примерно так оно и продолжалось, мы не сразу сели за ее исправление. Сначала просто поднимали количество реплик и объем оперативной памяти. Затем решили переписать на асинхронную версию, которая тоже ничего не изменила. И только потом решили основательно подойти к поиску решения, потому что быстрые и простые меры ничем не помогли.

tony2001 24 дек 2020 в 13:13

>Мы решили попробовать запустить наш сервис с новым аллокатором.
Новый — это jemalloc? Если нет, то пробовали ли его?

lieroz 24 дек 2020 в 13:47

Имелся ввиду tcmalloc, так как его мы подключали, когда хотели профилировать через gperftools. Были идеи попробовать jemalloc/mimalloc, но сейчас нас вполне устраивает tcmalloc.

Tuxman 26 дек 2020 в 05:28

Если бы вы гоняли там какие-то PCI (номера кредиток например) или HIPAA (медицинские данные) или ещё какой-то compliance надо было соблюдать, то намучались бы ещё больше! Пришлось бы ещё извращаться с аллокаторами для gRPC и отдельно аллокаторами для Protobuf, чтобы они брали память из какой-то openssl secure arena, например, т.е. область памяти, которую нельзя отсвопить и/или добавить в coredump.

tony2001 24 дек 2020 в 13:42

> Теперь нам стало понятно, что высокое потребление памяти — это следствие создания большого количества потоков при работе сервиса.
А разработчикам об этом сообщали?
Наверняка ведь вы не одни, кто использует tcmalloc, значит проблема вполне реальная. Ну и вообще логика работы с «одноразовыми» потокам — прямо скажем, посредственная, непонятно зачем так делать.

lieroz 24 дек 2020 в 13:55

Логика работы с потоками действительно оставляет желать лучшего, в самом коде ThreadManager у них об этом написано: github.com/grpc/grpc/blob/master/src/cpp/thread_manager/thread_manager.cc#L226.

tony2001 24 дек 2020 в 14:14

Им это надо аргументированно репортить, иначе ничего не изменится.
Не могу сказать, что они бросаются всё исправлять, но процесс в целом идёт, очевидные патчи они принимают: раз, два, а сложные баги в работу берут: три.

lieroz 24 дек 2020 в 14:29

Спасибо, issue заведем, потом комментарием приложим.

lieroz 13 янв 2021 в 12:57

завели: github.com/grpc/grpc/issues/25145

Tuxman 26 дек 2020 в 05:15

gRPC хорошо использовать для создания внешних интерфейсов, тогда клиенты могут использовать эту замечательную технологию "из коробки" и подключиться к вашему сервису из любого языка программирования.

Если вы пишете код для сервера и клиента, и тем более этот код на одном языке, например, C++, то gRPC слишком "дорого стоит". Как минимум, в gRPC надо было гонять flatbuffers, а не protobuf, столько лишних аллокаций у вас!

Если вам категорически хочется пользоваться модной-молодёжной библиотекой из-коробки, то смотрите в сторону Cap'n Proto, там zero-copy сериализация, и даже какой-то RPC есть.

lieroz 26 дек 2020 в 17:30

Cap'n Proto видели, но побоялись использовать.

Tuxman 26 дек 2020 в 05:22

Всё что нужно было вам написать — сообщения Запрос/Ответ, обязательное поле номер_сообщения. Запрос ложиться в unordered_map, где ключ номер_сообщения. Когда приходит ответ, то достаётся запрос, заполняются поля с ответом и запускается колбек.

На стороне сервера вы создаёте количество потоков равное количеству кор, или чуть больше, если у вас там какие-то дисковые операции есть. Что может быть проще и эффективнее?

Если у вас много полей и сложные данные и лениво писать сериализацию, то тут выбор из protobuf (дорого), flatbuffers (лучше), capnproto (совсем хорошо).

lieroz 26 дек 2020 в 17:29

Именно так мы и хотели сначала сделать, но решили попробовать gRPC, потому что хотели побыстрее запуститься.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий