Articles / Bookmarks / Profile of jaturken / Habr

Александр Теут @jaturken

User

Profile Publications 1Comments 28Bookmarks 390

badcasedaily1 Apr 20 at 19:10

Кратко про Serde в Rust

Easy

6 min

4.1K

Programming*Rust*OTUS corporate blog

Review

Serde — это высокопроизводительная библиотека для сериализации и десериализации данных в Rust. Она поддерживает различные форматы данных, включая JSON, YAML, TOML, BSON и многие другие.

В этой статье рассмотрим основы Serde в Rust.

SantrY Nov 7 2023 at 11:30

Взламываем транспортные карты: чит на бесконечные деньги

Medium

8 min

118K

Information Security*IT systems testing*Reverse engineering*TransportБастион corporate blog

Этот парень открыл все турникеты на станции. Вы до сих пор считаете, что все хакеры вредны?

Начну с простого вопроса: кто из вас пользуется общественным транспортом? А кому нравится за него платить? Если такие все же найдутся, то могут смело переставать читать статью. Для остальных у меня есть рассказ о том, как четверо старшеклассников из Массачусетса взломали местную транспортную систему.

Жителям Бостона статья поможет получить бесплатные поездки, а для всех остальных этот материал будет неплохим уроком по реверс-инжинирингу. Ну или, по крайней мере, вы узнаете любопытную историю.

+138

185

Anastasia_Fishkina Nov 13 2023 at 14:10

Эффективное управление отношениями со стейкхолдерами

Medium

9 min

7.1K

Development Management*Project management*Product Management*Sportmaster Lab corporate blog

Translation

Без выстраивания хороших отношений со стейкхолдерами (или заинтересованными сторонами) на проекте далеко не уедешь. О том, как это делать like a boss, – годная статья автора Кэт Бугард в блоге Miro.

Все картинки – из Miro.

+22

Bright_Translate Oct 27 2023 at 16:00

Как в 180 000 раз ускорить анализ данных с помощью Rust

Medium

18 min

17K

High performance*Python*Programming*Rust*RUVDS.com corporate blog

Tutorial

Translation

В этой статье я опишу одно из последних своих дерзновений в сфере оптимизации производительности с помощью Rust. Надеюсь, что в ней вы откроете для себя какие-то новые приёмы для написания быстрого кода на Rust.

Читать дальше →

+68

uwriter Apr 13 2023 at 11:42

Нужна ли на проекте документация: три признака, что да, ещё три — когда нет

Easy

3 min

4.1K

System Analysis and Design*Development Management*Project management*Personnel Management*KTS corporate blog

Analytics

Подготовка документации — дело затратное. Прежде чем приступать к ней, нужно подумать, действительно ли она нужна, или это делается, потому что «так принято».

В статье я подробно остановился на ситуациях, когда написать её необходимо. Если в одной из них вы узнаете свой проект, то документация сильно поможет в его реализации.

+27

wiseplat Apr 14 2023 at 00:38

Как сделать торгового робота для Binance

Easy

12 min

31K

Python*Finance in ITCryptocurrencies

From sandbox

Программирование для меня это хобби и любимое дело. А так я сертифицированный системный архитектор. Поэтому прошу не особо ругать за код :-)

В настоящее время я увлекаюсь написанием торговых роботов. Постепенно изучаю нейросети для их применения к анализу цен/объемов акций/фьючерсов.

Обычно я писал торговых роботов для работы с Брокерами и делал авто-торговлю Акциями или Фьючерсами, но вдруг возникла мысль:

- А что, если уже готовый код можно применять и на других активах??? Например на крипто активах для Биткоина или Эфира или других?

Уже изучив много библиотек и примеров за долгое время написания своих торговых роботов, решил сделать небольшую библиотеку backtrader_binance для интеграции API Binance и библиотеки тестирования торговых стратегий Backtrader.

Вот с помощью backtrader_binance, сейчас и создадим алго-робота для торговли BTC и ETH.

Digital_League Mar 31 2023 at 14:36

Как мы быстро создавали задачи в Jira по ГОСТовому ТЗ и почему это облегчило работу с госзаказчиком

11 min

3.3K

Project management*Atlassian*Visual Basic for Applications*Лига Цифровой Экономики corporate blog

Михаил Михайлец, руководитель группы аналитиков направления облачных решений Лиги Цифровой Экономики, рассказал, как его команда попробовала быстро подготовить задачи по классическому ТЗ (ГОСТ 19) в Jira при работе с государственным заказчиком и что из этого получилось.

Пожалуй, большинству известно, что ГОСТ предусматривает водопадную модель разработки ПО. До недавнего времени она была зафиксирована в постановлении Правительства Российской Федерации от 6 июля 2015 г. № 676 «О требованиях к порядку создания, развития, ввода в эксплуатацию, эксплуатации и вывода из эксплуатации государственных информационных систем и дальнейшего хранения содержащейся в их базах данных информации».

Несмотря на обнадеживающее движение в сторону итеративной разработки со стороны правительства, стандарты пока обновляться не спешат. Годы выпуска действующих ГОСТов, которые идут после тире в их номерах, тонко намекают, что гибкие подходы в разработке не учитывались при их создании.

В теории можно породить жизнеспособного «кентавра» — если в течение спринтов проходить указанные стадии проекта раз за разом в ходе разработки каждой функции приложения.

gkarapet Mar 28 2023 at 13:20

ХЗ в ТЗ по стратегии и психотипирование как бизнес-стратегия

Easy

15 min

4.3K

Project management*Personnel Management*Gai.Company corporate blog

Tutorial

Всем привет, меня зовут Гай, и я консультант, помогающий IT-компаниям проводить стратегические сессии и разрабатывать стратегию компании.

В данной статье я хочу описать три пункта стратегирования:

1. Фрейм стратегического анализа и постановки целей.

2. Как картировать набор решений, чтобы цели дошли до нижних звеньев.

3. Психотипирование кадров как важнейший пункт реализации стратегии.

Я проводил стратегические сессии в паре десятков отечественных ИТ-компаний, в том числе и с драгоценной для нас с вами компанией «Хабр» я работаю уже три года.

+13

Digital_Design Jun 24 2022 at 18:21

Воспроизводимость ML экспериментов с помощью MLflow project

12 min

Open source*Python*Digital Design corporate blogMachine learning*

Tutorial

Всем привет! Меня зовут Игорь Дергунов и я руководитель инновационной лаборатории Digital Design, которая занимается оптимизацией бизнес-процессов с помощью методов машинного обучения. В процессе работы над проектами в данной сфере быстро приходит осознание необходимости учета и структурирования проводимых экспериментов. В нашем случае мы воспользовались инструментом MLflow, который предоставляет функциональность для отслеживания экспериментов и управления жизненным циклом моделей машинного обучения.

И все шло хорошо, результаты проверки гипотез (параметры обучения, метрики, артефакты и модели) сохранялись, их было удобно наглядно сравнивать, и все были довольны. Так продолжалось достаточно долгое время, пока не возникла необходимость вернуться к эксперименту, который выполнялся какое-то время назад и был приостановлен.

kmoseenk Jul 27 2022 at 18:35

Проектирование ETL-пайплайна в Apache Airflow

9 min

4.5K

Data storage*OTUS corporate blog

Привет, Хабр! На связи Рустем, IBM Senior DevOps Engineer и сегодня я хотел бы продолжить наше знакомство с инструментом в DataOps инженирии — Apache Airflow. Сегодня мы спроектируем ETL-пайплайн.

MaxRokatansky Mar 21 2021 at 17:09

Как управлять проектами машинного обучения и data science

6 min

6.4K

Big Data*Machine learning*OTUS corporate blog

Translation

Управлять проектами машинного обучения (Machine learning) и data science сложно, поскольку проекты часто носят исследовательский характер, и трудно предсказать, сколько времени потребуется на их завершение. Часто всё начинается с одной идеи, а затем перетекает в новое направление, когда предложенный метод не срабатывает или если предположения относительно данных оказываются неверными.

Построение модели также является длительным процессом (по сравнению с работой в сфере программного обеспечения и аналитики), и data scientist нередко попадает в кроличью нору и тратит месяцы на проект, не имея четких представлений о прогрессе. Еще одно отличие от стандартных практик разработки программного обеспечения заключается в том, что построение модели обычно выполняется всего одним человеком, и это не совсем вписывается в традиционные командные рабочие процессы, такие как Kanban и Scrum.

Я потратил достаточно много времени, изучая существующие рабочие процессы (в основном в Jira) с точки зрения пригодности для управления проектами машинного обучения и data science, но безуспешно. Большая часть информации нацелена на разработку программного обеспечения и фокусируется на Agile методологиях. Обсуждая этот вопрос с коллегами и друзьями мне не удалось найти ничего, что было бы адаптировано для машинного обучения и data science. Я заметил, что часть коллег пытаются адаптировать свой рабочий процесс к стандартной инженерной практике, в других же случаях, они вообще не пытаются управлять проектами. Последнее особенно проблематично, по причине того, что проекты, которые требуют слишком много времени и замахиваются на слишком большую предметную область, вероятнее всего провалятся.

Поскольку мне не удалось найти подходящее решение, я решил разработать собственную рабочую схему для управления проектами машинного обучения и data science. Данный процесс может быть реализован в Jira и позволяет мне легко отслеживать статус проектов, вести отчетность, а также не давать раздуваться предметной области, избегая построения чересчур сложных моделей. У наших исследователей появляется рабочая схема, которая помогает им в построении модели, что повышает их успехи в проекте. Я пользуюсь этой системой уже несколько лет, и мы с моей командой очень довольны ею.

olalala Apr 19 2022 at 11:59

Яндекс выложил в опенсорс YDB

16 min

141K

High performance*Open source*Яндекс corporate blogDatabase Administration*GitHub*

Technotext 2022

Сегодня мы выложили в опенсорс систему управления базами данных YDB — плод многолетнего опыта Яндекса в разработке систем хранения и обработки данных. Исходный код, документация, SDK и все инструменты для работы с базой опубликованы на GitHub под лицензией Apache 2.0. Развернуть базу можно как на собственных, так и на сторонних серверах — в том числе в любых облачных сервисах.

YDB решает задачи в одной из самых критичных областей — позволяет создавать интерактивные приложения, которые можно быстро масштабировать по нагрузке и по объёму данных. Мы разрабатывали её, исходя из ключевых требований к сервисам Яндекса. Во-первых, это катастрофоустойчивость, то есть возможность продолжить работу без деградации при отключении одного из дата-центров. Во-вторых, это масштабируемость на десятки тысяч серверов на чтение и на запись. В-третьих, это строгая консистентность данных.

В посте я расскажу об истории развития технологий баз данных, о том, зачем использовать YDB, как её применяют текущие пользователи и какие плюсы для всех несёт выход в опенсорс. А во второй половине поста поговорим о разных вариантах развёртывания.

Читать дальше →

+329

135

rikki_tikki Apr 11 2022 at 19:23

Что такое MLOps? Операции машинного обучения на пальцах

8 min

12K

Machine learning*OTUS corporate blog

Translation

В этой статье я расскажу вам об операциях машинного обучения (MLOps) — области, которую можно охарактеризовать как DevOps для машинного обучения.

PatientZero Apr 15 2022 at 17:13

Миллион одновременных соединений

8 min

59K

Server optimization*Network technologies*Server Administration*

Translation

Я слышал ошибочные утверждения о том, что сервер может принять только 65 тысяч соединений или что сервер всегда использует по одному порту на каждое принятое подключение. Вот как они примерно выглядят:

Адрес TCP/IP поддерживает только 65000 подключений, поэтому придётся назначить этому серверу примерно 30000 IP-адресов.

Существует 65535 номеров TCP-портов, значит ли это, что к TCP-серверу может подключиться не более 65535 клиентов? Можно решить, что это накладывает строгое ограничение на количество клиентов, которые может поддерживать один компьютер/приложение.

Если есть ограничение на количество портов, которые может иметь одна машина, а сокет можно привязать только к неиспользуемому номеру порта, как с этим справляются серверы, имеющие чрезвычайно большое количество запросов (больше, чем максимальное количество портов)? Эта проблема решается распределением системы, то есть кучей серверов на множестве машин?

Поэтому я написал эту статью, чтобы развеять данный миф с трёх сторон:

Мессенджер WhatsApp и веб-фреймворк Phoenix, построенный на основе Elixir, уже продемонстрировали миллионы подключений, прослушивающих один порт.
Теоретические возможности на основе протокола TCP/IP.
Простой эксперимент с Java, который может провести на своей машине любой, если его всё ещё не убедили мои слова.

Если вы не хотите изучать подробности, то перейдите в раздел «Итоги» в конце статьи.

Читать дальше →

+99

yyasha Oct 20 2021 at 15:34

Тёмный маршрутизатор из Raspberry Pi

3 min

23K

Nginx*Go*GitHub*Development for Raspberry Pi*DIY

From sandbox

В данной статье я расскажу о том, как я сделал из Raspberry Pi маршрутизатор, способный перенаправлять отдельные сайты, отдельные подсети, да хоть все запросы через tor.

+21

dolovar Feb 14 2020 at 19:00

В поисках физкультуры

18 min

8.2K

Health

И что интересного люди находят в этих книжках?

Спорт

Совет “займись спортом” часто звучит рядом с многими проблемами: осанка, ожирение, мигрени, самооценка, выгорание — спорт хорошо помогает в очень разных случаях.

И можно даже не уточнять, о каком спорте идет речь. Обычно сказавший и услышавший подразумевают под словом “спорт” одно и то же — это какой-то полезный для здоровья вид двигательной активности.

Остается только выбрать подходящий вид спорта — приносящий побольше пользы и поменьше вреда. Чтобы не дорого, не далеко от дома, по силам и личным предпочтениям. По рекомендациям пробовавших и примерам успеха.

Я хочу обратить внимание на то, что упомянутый выбор вида спорта — это часть проблемы, тесно связанной с использованием популярного, но размытого термина.

И хочу предложить подумать о возможности улучшить то, чем мы занимаемся в бассейнах, фитнес-клубах, тренажерках, качалках, на беговых дорожках, площадках для воркаута и дома.

Спойлер: В статье содержится приглашение к размышлению. Озвучены вопросы, предложено направление для новых мыслей, а не готовые ответы. Здесь нет мотивирующей рекламы очередной методики тренировок. Если вы хотите узнать очередной рецепт для здоровья, который кому-то помог, то вам нужны другие статьи, их много. Желающие пропустить рассуждения могут сразу перейти к итогам.

Дисклеймер: Некоторые виды спорта однозначно и бесспорно полезнее, нежели чрезмерно малоподвижный образ жизни. Автор нигде не предлагает отказываться от спорта, фитнеса и прочих тренировок, несомненно приносящих пользу для здоровья.

Читать дальше →

HumanoIT Jul 10 2018 at 10:56

Что дальше? Или как правильно выбрать фичи для разработки

7 min

18K

Development Management*Project management*Product Management*Hygger corporate blog

Грамотно и вовремя выбирать фичи для разработки и не прогадать – это про искусство приоритизации. Как найти критерии оценки, необходимые для своего продукта, вырастить стратегические показатели, предложить клиентам еще больше ценности, наладить все внутренние процессы в команде и добиться других наглядных показателей с помощью качественной приоритизации?

Читать дальше →

+13

alex4321 Nov 13 2016 at 07:45

Реализация классификации текста свёрточной сетью на keras

9 min

23K

Machine learning*Natural Language Processing*

Речь, как ни странно, пойдёт о использующем свёрточную сеть классификаторе текстов (векторизация отдельных слов — это уже другой вопрос). Код, тестовые данные и примеры их применения — на bitbucket (уперся в ограничения размера от github и предложение применить Git Large File Storage (LFS), пока не осилил предлагаемое решение).

Наборы данных

Использованы конвертированные наборы: reuters — 22000 записей, watson-й — 530 записей, и ещё 1 watson-й — 50 записей. Кстати, не отказался бы от подкинутого в комменты/ЛС (но лучше таки в комменты) набора текстов на русском.

Устройство сети

За основу взята одна реализация описанной тут сети. Код использованной реализации на github.

В моём случае — на входе сети находятся векторы слов (использована gensim-я реализация word2vec). Структура сети изображена ниже:

Вкратце:

Текст представляется как матрица вида word_count x word_vector_size. Векторы отдельных слов — от word2vec, о котором можно почитать, например, в этом посте. Так как заранее мне неизвестно, какой текст подсунет пользователь — беру длину 2 * N, где N — число векторов в длиннейшем тексте обучающей выборки. Да, ткнул пальцев в небо.
Матрица обрабатывается свёрточными участками сети (на выходе получаем преобразованные признаки слова)
Выделенные признаки обрабатываются полносвязным участком сети

Стоп слова отфильтровываю предварительно (на reuter-м dataset-е это не сказывалось, но в меньших по объему наборах — оказало влияние). Об этом ниже.

Читать дальше →

+21

dkosolobov May 18 2015 at 18:03

Простое суффиксное дерево

12 min

74K

Programming*Algorithms*

Tutorial

Суффиксное дерево – мощная структура, позволяющая неожиданно эффективно решать мириады сложных поисковых задач на неструктурированных массивах данных. К сожалению, известные алгоритмы построения суффиксного дерева (главным образом алгоритм, предложенный Эско Укконеном (Esko Ukkonen)) достаточно сложны для понимания и трудоёмки в реализации. Лишь относительно недавно, в 2011 году, стараниями Дэни Бреслауэра (Dany Breslauer) и Джузеппе Италиано (Giuseppe Italiano) был придуман сравнительно несложный метод построения, который фактически является упрощённым вариантом алгоритма Питера Вейнера (Peter Weiner) – человека, придумавшего суффиксные деревья в 1973 году. Если вы не знаете, что такое суффиксное дерево или всегда его боялись, то это ваш шанс изучить его и заодно овладеть относительно простым способом построения.

Читать дальше →

+39

Shirixae Dec 25 2013 at 16:31

Купил > залил > в карман! Обзор PocketBook 515

4 min

59K

Gadgets

Любите читать со смартфона, но из-за этого он не доживает до вечера, а глаза устают? Не нравятся большие читалки, потому что их нельзя убрать в карман? Специально для вас выпускаются карманные ридеры.

Стоят не дорого, экран с привычным соотношением сторон 4:3 (как у классической бумажной книги), продвинутые E-Ink дисплеи с хорошими показателями контрастности, а главное — заряжать надо раз в неделю. И смартфон не надо мучить. Об одном таком филиале библиотеки в карманном размере сегодня и поговорим.

Читать дальше →

+17

2 3 ...

19 20