Статьи / Закладки / Профиль wol4aravio / Хабр

Валентин Пановский @wol4aravio

Data scientist | Academic | Amateur photographer

Профиль Публикации 5Комментарии 20Закладки 307

evaclick 19 янв в 14:36

Machine Learning инженер: что/где/как изучать, чтобы въехать

12 мин

29K

Машинное обучение*Карьера в IT-индустрии

Привет, хаброчеловек!

В этой статье мы обсудим путь среднестатистического обывателя в Machine Learning, а именно — как стать ML-инженером. Поговорим о специфике области, какие требуются знания и скиллы, что нужно делать и с чего начать.

+11

thsiganenko 16 янв в 23:28

Отзыв о книге Кристофера Негуса «Linux Библия»

Простой

10 мин

12K

*nix*Профессиональная литература*Операционные системы

Мнение

Попала мне в руки на некоторое время 10-е издание книги Кристофера Негуса «Библия Linux». Поскольку в повседневной деятельности мне приходится работать с системами под управлением различных дистрибутивов, работающих на базе GNU/Linux, столько увесистый труд (масса его 1202 грамм), не мог не вызвать живого интереса. Ну а если, после названия данной книги, взглянуть на ее стоимость, то начинаешь ожидать от нее «откровений».

+22

VladPopovich 14 янв в 12:34

Гайд: проектируем систему цветов. Всё про styles, tokens, variables

Средний

10 мин

10K

Веб-разработка*Анализ и проектирование систем*Интерфейсы*Дизайн

Туториал

В этой статье я расскажу как упорядочить цвета в макетах и в уже готовом продукте; как перейти от стилей к токенам (variables), а также поделюсь рекомендациями для тех, кто только собирается внедрять стили и переменные для цветов.

+14

Boctopr 13 янв в 03:41

Книги, о которых редко говорят

4 мин

46K

Программирование*Математика*Профессиональная литература*Читальный залНаучно-популярное

Дал ему подборку книг, он приходит месяца через два, и с порога такой сразу:
— Я с друзьями не могу разговаривать.
— Ну да есть такой, недостаточек.
интервью Жака Фреско

+87

k_tultseva 7 сен 2021 в 18:42

Основные инструменты Kubernetes в 2021 году

21 мин

25K

Системное администрирование*Блог компании JUG Ru GroupDevOps*Kubernetes*

Перевод

В этой статье я кратко расскажу о своих любимых инструментах для Kubernetes, уделяя особое внимание новейшим и малоизвестным, которые, как мне кажется, скоро станут популярными.

В основе этого списка — мой личный опыт, и чтобы избежать предвзятости, я расскажу и об альтернативных инструментах, чтобы вы могли всё сравнить и принять решение, исходя из своих потребностей. Постараюсь дать информацию сжато и привести источники, чтобы при желании вы могли изучить всё самостоятельно. Описывая инструменты для различных задач разработки ПО, я хотел ответить на вопрос: «Как я могу сделать X в Kubernetes?»

+40

quakin 9 янв в 12:28

Личный прокси для чайников: универсальный обход цензуры с помощью VPS, 3X-UI, Reality/CDN и Warp

Средний

27 мин

117K

Информационная безопасность*Системное администрирование*Сетевые технологии*

Туториал

> С 10 апреля 2024, 3 месяца спустя, > данная статья заблокирована РКН на территории РФ, > но доступна с IP других стран, а также через веб-архив.

На фоне прошлогоднего обострения цензуры в РФ, статьи автора MiraclePTR стали глотком свободы для многих русскоязычных айтишников. Я же хочу приоткрыть дверь к свободной информации чуть шире и пригласить «не‑технарей» («чайников»), желающих поднять личный прокси‑сервер для обхода цензуры, но дезориентированных обилием информации или остановленных непонятной технической ошибкой.

В этой статье я описал универсальное решение, которое обеспечивает прозрачный доступ к международному интернету в обход цензуры, использует передовые технологии маскировки трафика, не зависит от воли одной корпорации и главное — имеет избыточный «запас прочности» от воздействия цензоров.

Статья рассчитана на «чайников», не знакомых с предметной областью. Однако и люди «в теме» могут найти нечто полезное (например, чуть более простую настройку проксирования через CloudFlare без необходимости поднимать nginx на VPS).

Если у вас ещё нет личного прокси для обхода цензуры — это знак.

+109

284

Albert_Wesker 28 дек 2023 в 17:01

Построение архитектур для обработки данных в режиме реального времени при помощи Apache Kafka, Flink и Druid

Сложный

11 мин

8.3K

Системное администрирование*IT-инфраструктура*Блог компании Timeweb CloudApache*Хранилища данных*

Обзор

Перевод

Командам, которые занимаются обработкой данных (поступающих пакетными партиями в рабочих потоках) сложно соответствовать современным требованиям по обработке данных в режиме реального времени. Почему? Потому что пакетный поток данных – от доставки данных до их дальнейшей обработки и анализа – это такая вещь, при работе с которой нужно уметь ждать.

Требуется ждать тех данных, которые пойдут на отправку в ETL-инструмент, дожидаться, пока будет обработана куча данных, ждать, пока информация будет загружена в хранилище данных и даже ждать, пока закончат выполняться сделанные запросы.

Но в опенсорсном пространстве есть решение, разработанное в опенсорсе. В сочетании друг с другом Apache Kafka, Flink и Druid, позволяют создать архитектуру для обработки данных, которая работает в режиме реального времени и позволяет исключить все эти этапы ожидания. В этом посте мы исследуем, как комбинация этих инструментов позволяет создавать широкий спектр приложений для обработки данных в режиме реального времени.

Читать дальше →

+18

alexeyinkin 23 дек 2023 в 23:20

Мои советы после 20 лет в программировании

Простой

44 мин

126K

ФрилансIT-эмиграцияКарьера в IT-индустрииБудущее здесь

Ретроспектива

Сегодня ровно 20 лет, как я начал программировать профессионально. За эти годы я:

• Получил одобрение на петицию по грин‑карте за выдающиеся способности в науке.
• Стал Google Developer Expert.
• Стал IEEE Senior Member.
• Был операционным директором в компании со 100 сотрудниками.
• Написал код, который скачали 135 миллионов раз.
• Выступал перед аудиторией в 2000 человек, дважды.
• Стал самым честным человеком в России по версии НТВ.

Но упустил я гораздо больше и делал всё это слишком долго. Думаю, этот путь можно было бы пройти «на скорость» лет за 5 с теми подходами, принципами и приоритетами, которым я научился. Если вы только начинаете свой путь, этот текст может сэкономить вам 15 лет жизни.

+70

277

stalkermustang 18 дек 2023 в 17:28

GPT-like модель «впервые сделала научное открытие»: что, как, и куда дальше?

Средний

21 мин

98K

Математика*Блог компании Open Data ScienceИскусственный интеллектБудущее здесьNatural Language Processing*

Обзор

14го декабря в одном из самых авторитетных общенаучных журналов Nature была опубликована статья с, кажется, сенсационным заголовком: «ИИ-модели Google DeepMind превосходят математиков в решении нерешённых проблем». А в блогпосте дочки гугла и вовсе не постеснялся указать, что это — первые находки Больших Языковых Моделей (LLM) в открытых математических проблемах. Неужели правда? Или кликбейт — и это в Nature? А может мы и вправду достигли техносингулярности, где машины двигают прогресс? Что ж, давайте во всём разбираться!

Ну давай разберёмся →

+174

271

IvaYan 4 дек 2023 в 12:53

Архитектура современных приложений на основе LLM

Средний

11 мин

6.8K

Машинное обучение*

Обзор

Перевод

В этом посте мы рассмотрим пять наиболее важных этапов, который нужно пройти при разработке собственного приложения на основе LLM, формирующиеся общепринятые подходе к разработке таких приложений и предметные области, на которые стоит обратить внимание.

vasilevafb 4 дек 2023 в 15:01

Как аналитику данных получить заказы на фрилансе: получила 16 заказов за 7 дней

4 мин

17K

ФрилансКарьера в IT-индустрии

Мнение

За 7 дней я получила 16 заказов на фрилансе и в этой статье поделюсь своим опытом: как именно мне удалось это сделать, с каких ресурсов пришли заказы.

Статья будет полезна:

• Если вы хотите использовать фриланс для получения первого опыта и положить выполненные фриланс-задачи в портфолио (40% работодателей отмечают, что фриланс - это лучший способ получить первый опыт)

• Если вы хотите серьезно заняться фрилансом и сделать из фриланса "жизненную философию"

Propan671 25 июл 2023 в 20:02

Python декораторы на максималках. Универсальный рецепт по написанию и аннотированию от мала до велика

Средний

13 мин

30K

Python*

Туториал

Декорирование функций - это, наверное, самая сложная среди базовых и самая простая среди продвинутых фич языка Python. С декораторами, наверное, знакомы все джуны (хотя бы в рамках подготовки к собеседованиям). Однако, крайне мало разработчиков пишут их правильно. Особенно принимая во внимания тенденции последних нескольких лет к аннотированию всего и вся. Даже популярные open-source проекты (если основная часть их кода была написана до 2018 года) вряд ли дадут вам примеры декораторов, отвечающих всем современным требованиям к коду.

Так давайте разбираться!

Материал полностью написан на основе моего опыта по работе над OSS проектами, поэтому в нем вы найдете примеры достаточно сложных кейсов, которые никогда не рассматриваются в других подобных гайдах. В то же время я постарался подвести к ним максимально "мягко", чтобы было понятно даже начинающим питонистам.

В рамках статьи мы разберемся с декорированием функций в Python от простого к самому сложному. Рассмотрим, как их правильно писать и аннотировать, чтобы другие потребители вашего кода не страдали от близкого знакомства с ним. Уверен, что даже если вы чрезвычайно опытный разработчик, вы найдете для себя полезные советы (хотя и можете пропустить солидную часть материала).

Давайте разбираться

+43

serhit 3 дек 2023 в 02:33

Сервис проверки пользовательских файлов «powered by pytest»: нужно повозиться, но оно того стоит

Средний

10 мин

3.3K

Тестирование IT-систем*Python*Программирование*Микросервисы*

Туториал

Возникла задача проверки нескольких типов пользовательских документов Excel. Проверка должна покрывать такие аспекты как корректность шаблона (наличие ожидаемых страниц, колонок таблиц) и корректность данных (присутствие обязательных значений, корректность значений точки зрения форматов, отсутствие дубликации, итд).

Пользователю нужно возвращать информацию "что не так с файлом": какую проверку не прошел файл и где конкретно в файле проблемные данные.

Эта задача - про качество данных и очень напоминает тестирование. Так почему не использовать фреймворк тестирования pytest, и не написать тесты на каждый проверяемый аспект и для каждого типа файлов? Однако, есть небольшое "но". проверка должна быть реализована в качестве сервиса, чтобы встраиваться в более широкий процесс обработки пользовательских документов.

Давайте посмотрим, как заставить pytest работать внутри сервиса. Это не так тривиально, как может показаться на первый взгляд.

ru_vds 29 ноя 2023 в 16:00

Керниган и Пайк были правы: делай что-то одно и делай это хорошо

Простой

11 мин

26K

Программирование*Управление разработкой*Блог компании RUVDS.comУправление проектами*Микросервисы*

Мнение

Перевод

Роб Пайк и Брайан Керниган

В октябре 1984 года два идеолога опубликовали радикальный манифест… ну, или что-то вроде того.

Легенды computer science Брайан Керниган и Роб Пайк сформулировали в Program Design in the UNIX Environment паттерн архитектуры ПО, за сохранение которого оба боролись долгие годы.

Как и следовало ожидать от манифеста, в нём два этих канадских инженера максимально решительны. Самый резкий удар в статье — это запомнившаяся многим строчка из аннотации:

Старые программы покрываются коркой сомнительных фич.

Суть статьи часто сводят к аббревиатуре DOTADIW, или «Do One Thing And Do It Well» («Делайте что-то одно и делайте это хорошо»). В Unix и его потомках есть множество программ, в которых воплощена эта мантра: ls просто создаёт список файлов, cat просто выводит содержимое файлов, grep просто фильтрует данные, wc просто подсчитывает слова и так далее. У каждой программы есть несколько опций, меняющих её поведение, но не слишком сильно. Например: wc можно сконфигурировать для подсчёта строк или слов, но не для подсчёта количества абзацев или вхождений какой-то фразы.

Мощь Unix, защищаемая Керниганом и Пайком, заключалась в возможности соединения этих простых программ в цепочку для создания сложных поведений. Зачем добавлять сопоставление регулярных выражений в wc, если с этим уже способна справиться grep?

Читать дальше →

+57

ru_vds 27 ноя 2023 в 16:00

Искусство создания понятных графиков

Средний

7 мин

22K

Программирование*Визуализация данных*Блог компании RUVDS.comГрафический дизайн*

Туториал

Перевод

Эта статья — субъективное эссе о хороших и плохих практиках в визуализации данных, в нём приведены примеры и объяснения.

В папке Scripts/ на Github есть файлы .Rmd, генерирующие показанные ниже графики. Для их работы требуются R, RStudio и пакет rmarkdown.

R: Скачать R
RStudio: скачать RStudio
rmarkdown можно установить при помощи интерфейса установки пакетов в RStudio

Читать дальше →

+91

ibessonov 26 ноя 2023 в 23:09

Какова вероятность найти слово fuck в случайной последовательности из 20 букв?

Средний

20 мин

12K

Занимательные задачкиПрограммирование*Алгоритмы*Математика*

Однажды на работе возник вопрос — насколько вероятно, что в случайно сгенерированном идентификаторе (отдаваемом пользователю, к примеру) вдруг обнаружится плохое слово. Приблизительная оценка была дана достаточно быстро, а вот точное решение — уже не так тривиально.

Я решил всерьёз выяснить, чему равна эта вероятность в зависимости от длины случайной строки? Можно ли получить явную математическую формулу для ответа? Что, если взять другое слово? Что, если взять другой алфавит?

Обо всём по порядку.

Читать дальше →

+55

Morthan 21 ноя 2023 в 09:26

Учебное пособие по Textual

Простой

21 мин

2.6K

Python*

Туториал

Перевод

Перевод туториала по фреймворку для построения TUI (текстовых интерфейсов). Кроссплатформенность, возможность вывода в веб, а также олдскульность.

Читать дальше →

tech_priestess 18 ноя 2023 в 18:06

Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить

Простой

26 мин

174K

Машинное обучение*Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Туториал

Всем доброго времени суток. Я давно обещала выложить сюда подробный гайд на тему того, как можно изучать Machine Learning самостоятельно, не тратя деньги на платные курсы, и, наконец, выполняю свое обещание. Надеюсь, этот гайд станет подсказкой, которая поможет найти правильное направление новичкам, которые хотят погрузиться в нашу область.

+155

shpringer 16 ноя 2023 в 15:01

5 уровней зрелости MLOps

9 мин

6.7K

Блог компании VKBig Data*Машинное обучение*

Перевод

Google и Microsoft представили свои уровни зрелости MLOps — они описывают развитие инфраструктуры ML на основе лучших практик в отрасли. Команда VK Cloud перевела статью, в которой описано лучшее из обоих фреймворков.

Читать дальше →

+15

phanerostroi_evidence 7 ноя 2023 в 11:31

Взлет Lies of P или Почему так популярны соулслайки? Часть 1. В ожидании Dark Souls 5

Средний

17 мин

8.3K

Разработка игр*Блог компании FirstVDSДизайн игр*Игры и игровые консоли

Обзор

Те, кто следят за индустрией игр, наверняка заметили, что в списки анонсов среди наиболее ожидаемых игр все чаще стали попадаться так называемые соулслайки. Да, многие из них быстро уступают свое место играм других категорий. Однако с каждым разом проекты в этой категории появляются все чаще и держатся в топах все дольше. И это несмотря на славу «хардкорных» проектов, требующих недюжинной сноровки, и «отсутствие сюжета». Что ж, так ли страшен черт, как его малюют? И что в этих проектах может заинтересовать человека, который никогда ранее с подобным не сталкивался? Об этом пойдет речь сегодня.

Читать дальше →

+26

1 2

4 5 ...

14 15