Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

Sentient85 19 апр в 11:01

Фича стор, CLTV и как построить много моделей в короткий срок

Средний

10 мин

Блог компании Альфа-БанкМашинное обучение*Финансы в ITData Engineering*

Кейс

Условия задачи: дано число клиентов банка N, число банковских продуктов М, горизонт времени прогноза Т. Нужно посчитать ( Pij ).

Привет, меня зовут Игорь Дойников, в Альфе я CDS — Chief Data Scientist в Розничном Бизнесе. Моя команда строит модели машинного обучения для розничного бизнеса Альфа-Банка. В статье я расскажу как, собственно, эту задачу решать и зачем. Сначала пройдёмся по CLTV, как бизнес постановки задачи мы перешли к задаче машинного обучения, какие при этом возникали проблемы и как мы их решали. А главное — что такое Feature Store и как этот инструмент помогает нам решать задачи СLTV.

+11

dimkablin 19 апр в 02:19

Как аппроксимировать любую функцию с помощью PyTorch

Простой

6 мин

5.3K

Python*Программирование*Машинное обучение*

Туториал

При анализе данных и построении моделей машинного обучения часто возникает необходимость аппроксимировать сложные функции. PyTorch предоставляет удобные инструменты для создания и обучения нейронных сетей, которые могут быть эффективно использованы для этой цели. В этом посте мы рассмотрим простой пример аппроксимации функции с использованием PyTorch.

jstmeowme 18 апр в 17:24

Devin AI — разоблачение от пользователей Reddit или 3 причины, почему искусственный интеллект не заменит разработчика

Простой

4 мин

6.6K

Блог компании BotHubМашинное обучение*Исследования и прогнозы в IT*Искусственный интеллект

Мнение

12 марта текущего года компания Cognition представила Devin AI, первого в мире, по словам разработчиков, полностью автономного ИИ-программиста. В своем блоге Cognition написали: «Devin может планировать и выполнять сложные инженерные задачи, вспоминать соответствующий контекст на каждом этапе, учиться со временем и исправлять ошибки». Они также продемонстрировали аудитории способности ИИ на реальном примере с сайта Upwork, из-за чего в начале весны вызвали волну обсуждений и заставили программистов опасаться за свои рабочие места.

Однако, похоже, можно спокойно выдохнуть, поскольку недавно компания была обвинена во лжи. Пользователи сомневаются в работоспособности Devin AI, называя примеры из промо-видео фейками и указывая на то, что выпущенный продукт совсем не соответствует действительности.

Действительно ли Devin AI всего лишь хитроумный трюк маркетинга, или же будущее уже на пороге? Разберем подробности в статье.

MidavNibush 18 апр в 16:51

Mojo: убийца Python и будущее AI

Простой

5 мин

26K

Блог компании RaftOpen source*Программирование*Машинное обучение*Искусственный интеллект

Обзор

Всем привет! Меня зовут Вадим, я Data Scientist в компании RAFT. Сейчас технологии AI применяются и развиваются во многих сферах деятельности человека, в особенности LLM, про которые уже слышал каждый. В большинстве случаев подобные технологии реализуют на Python, используя различные библиотеки, такие как pytorch, tensorflow, jax. Все они имеют свои преимущества и недостатки. Например, всем известная скорость вычислений.

+25

AntonSoroka 18 апр в 14:20

Автоматически выделяем кусочно-линейные тренды временного ряда

Средний

7 мин

4.1K

Open source*Python*Математика*Машинное обучение*Статистика в IT

Из песочницы

Меня зовут Антон Сорока, я математик и аналитик данных.

Я хотел бы рассказать об алгоритме, который выделяет кусочно-линейный тренд из временного ряда и сам определяет точки изменения тренда. Другими словами, это алгоритм для автоматического кусочно-линейного приближения любой функции. Это может понадобиться, если вам важно анализировать линейные тренды ряда, но единственная линия явно недостаточно точно описывает ряд, и самостоятельно искать точки, где тренд менялся, неудобно. Реализация этого алгоритма есть в open-source библиотеке для анализа изменений временных рядов, написанной на Python.

badcasedaily1 18 апр в 13:02

Кратко про язык программирования Triton

5 мин

3.3K

Блог компании OTUSPython*Программирование*Машинное обучение*

Triton был разработан специально для выполнения на GPU и предоставляет удобную Python-ориентированную среду.

Triton позволяет использовать модель программирования, основанную на блоках, которая значительно отличается от традиционной модели CUDA. Вместо управления потоками на уровне скалярных инструкций, Triton оперирует блоками данных, что в целом дает более лучшую производительность.

zergood 18 апр в 13:00

Как найти баланс между интересами покупателей и продавцов: опыт разработчиков Яндекс Маркета

7 мин

1.6K

Блог компании ЯндексАлгоритмы*Машинное обучение*Интернет-маркетинг*Контекстная реклама*

Привет, Хабр! Меня зовут Илья Ненахов, я руковожу разработкой платформы для продвижения товаров на Яндекс Маркете. Предлагаю взглянуть на площадку немного с другой стороны, а именно — как на механизм, который пытается найти оптимальную точку в пространстве с тремя измерениями: интересы пользователя, интересы магазинов и интересы самого сервиса.

В этой статье я расскажу о том, как мы поддерживаем этот баланс с помощью технологий Яндекса. Поговорим про метрики, ранжирование и устройство рантайма. Наш опыт может быть полезен тем разработчикам, которые работают над похожими задачами в других компаниях.

+16

VladimirMironovML 18 апр в 12:07

Открытый AI в коммерческом продакшене: обзор h2oGPT

13 мин

3.7K

Блог компании SelectelМашинное обучение*Научно-популярноеИскусственный интеллектIT-компании

Обзор

Крупные компании пока используют проприетарные нейросети, мягко говоря, неохотно или не используют вовсе. Как правило, их применяют отдельные сотрудники. Частично это можно объяснить опасениями со стороны специалистов по информационной безопасности, ведь тот же ChatGPT, например, открыто общается с интернетом. И в этот момент на сцену выходит open source.

В этой статье поговорим, из чего состоит h2oGPT, на каких моделях функционирует, какими метриками оценивается и в какой сервис «завернут». Дополнительно взглянем на конкурентов и ситуацию на рынке в целом.

Читать дальше →

+36

tomleto 18 апр в 09:44

Чат-бот: делать самим, заказывать или использовать готовый продукт

Простой

3 мин

1.2K

Мессенджеры*Service Desk*Машинное обучение*Искусственный интеллект

Часто получаю вопрос: "Наши программисты сами сделали бота и на тестовых вопросах работает отлично, но при ответах на реальные вопросы пользователей начинается треш. Как сделать супер промпт чтобы бот не глючил?".

Ответ простой: "Серебряной пули нет, задачу нужно разбивать на части и использовать разные инструменты для решения разных проблем".

Squirrelfm 18 апр в 08:30

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Простой

3 мин

8.5K

Блог компании RaftМашинное обучение*Искусственный интеллект

Обзор

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально. Там можно остаться и без AI, а этого мужики точно не поймут. Есть ли какие-то способы решения этой проблемы?

Если у вас такая ситуация – можете выдохнуть, решение есть.

+39

MaxRokatansky 17 апр в 21:20

Определение жанра фильма по описанию

17 мин

1.4K

Блог компании OTUSМашинное обучение*Искусственный интеллект

В ходе поиска темы проектной работы, которой должен был завершиться курс Machine Learning. Professional, я решил поэкспериментировать с данными о фильмах, мультфильмах, сериалах и прочей схожей продукции. Немного сожалея, что времени смотреть кинопродукцию у меня почти нет, приступим.

+10

skillfactory_school 17 апр в 18:17

Как избирательное забывание помогает в обучении ИИ

Средний

4 мин

877

Блог компании SkillfactoryМашинное обучение*Natural Language Processing*

Обзор

Перевод

Удаление определенной информации в процессе обучения помогает моделям машинного обучения быстрее и лучше осваивать новые языки.

Группа ученых в области компьютерных наук придумала более гибкую модель машинного обучения. В чем особенность: модель должна периодически забывать кое-что из того, что знает. Новый подход не заменит огромные модели, но зато, возможно, подскажет нам, как именно они понимают естественный язык.

MaxRokatansky 17 апр в 16:30

Обнаружение аномальных звуков сердцебиения на основе записей сердечного ритма

Средний

10 мин

1.3K

Блог компании OTUSМашинное обучение*Здоровье

Кейс

Всем привет! Сегодня рассмотрим задачу обнаружения аномалий тонов сердца, используя аудиозаписи звуков сердцебиения. Для этого будем использовать библиотеку librosa по работе с аудиофайлами, а также классические алгоритмы машинного обучения и методы глубокого обучения.

Возьмем датасет “Heartbeat Sound”, который содержит аудиофрагменты сердечных ритмов различной продолжительности от 1 до 30 секунд, как здоровых пациентов, так и имеющих аномальные звуки сердцебиения. Набор содержит 813 аудиофайл с записями, разбитыми по категориям: artefact, extrastole, murmur, normal и unlabel. Попробуем разобраться, что обозначают эти категории.

Normal - как и следует из названия, нормальное сильное ритмичное сердцебиение.

Murmur - записи звука сердца, где присутствуем какой-то шум, например, свист, рев, урчание. Наличие такого шума может быть симптомом многих заболеваний сердца.

Etrastole - экстрасистолические (дополнительные) записи звука, которые могут появляться время от времени и могут быть идентифицированы по отсутствию сердечного тона, включающему дополнительные или пропущенные сердечные сокращения. Экстрасистола может не быть признаком заболевания, но в некоторых ситуациях могут быть вызваны заболеваниями сердца.

Artefact - по сути не является сердцебиением, и характеризуется широким спектром различных звуков.. В этой категории содержится широкий спектр различных звуков, включая визги, эхо, речь, музыку. Обычно различимые тоны сердца отсутствуют, важно определять эту категорию записей, чтобы можно было повторить исследование.

DimDimDimDimDim 17 апр в 11:39

Что такое дрифт ML-моделей и как его мониторить?

8 мин

2.6K

Блог компании SelectelПрограммирование*IT-инфраструктура*Машинное обучение*IT-компании

Даже при наличии качественных входных данных качество предсказаний ML-модели со временем ухудшается. Под катом рассмотрим, как команда Neoflex с помощью мониторинга обнаруживает изменения вовремя и поделимся подборкой open source-библиотек для определения дрифта данных.

Теперь клиенты Selectel могут оптимизировать управление DS/ML-моделями с помощью MLOps-платформы Neoflex Dognauts. Она обеспечивает автоматизацию полного цикла разработки и эксплуатации моделей машинного обучения.

Читать дальше →

+41

Dmytro_Kikot 17 апр в 10:00

Голопалуба: реализация технологии из сериала «Звездный путь»

13 мин

1.4K

Блог компании ua-hosting.companyМашинное обучение*Научно-популярноеИскусственный интеллект

Современный мир сложно представить без технологий, которые его наполняют. Некоторые из них малозаметны, тогда как другие приковывают к себе внимание буквально всех и каждого. Одной из таких технологий является искусственный интеллект. Данное направление объединяет в себе множество отдельных, но взаимосвязанных ветвей, одной из которых является генеративный ИИ. Основная функция такого ИИ заключается в генерации текстов, изображений или других медиаданных в ответ на запрос человека. Говоря о таком взаимоотношении между человеком и машиной, первым на ум приходит крайне популярный ChatGPT. Но его возможности хоть и велики, но не безграничны. Ученые из Школы инженерии и прикладных наук Пенсильванского университета (США) разработали систему, способную в ответ на текстовый запрос пользователя генерировать трехмерную виртуальную среду, как это делала голопалуба в сериале «Звездный путь: Следующее поколение». Как работает данная система, насколько обширны ее возможности, и где она может быть полезна? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+12

hommforever 16 апр в 13:01

Яндекс запустил Нейро. Рассказываем, как он работает

Средний

14 мин

43K

Блог компании ЯндексПоисковые технологии*Алгоритмы*Машинное обучение*Искусственный интеллект

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

+88

142

Sivchenko_translate 15 апр в 17:34

На пути к 1-разрядным моделям машинного обучения

8 мин

3.8K

Программирование*Математика*Машинное обучение*Natural Language Processing*

Перевод

В последнее время активно разрабатываются технологии экстремально малоразрядного квантования, например, BitNet и 1.58 bit. Они пользуются большим интересом в сообществе машинного обучения. Основная идея данного подхода заключается в том, что перемножение матриц с квантованными весами можно реализовать и умножения, что потенциально полностью меняет правила игры применительно к скорости вычислений и эффективности больших моделей машинного обучения.

Эта статья написана в схожем ключе, но нас наиболее интересует, возможно ли напрямую квантовать предобученные модели при экстремальных настройках, в том числе, при двоичных весах (0 и 1). Уже имеющиеся работы нацелены на обучение моделей с нуля. Но в открытом доступе сейчас достаточно много отличных предобученных моделей, таких как Llama2. Более того, обучение с нуля — это ресурсозатратная задача в пересчёте как на вычисления, так и на данные, поэтому такие подходы не слишком доступны в свободном сообществе.

В этой статье мы подробно разберём крайне малоразрядное (2 и 1-разрядное) квантование предобученных моделей с применением HQQ+. HQQ+ — это адаптация HQQ (полуквадратичного квантования), в которой для повышения производительности используется адаптер с низкой размерностью. Наши результаты показывают, что при обучении лишь небольшой части весов в верхней части HQQ-квантованной модели (даже одноразрядной) качество вывода значительно возрастает, такая модель может даже превосходить небольшие модели полной точности.

Модели находятся на Hugging Face: 1-разрядная, 2-разрядная.

+19

dblmokk 15 апр в 17:04

Строим lineage моделей машинного обучения и признаков с помощью OpenMetadata

Средний

9 мин

5.1K

Блог компании билайнBig Data*Хранение данных*Машинное обучение*

Туториал

Привет, Хабр!

Мы в билайне любим машинное обучение. В какой-то момент моделей машинного обучения стало так много, что это вынудило нас решать определенные задачи. Я Дмитрий Ермилов, руковожу ML в дирекции по искусственному интеллекту и цифровым продуктам. О решении одной такой задачи и будет этот рассказ.

Давайте представим, что у вас в компании большое количество моделей машинного обучения, каждая из которой может зависеть от нескольких десятков до нескольких тысяч признаков (фич). Причем разные модели могут зависеть от одних и тех же фич. Неожиданно случается несчастье, и одна из популярных фич ломается. Может произойти поломка на уровне подготовки данных, могут измениться внешние источники, отвалиться интеграции и прочее. Что делать с этим знанием? Конечно, бежать в продуктовые команды и кричать, что модели, которые зависят от этой фичи, могут деградировать, то есть их метрики качества могут снизиться. Вопрос только в том, какие модели могут деградировать и в какие команды бежать?

Напомним, в каких условиях мы анализируем данные и строим модели машинного обучения.

+14

Natyren 15 апр в 10:58

Использование LLM в автоматизации рутинных задач

Средний

14 мин

8.6K

Блог компании SberDevicesРасширения для браузеровМашинное обучение*Искусственный интеллект

Обзор

Всем привет!

На связи Георгий Бредис, Deep Learning Engineer из команды Intelligent Document Processing в SberDevices. Наша команда занимается задачами автоматизации бизнес-процессов путем извлечения информации из неструктурированного контента и созданием сервисов суммаризации и поиска на основе LLM. В данный момент мы исследуем новые способы извлечения информации из интерфейсов, что открывает новые возможности для автоматизации процессов в сфере RPA.

В этой статье речь пойдет об использовании больших языковых моделей для работы с браузером, как одного из самых распространенных примеров интерфейса.

+23

kamaisha 15 апр в 10:00

Какой язык программирования выбрать? Обзор Python

Простой

4 мин

7.1K

Блог компании КриптонитВеб-разработка*Python*Машинное обучение*Искусственный интеллект

Шестая статья нашего цикла про языки программирования посвящена Python. Её подготовила группа серверной разработки компании «Криптонит». В обзоре вы найдёте особенности, плюсы и минусы Python, сферы его применения и полезные ссылки для обучения.

Ранее наши разработчики делали обзоры Rust, Scala, JavaScript, Spark и Golang.

3 4 ...

324 325

Машинное обучение *

Фича стор, CLTV и как построить много моделей в короткий срок

Как аппроксимировать любую функцию с помощью PyTorch

Devin AI — разоблачение от пользователей Reddit или 3 причины, почему искусственный интеллект не заменит разработчика

Mojo: убийца Python и будущее AI

Истории

Автоматически выделяем кусочно-линейные тренды временного ряда

Кратко про язык программирования Triton

Как найти баланс между интересами покупателей и продавцов: опыт разработчиков Яндекс Маркета

Открытый AI в коммерческом продакшене: обзор h2oGPT

Чат-бот: делать самим, заказывать или использовать готовый продукт

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Определение жанра фильма по описанию

Как избирательное забывание помогает в обучении ИИ

Обнаружение аномальных звуков сердцебиения на основе записей сердечного ритма

Ближайшие события

Что такое дрифт ML-моделей и как его мониторить?

Голопалуба: реализация технологии из сериала «Звездный путь»

Яндекс запустил Нейро. Рассказываем, как он работает

На пути к 1-разрядным моделям машинного обучения

Строим lineage моделей машинного обучения и признаков с помощью OpenMetadata

Использование LLM в автоматизации рутинных задач

Какой язык программирования выбрать? Обзор Python

Вклад авторов

Работа