Pull to refresh
43
0
Негрей Аким Алексеевич @anegrey

Разработчик ПО

Send message

Quantization Deep Dive, или Введение в современную квантизацию

Level of difficulty Medium
Reading time 16 min
Views 9.4K

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая живёт в умных колонках Яндекса и ждёт от пользователя слова «Алиса». Одной из моих задач в этой команде была квантизация моделей. На пользовательских устройствах мало ресурсов, и мы решили, что за счёт квантизации сможем их сэкономить — так в итоге и вышло.

Потом я перешёл в команду YandexGPT. Вместо маленьких моделей я стал работать с очень крупными. Мне стало интересно, как устроена квантизация больших языковых моделей (LLM). Ещё меня очень впечатляли истории, где люди берут гигантские нейросети, квантизируют в 4 бита и умудряются запускать их на ноутбуках. Я решил разобраться, как это делается, и собрал материал на доклад для коллег и друзей. А потом пришла мысль поделиться знаниями с более широкой аудиторией, оформив их в статью. Так я и оказался на Хабре :)

Надеюсь, погружение в тему квантизации будет интересно как специалистам, так и энтузиастам в сфере обучения нейросетей. Я постарался написать статью, которую хотел бы прочитать сам, когда только начинал изучать, как заставить модели работать эффективнее. В ней мы подробно разберём, зачем нужна квантизация и в какой момент лучше всего квантизовать модель, а ещё рассмотрим разные типы данных и современные методы квантизации.

Читать далее
Total votes 76: ↑75 and ↓1 +74
Comments 13

Когда ВВС США осознали изъян со средними числами

Reading time 9 min
Views 130K
Отрывок из книги "The End of Average" Тодда Роуза


В начале 1950-х американцы измерили тела более 4000 пилотов по 140 характеристикам, чтобы спроектировать идеальную кабину для среднего пилота

В конце 1940-х у американских военно-воздушных сил была серьёзная проблема: пилоты теряли контроль над самолётами. Тогда наступала эпоха реактивных двигателей, так что самолёты стали более быстрыми и сложными в управлении. Но катастрофы случались так часто и на таком количестве разнообразных самолётов, что ВВС США столкнулись с реальной проблемой спасения жизней. В худшее время разбивалось до 17 пилотов за день.
Читать дальше →
Total votes 107: ↑101 and ↓6 +95
Comments 192

Взлом YouTube для быстрого скачивания видео

Reading time 9 min
Views 64K
Мы неоднократно рассказывали о специальном софте, который позволяет скачивать видео с YouTube. Это в первую очередь youtube-dl (yt-dl) и его клоны, такие как yt-dlp и yt-dlc. С ними воюют могучие копирасты, пытаются удалить их из поисковой выдачи, с хостингов, с Github и так далее, по известной схеме «тотальная война».

Но главным врагом для этих программ остаются даже не правообладатели, а злобная корпорация Google, которая постоянно вносит изменения в YouTube API, чтобы прекратить злоупотребления сервисом помешать людям скачивать файлы, ведь от этого Google никакой прибыли.

Сами программки — просто технические инструменты для скачивания общедоступного контента, они ничего не воруют и не пиратят. Просто доступ происходит нестандартным способом, который не предусмотрен официально. Посмотрим, как это делается.
Читать дальше →
Total votes 168: ↑158 and ↓10 +148
Comments 421

Существование треугольника Шарыгина — это настоящее математическое чудо

Level of difficulty Easy
Reading time 2 min
Views 168K

Сегодня я хочу рассказать про особый вид треугольников, впервые рассмотренный советским математиком Игорем Федоровичем Шарыгиным. Удивительно, что до ХХ века никто так и не обратил внимание на этот бриллиант.

Читать далее
Total votes 173: ↑166 and ↓7 +159
Comments 72

Я вижу как ты мусоришь со своего балкона

Reading time 9 min
Views 52K

Вот выходишь ты утром на работу, а на газоне перед домом окурки и прочие отходы жизнедеятельности. Бывает, что приходишь домой, а у тебя на балконе пепел или даже окурок. Как же хочется понять, кто это сделал! Я вот терпеть не могу таких людей. Моя история о том, как найти вредителей и, возможно, сделать свой дом немного чище и безопаснее.

Читать далее
Total votes 256: ↑250 and ↓6 +244
Comments 318

Два с половиной приема при работе с argparse

Reading time 5 min
Views 32K

Приемы, описанные здесь, есть в официальной документации к модулю argparse (я использую Python 2.7), ничего нового я не изобрел, просто, попользовавшись ими некоторое время, убедился в их мощности. Они позволяют улучшить структуру программы и решить следующие задачи:

  1. Вызов определенной функции в ответ на заданный параметр командной строки с лаконичной диспетчеризацией.
  2. Инкапсуляция обработки и валидации введенных пользователем данных.

Что там еще за пол-приема?
Total votes 28: ↑25 and ↓3 +22
Comments 18

Береги глаза: обзор программ, прерывающих работу за компьютером

Reading time 4 min
Views 178K
image Оторваться от компьютера — частая проблема для айтишников. Нашедшее вдохновение или затягивающий интернет — и часы пролетают незаметно, а глаза после этого хотят вывалиться. Итог — садящееся зрение, понижение производительности, кривая спина и квадратная попа.

Когда собственной силы воли(или внимательности к своему самочувствию) не хватает, на помощь приходят специальные программки.
Читать дальше →
Total votes 119: ↑95 and ↓24 +71
Comments 118

Чтение больших объемов данных в Python/Postgresql

Reading time 3 min
Views 26K
Стек рассматриваемых технологий: Postgresql 9.3, Python 2.7 с установленным модулем «psycopg2».

Проблема


Как часто в вашей практике приходилось сталкиваться с задачей обработки таблиц большого объема (более 10 млн. записей)? Думаю вы согласитесь, что данная задача является довольно ресурсоемкой как в плане времени обработки, так и задействованных ресурсов системы. Сегодня я постараюсь показать альтернативный способ решения задачи.

Предложение:


В СУБД Postgresql есть прекрасный оператор для работы с большими объемами информации, а именно «COPY». Применение данного оператора позволяет нам читать и записывать огромные объемы информации в таблицу. В данной статье мы будем рассматривать режим чтения.

Согласно документации оператора «COPY» нам доступны несколько режимов чтения в файл либо в поток STDOUT, а также различные форматы, в том числе и «csv». Как раз его мы и постараемся использовать с максимальной пользой.
Читать дальше →
Total votes 21: ↑19 and ↓2 +17
Comments 15

Симулятор электронных схем Qucs-S снова жив

Reading time 6 min
Views 40K

Qucs-S является программой с открытым исходным кодом для моделирования электронных схем. Qucs-S кроссплатформенный (поддерживаются Linux, Windows и FreeBSD), написан на С++ с использованием набора библиотек Qt и разрабатывается полностью в частном порядке (в отличие, например от KiCAD, который имеет спонсора в лице CERN). В феврале этого года проект восстал из мёртвых и вышел релиз 0.0.23. Главным новшеством версии 0.0.23 было то, что программа теперь портирована на Qt5, чем обеспечена собираемость на современных дистрибутивах Linux. Актуальным релизом на текущий момент является 0.0.24 https://github.com/ra3xdh/qucs_s/releases/tag/0.0.24, в котором добавлено несколько новых видов моделирования. Далее будут рассмотрены основные возможности программы и показано как в Qucs-S смоделировать схему.


Читать дальше →
Total votes 74: ↑74 and ↓0 +74
Comments 33

Малоизвестное обобщение теоремы Пифагора

Reading time 7 min
Views 63K
Теорема Пифагора — пожалуй, самая известная из математических теорем. Сколько существует оригинальных доказательств! Сколько применений она находит в технике! Сколькими благами цивилизации мы обязаны этой великой теореме! Однако, совсем недавно, я открыл для себя совершенно новую, ранее неизвестную грань этой теоремы, которая значительно расширяет область ее применения. Именно этим открытием я и хочу поделиться с вами, уважаемые читатели Geektimes. Пожалуйста, не судите строго, если описанные с статье факты, вам известны. Это скроее развлекательная история с научно-популярным элементом, чем строгая математика.
Геометрическое доказательство теоремы Пифагора
Геометрическое доказательство теоремы Пифагора
Читать дальше →
Total votes 78: ↑73 and ↓5 +68
Comments 209

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

Level of difficulty Medium
Reading time 18 min
Views 49K

Не так давно в интернете появилась душещипательная история, как пользователь hackdaddy8000 сперва создал виртуальную девушку, а затем усыпил ее. Моральный и мемный аспект этого события обсуждали в комментариях под новостями.

Поговорим о технической стороне. Как повторить этот шедевр и можно ли обойтись без сервисов OpenAI, которые сложно оплатить в России? И главное — сколько придется инвестировать в виртуальную подругу.
Читать дальше →
Total votes 121: ↑116 and ↓5 +111
Comments 65

Что такое BitTorrent v2, и что с ним произошло?

Reading time 3 min
Views 43K

Наверное вы слышали о новом протоколе BitTorrent v2, работа над которым велась с 2008-го года, и наделала шума с выходом второй версии популярной торрент-библиотеки Libtorrent, которой пользуются знакомые вам торрент-клиенты, такие как qBittorrent, Deluge и многие другие. Что такого изящного в новом протоколе и чего нам ждать?

Скачать раздачу по зрительной ссылке
Total votes 100: ↑97 and ↓3 +94
Comments 248

Как я оптимизировал стандартную русскую раскладку

Reading time 18 min
Views 24K

Почему буквы на клавиатуре расположены в определённом порядке и какой порядок букв позволяет печатать быстрее всего

Читать далее
Total votes 128: ↑126 and ↓2 +124
Comments 169

Две культуры программирования: почему обе из них важны?

Reading time 13 min
Views 56K
Уже несколько лет я замечаю, что программисты и программистские инструменты делятся на две разные культуры:



Изначально я человек первой культуры и очень долгое время считал вторую несерьёзной. Пару-тройку лет назад я окончательно понял, что ошибался. Многие «старички» ошибаются в ту же сторону, а в последние годы ещё большее число людей ошибаются в обратную. Знакомство с соседней культурой и понимание, почему дела в ней делаются так, как там принято, превратит вас в лучшего разработчика.
Читать дальше →
Total votes 190: ↑172 and ↓18 +154
Comments 107

Виртуальные функции и деструктор

Reading time 6 min
Views 167K
Когда-то давным давно я собирался и даже обещал написать про механизм виртуальных функций относительно деструкторов. Теперь у меня наконец появилось свободное время и я решил воплотить эту затею в жизнь. На самом деле эта мини-статья служит «прологом» к моей следующей статье. Но я постарался изложить доходчиво и понятно основные моменты по текущей теме. Если вы чувствуете, что еще недостаточно разобрались в механизме виртуальных вызовов, то, возможно, вам следует для начала прочитать мою предыдущую статью.

Сразу же, как обычно, оговорюсь, что: 1) статья моя не претендует на полноту изложения материала; 2) мегапрограммеры ничего нового здесь не узнают; 3) материал не новый и давно описан во многих книгах, но если явно об этом не прочитать и самому специально не задумываться, то можно о некоторых моментах даже не подозревать (до поры, до времени). Также прошу прощения за надуманные примеры :)

Все-таки интересно?
Total votes 48: ↑40 and ↓8 +32
Comments 66

История успеха ZX Spectrum и культовые игры для него

Reading time 13 min
Views 25K

16 сентября 2021 года скончался сэр Клайв Синклер, создатель ZX Spectrum. Недавно я пролистывал подборку статей на Хабре и наткнулся на пост про годовщину его смерти. И вдруг вспомнил, как в далекой юности мы с отцом и братом резались в Boulder Dash, Dizzy и Elite на «Синклере», как его называли в народе. Кажется, шел 1994 год. 

Так уж совпало, что в тот же день, как увидел новости, я играл на PS4 в игру Sekiro: Shadows Die Twice. К слову, это довольно сложновато — отдельный привет разработчику игры Миядзаки. И когда мне в очередной раз всыпали треклятые самураи, я в ярости разбил джойстик об стол. В тот момент я снова вспомнил отца, когда он на последнем уровне сложности пытался схватить человечком последний кристалл в Boulder Dash, но немного не успевал. И точно так же разнес самодельную клавиатуру вдребезги. Яблоко от яблони, как говорится… 

Все эти эмоции наслоились в голове, и я поймал себя на мысли — какие же клевые были игры. Да, графики не было от слова совсем. Но логики, «играбельности» и просто какого-то шарма было даже больше, как я вспоминаю. И я твердо решил: хочу рассказать на Хабре про Клайва Синклера, его жизнь и про то, какие же клевые игры были на ZX Spectrum. Старожилов я ничем не удивлю, а вот молодое поколение, которое про это только слышали, надеюсь, приобщиться к прекрасному.

Читать далее
Total votes 82: ↑81 and ↓1 +80
Comments 177

Ubuntu EducationPack 11.04 — образование, наука и программирование

Reading time 5 min
Views 13K
Это широкий и наиболее полный набор программ, которые успешно используются в европейских образовательных учреждениях для младших, средних и старших классов школ и лицеев, а также высших учебных заведений таких как институты и университеты.

Учитывая специфику большой разницы технических характеристик, используемых в образовательных учреждениях, компьютеров (от слабых до современных), наше решение включает дистрибутивы систем xUbuntu и Ubuntu, что позволит установить этот пакет на большинство типов компьютеров.

Таким образом, мы стремимся помочь и предоставить образовательным учреждениям более дешевую альтернативу дорогостоящему ПО, которая будет отвечать всем необходимым требованиям и поможет в образовании и организации учебного процесса.

Комплект содержит 116 приложений для учебных учреждений.

Из них:
  • контроль компьютеров учеников преподавателем;
  • система управления и обучения в режиме он-лайн; коллективного преподавания, изучение и тестирования;
  • создание расписаний занятий образовательных учреждений для распределения нагрузки на учителей;
  • комплект административных программ для школ;
  • образовательные игры для детей от 2-х лет (развитие памяти, внимания);
  • программы для изучения алгебры, геометрии, физики, химии, географии, астрономии и т.д.;
  • визуальные среды разработок для языков программирования на С++, С#, Mono, Pascal;

а также:
  • динамическая геометрическая среда; решение и построение графиков математических выражений; система компьютерной алгебры (CAS)
  • пакет прикладных математических программ, предоставляющий мощное окружение для инженерных (технических) и научных расчётов;
  • рисование и расчеты химических структур; просмотр макро-молекул и подготовка к публикации их изображений; редактор химических схем и реакций;
  • схематическое создание электронных схем, графические симуляторы компьютерных сетей и электрических схем;
  • цифровой осциллограф; проектирование электронных устройств и печатных плат;
  • работа с электронными картами (GIS);
  • программы тренировки памяти, слуха, зрения.

Подробнее / Загрузить — дистрибутив
Более подробно о содержимом:
Total votes 60: ↑50 and ↓10 +40
Comments 46

Генератор фракталов и математика внутри нас

Reading time 8 min
Views 8.3K

Выше вы можете видеть три стихии: огонь, воду и Миллу Йовович, а ниже будут ещё и спекуляции о процессе её воссоздания в фильме «Пятый элемент».

Приглашаю отведать салат из разнородных, но неожиданно связанных друг с другом тем:

- Почему нам нравится симметрия и фракталы? И как это влияет на выживаемость?

- Как математика связана с эмбриональным развитием?

- Сколько старинных программ ещё надо спасти от неумолимого времени?

- Конкурс красоты среди фракталов.

А не странно ли, что нам приятно видеть симметричные объекты? Но если симметрии чрезмерно много, то это почему-то начинает раздражать. Возможно, мы найдём в этом смысл, если приблизимся к пониманию вычленяемых мозгом принципов формирования всего вокруг. А для этого мы поиграем с очередным генератором фракталов, в котором удобно творить почти всё: от островов в океане и облаков на небе до кровеносной системы, от галактик до обоев на рабочий стол мельчайших частиц.

Читать далее
Total votes 18: ↑18 and ↓0 +18
Comments 14

Где хранится эталон длины или как мериться длинами

Reading time 6 min
Views 56K

Идея разобраться в этом вопросе и в итоге написать данный текст родилась здесь же на сайте — под одной из публикаций увидел утверждение, что продаваемые в магазинах линейки калибруют по вторичным эталонам, те — по первичным, а первичные — по международным. Это лишь в малой части соответствует действительности, так что, если заинтересовались, давайте разбираться.

Disclaimer: я не метролог, так что текст является не очень нудной (я надеюсь) попыткой научно-популярного рассказа, так что в нём возможны некоторые неточности, о которых можно сообщать как в личку, так и в комментариях — как вам угодно.
Читать дальше →
Total votes 62: ↑60 and ↓2 +58
Comments 69

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity